NVIDIA เพิ่งเปิดตัวระบบ GB300 NVL72 รุ่นล่าสุด สามารถจัดการงานได้มากกว่า 50 เท่าต่อเมกะวัตต์ของไฟฟ้าเมื่อเทียบกับแพลตฟอร์ม Hopper รุ่นเก่า นั่นหมายความว่าต้นทุนลดลง 35 เท่าสำหรับแต่ละข้อมูลที่ประมวลผล
Signal65 ได้ทดสอบ GB200 NVL72 แยกต่างหากและพบว่าสามารถประมวลผลข้อมูลได้มากกว่า 10 เท่าต่อวัตต์ ลดต้นทุนลงเหลือหนึ่งในสิบของเดิม
การปรับปรุงยังคงมาอย่างต่อเนื่อง การอัปเกรดไลบรารี TensorRT-LLM ของ NVIDIA เพียงอย่างเดียวทำให้ GB200 มีประสิทธิภาพเพิ่มขึ้น 5 เท่าในเวลาเพียง 4 เดือนสำหรับงานที่ต้องการการตอบสนองทันที ทีมที่ทำงานกับเครื่องมือ Dynamo, Mooncake และ SGLang กำลังผลักดันประสิทธิภาพให้สูงขึ้นอีก
เครื่องมือ AI เหล่านี้จะใช้งานไม่ได้หากมีความล่าช้าหรือจำบริบทได้ไม่เพียงพอ บริษัทต่างๆ ต้องการให้มันทำงานได้จริงในสถานการณ์ธุรกิจจริง ไม่ใช่แค่การสาธิต
เครื่องมือปัญญาประดิษฐ์ที่เขียนโค้ดและทำงานเป็นผู้ช่วยดิจิทัลตอนนี้คิดเป็นเกือบครึ่งหนึ่งของการค้นหาที่เกี่ยวข้องกับ AI ทั้งหมด เพิ่มขึ้นจากเพียง 11% เมื่อปีที่แล้ว
ตัวเลขมาจากรายงาน State of Inference ของ OpenRouter และแสดงให้เห็นว่าสิ่งต่างๆ กำลังเปลี่ยนแปลงเร็วแค่ไหนในพื้นที่นี้
การเพิ่มขึ้นอย่างกะทันหันนี้ทำให้บริษัทต่างๆ เร่งสร้างฮาร์ดแวร์ที่สามารถตามทันได้ ผู้ช่วย AI เหล่านี้ต้องตอบสนองทันทีและจำบริบทจากโปรเจกต์ซอฟต์แวร์ทั้งหมด ซึ่งสร้างความต้องการที่จริงจังต่อพลังการประมวลผล
การระเบิดของตลาดจุดประกายการต่อสู้ของยักษ์ใหญ่ด้านเทคโนโลยีเพื่อความเป็นใหญ่
เงินที่เกี่ยวข้องนั้นมหาศาล ตลาดเอเจนต์ AI มีมูลค่า 4.92 พันล้านดอลลาร์ในปี 2024 การประมาณการคาดว่าจะอยู่ที่ 6.016 พันล้านดอลลาร์สำหรับปี 2025 จากนั้นจะพุ่งขึ้นเป็น 44.97 พันล้านดอลลาร์ภายในปี 2035 นั่นคือการเติบโต 22.28% ทุกปีในทศวรรษหน้า ธนาคาร โรงพยาบาล ร้านค้า และโรงงานเป็นผู้นำในการนำมาใช้
ธุรกิจต่างๆ กำลังนำเอเจนต์เหล่านี้เข้าสู่ระบบการจัดการลูกค้า เครื่องมือวางแผน และการตั้งค่าความปลอดภัยเพื่อประหยัดเงินและทำงานได้มากขึ้น สิ่งที่เริ่มต้นเป็นเทคโนโลยีเสริมกำลังกลายเป็นโครงสร้างพื้นฐาน
ตามที่ Cryptopolitan รายงาน Alibaba เพิ่งเปิดตัว Qwen3.5 โดยมุ่งเป้าไปที่ตลาดจีน อ้างว่าต้นทุนการประมวลผลต่ำกว่าเดิม 60% โมเดลสามารถดูหน้าจอและทำงานข้ามโทรศัพท์และคอมพิวเตอร์ได้ กำลังแข่งขันกับแอป Doubao ของ ByteDance และยังมีการอัปเดต DeepSeek ที่กำลังจะมาด้วย
OpenAI จ้าง Peter Steinberger เมื่อวันที่ 15 เขาสร้าง OpenClaw ซึ่งเป็นเอเจนต์ AI โอเพนซอร์ส CEO Sam Altman กล่าวว่า Steinberger จะเป็นผู้นำในการทำงานเกี่ยวกับเอเจนต์ส่วนบุคคลรุ่นต่อไปและเรียกเขาว่าเป็นอัจฉริยะที่มีความคิดเยี่ยมยอดเกี่ยวกับผู้ช่วยอัจฉริยะที่สามารถทำสิ่งที่มีประโยชน์ได้
วิกฤตด้านบุคลากรที่ไม่มีใครสามารถแก้ไขได้
94% ของผู้นำธุรกิจกล่าวว่าพวกเขาขาดแคลนทักษะด้าน AI ภายในปี 2028 44% คาดว่าจะยังคงขาดแคลน 20 ถึง 40% Workera กล่าวว่าช่องว่างเหล่านี้อาจทำให้เศรษฐกิจโลกสูญเสีย 5.5 ล้านล้านดอลลาร์ในปี 2026 จากผลิตภัณฑ์ที่ล่าช้า ปัญหาคุณภาพ และการสูญเสียยอดขาย
ตอนนี้ความต้องการบุคลากรด้าน AI เอาชนะอุปทานในอัตราส่วน 3.2 ต่อ 1 ทั่วโลก งานด้าน AI จ่ายเงินมากกว่างานซอฟต์แวร์ทั่วไป 67% แต่ 85% ของพนักงานสำนักงานกำลังเรียนรู้เรื่องนี้ในเวลาของตนเอง และ 83% กล่าวว่าพวกเขาส่วนใหญ่สอนตัวเองแทนที่จะได้รับการฝึกอบรมอย่างเป็นทางการ
เมื่อบริษัทซื้อเครื่องมือ AI จากผู้ขายเฉพาะทาง พวกเขาประสบความสำเร็จ 67% ของเวลา การสร้างภายในทำงานได้เพียงประมาณหนึ่งในสาม
Salesforce เห็นการเติบโตของเอเจนต์ 119% ในต้นปี 2025 และข้ามรายได้ประจำ 500 ล้านดอลลาร์สำหรับผลิตภัณฑ์เหล่านี้ พวกเขาเพิ่มลูกค้าองค์กร 6,000 รายในสามเดือน
ธุรกิจจะซื้อโซลูชันแทนที่จะสร้างขึ้นเอง นั่นชี้ไปที่ตลาดที่มีความเข้มข้นรอบผู้เล่นใหญ่ไม่กี่รายที่สามารถส่งมอบสิ่งที่ใช้งานได้จริง
แหล่งที่มา: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


