NVIDIA właśnie wypuściła swoje najnowsze systemy GB300 NVL72. Mogą obsługiwać 50 razy więcej pracy na megawat energii elektrycznej w porównaniu do starszej platformy Hopper. Oznacza to, że koszty spadają 35-krotnie dla każdego przetwarzanego fragmentu informacji.
Signal65 przeprowadziło osobne testy GB200 NVL72 i stwierdziło, że przetwarza on ponad 10 razy więcej informacji na wat, obniżając koszty do jednej dziesiątej tego, co były wcześniej.
Ulepszenia nadal przybywają. Same aktualizacje biblioteki TensorRT-LLM NVIDIA dały GB200 pięciokrotny wzrost wydajności w zaledwie cztery miesiące dla zadań wymagających natychmiastowych odpowiedzi. Zespoły pracujące nad narzędziami Dynamo, Mooncake i SGLang podnoszą wydajność jeszcze wyżej.
Te narzędzia AI przestają działać, jeśli występuje opóźnienie lub nie mogą zapamiętać wystarczającej ilości kontekstu. Firmy potrzebują, aby faktycznie działały w rzeczywistych sytuacjach biznesowych, a nie tylko w pokazach.
Narzędzia sztucznej inteligencji, które piszą kod i działają jako cyfrowi pomocnicy, stanowią obecnie prawie połowę wszystkich wyszukiwań związanych z AI, w porównaniu z zaledwie 11% rok temu.
Liczby pochodzą z raportu State of Inference OpenRouter i pokazują, jak szybko rzeczy się zmieniają w tej przestrzeni.
Ten nagły skok sprawia, że firmy pędzą, by zbudować sprzęt, który może nadążyć. Ci asystenci AI muszą odpowiadać od razu i pamiętać kontekst z całych projektów oprogramowania, co stawia poważne wymagania mocy obliczeniowej.
Eksplozja rynku napędza walkę gigantów technologicznych o dominację
Zaangażowane pieniądze są ogromne. Rynek agentów AI był wart 4,92 miliarda dolarów w 2024 roku. Szacunki umieszczają go na poziomie 6,016 miliarda dolarów na 2025 rok, a następnie rozdyma się do 44,97 miliarda dolarów do 2035 roku. To 22,28% wzrostu każdego roku przez następną dekadę. Banki, szpitale, sklepy i fabryki są pierwszymi użytkownikami.
Firmy umieszczają tych agentów w systemach zarządzania klientami, narzędziach planowania i konfiguracjach bezpieczeństwa, aby zaoszczędzić pieniądze i zrobić więcej. To, co zaczęło się jako opcjonalna technologia, staje się podstawową infrastrukturą.
Jak donosi Cryptopolitan, Alibaba właśnie uruchomiła Qwen3.5 skierowaną na rynek chiński, twierdząc, że koszty przetwarzania są o 60% niższe niż wcześniej. Model może patrzeć na ekrany i wykonywać zadania na telefonach i komputerach. Konkuruje bezpośrednio z aplikacją Doubao ByteDance, a także nadchodzi aktualizacja DeepSeek.
OpenAI zatrudniło Petera Steinbergera 15. dnia. Zbudował OpenClaw, agenta AI o otwartym kodzie źródłowym. CEO Sam Altman powiedział, że Steinberger poprowadzi prace nad agentami osobistymi następnej generacji i nazwał go geniuszem ze świetnymi pomysłami na inteligentnych asystentów, którzy mogą wykonywać przydatne rzeczy.
Kryzys talentów, którego nikt nie może rozwiązać
94% liderów biznesowych twierdzi, że brakuje im umiejętności AI. Do 2028 roku 44% spodziewa się nadal mieć niedobory od 20 do 40%. Workera mówi, że te luki mogą kosztować globalną gospodarkę 5,5 biliona dolarów w 2026 roku z powodu opóźnionych produktów, problemów z jakością i utraconych sprzedaży.
W tej chwili popyt na talenty AI przewyższa podaż 3,2 do jednego na całym świecie. Praca w AI płaci 67% więcej niż zwykłe stanowiska programistyczne. Jednak 85% pracowników biurowych uczy się tego we własnym czasie, a 83% mówi, że głównie uczą się sami zamiast otrzymywać formalne szkolenie.
Kiedy firmy kupują narzędzia AI od specjalistycznych dostawców, odnoszą sukces w 67% przypadków. Wewnętrzne projekty działają tylko około jedną trzecią tak często.
Salesforce odnotowało 119% wzrost agentów na początku 2025 roku i przekroczyło 500 milionów dolarów w powtarzalnych przychodach z tych produktów. Dodali 6 000 klientów korporacyjnych w ciągu trzech miesięcy.
Firmy prawdopodobnie będą kupować rozwiązania zamiast je budować. To wskazuje na koncentrację rynku wokół kilku dużych graczy, którzy mogą dostarczyć to, co faktycznie działa.
Źródło: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


