Pół miliarda dolarów w miesiąc. Tak kończy się zabawa sztuczną inteligencją bez limitów

Jeden miesiąc, nielimitowany dostęp dla pracowników i rachunek, który dosłownie zwala z nóg.

Pewna korporacja właśnie boleśnie przekonała się, że sztuczna inteligencja to nie darmowa zabawka, przepalając 500 milionów dolarów na platformie Claude. To brutalne przebudzenie dla całego rynku technologicznego, który zaczyna wreszcie pytać o realny zwrot z tych gigantycznych inwestycji.

Kiedy brak limitów spotyka się z modelem tokenowym

Jak donosi serwis Axios, absolutny brak nadzoru doprowadził pewną firmę (źródło nie ujawnia jej nazwy) do finansowej katastrofy. Mechanizm był prosty – kierownictwo wykupiło pracownikom nielimitowane licencje na dostęp do platformy Claude od Anthropic. Ponieważ większość komercyjnych narzędzi AI rozlicza się na podstawie tokenów (płacisz za każde przetworzone i wygenerowane słowo), koszty rosły w tempie, którego chyba nikt nie kontrolował.

Prawdziwym pożeraczem budżetu okazali się jednak agenci AI. O ile poproszenie chatbota o napisanie prostego maila kosztuje grosze, o tyle zlecenie mu głębokiego researchu, w którym algorytm samodzielnie przeszukuje dziesiątki baz danych i zapętla swoje zapytania, generuje kosmiczny ruch. Nikt nie patrzył na licznik, a z firmowej kasy wyparowało 500 milionów dolarów.

To nie jest odosobniony przypadek na rynku

Ten absurdalny rachunek to tylko wierzchołek góry lodowej, a wielcy gracze powoli budzą się z zachwytu nad generatywną sztuczną inteligencją. Microsoft już zaczął masowo cofać swoim inżynierom licencje na Claude Code, zmuszając zespoły pracujące nad Windowsem czy pakietem Microsoft 365 do korzystania z tańszego, własnego GitHuba Copilot.

Jeszcze ciekawiej zrobiło się w Amazonie. Firma musiała w trybie nagłym zamknąć wewnętrzny system grywalizacji o nazwie „KiroRank”, który nagradzał pracowników za korzystanie z AI. Szybko okazało się, że zespół zaczął masowo generować bezsensowne zapytania tylko po to, by podbić swoje statystyki w firmowej tabeli. Koszty infrastruktury rosły, a realnej wartości z tych działań nie było żadnej.

Koniec ery radosnego przepalania budżetów

Z podobnym problemem boryka się Uber. Główny dyrektor ds. technologii przyznał niedawno, że firma przepaliła cały swój zaplanowany budżet na narzędzia AI na 2026 rok w zaledwie cztery miesiące. Branża zaczyna głośno mówić o tym, że wciąż brakuje wyraźnego przełożenia między ogromnym zużyciem tokenów a faktycznym dostarczaniem gotowych, zyskownych produktów dla klientów.

Sytuacja do złudzenia przypomina wczesne lata boomu na chmurę obliczeniową, kiedy inżynierowie odpalali serwery do testów i zapominali o nich, dopóki do firmy nie przychodził rachunek. Czas eksperymentów dobiega końca. Wygrają te korporacje, które potrafią nałożyć na AI sztywne ramy, monitorować koszty i przede wszystkim udowodnić, że algorytmy faktycznie zarabiają na swoje utrzymanie.

15 tysięcy dolarów w minutę. Takie rachunki płacą globalne firmy za awarie systemów IT

#AIWBiznesie #Anthropic #Claude #kosztyAI #optymalizacjaKosztów #technologieDlaFirm #tokenyAI #wdrożeniaAI

Chiński DeepSeek tnie ceny AI o 75 proc. Czy to początek globalnej wojny cenowej?

Kiedy Stany Zjednoczone odcinały Chiny od najnowocześniejszych układów Nvidii, wielu analityków sądziło, że drastycznie spowolni to rozwój tamtejszej sztucznej inteligencji. Najnowszy ruch azjatyckiego startupu DeepSeek mocno jednak weryfikuje te założenia.

Firma właśnie na stałe obniżyła ceny dostępu do swojego flagowego modelu AI aż o 75 proc. Za tą z pozoru czysto biznesową decyzją najprawdopodobniej kryje się mocne wsparcie sprzętowe od Huawei, a to może oznaczać wstrząs na globalnym rynku technologicznym.

Cięcie kosztów, które zmienia zasady gry

Branża sztucznej inteligencji mierzy się obecnie z dwoma gigantycznymi problemami: bardzo wysokimi kosztami utrzymania serwerów oraz ograniczonym dostępem do zaawansowanych chipów. Dlatego kiedy jeden z liczących się graczy z dnia na dzień permanentnie obcina cennik o trzy czwarte, wysyła jasny sygnał, że za kulisami zaszła fundamentalna zmiana.

DeepSeek poinformował, że koszty korzystania z ich topowego modelu V4-Pro spadają z poziomu 0,1–24 juanów do zaledwie 0,025–6 juanów za milion tokenów (w zależności od rodzaju obciążenia). Dla programistów i firm budujących aplikacje czy usługi oparte na AI, taki spadek kosztów operacyjnych to mocny argument za wyborem ich technologii. Dotychczas wersja Pro była wyceniana wielokrotnie drożej właśnie ze względu na braki odpowiedniej mocy obliczeniowej. Co się zatem zmieniło?

Cień Huawei. Jak obejść amerykańskie sankcje?

Choć przedstawiciele DeepSeek nie zdradzili wprost, co umożliwiło tak znaczną obniżkę, uwaga branży natychmiast skierowała się w stronę chińskiego giganta technologicznego – Huawei. Od momentu, gdy amerykańskie restrykcje eksportowe zablokowały firmom w Chinach dostęp do najpotężniejszych układów Nvidii, tamtejszy rynek musiał szybko szukać alternatyw.

Wszystko wskazuje na to, że nowe układy Huawei z serii Ascend 950 zaczynają realnie łagodzić sprzętowe braki. Jeśli lokalne procesory są w stanie udźwignąć obsługę zaawansowanych modeli językowych w stopniu pozwalającym na obcięcie cen o 75 proc., oznacza to, że chiński ekosystem sprzętowy dojrzewa znacznie szybciej, niż zakładał to Zachód. Oczywiście Huawei wciąż mierzy się z wąskimi gardłami w samej produkcji układów scalonych, ale kierunek zmian jest dla rynku jednoznaczny. Zresztą, dowodzi tego niedawne ogłoszenie przez Chiny uruchomienia własnego eskaskalowego superkomputera napędzanego przez układy Huawei.

Chiny omijają amerykańskie bany. Superkomputer LineShine to procesorowy potwór z 2,4 mln rdzeni od Huawei

Zachód pod ścianą. Czeka nas wysyp tańszych usług AI?

Wniosek z tego ruchu jest prosty: modele sztucznej inteligencji szybko tanieją. Jeśli chińskim firmom uda się utrzymać wydajność przy tak dużym cięciu kosztów generowania odpowiedzi, globalna wojna cenowa w branży AI wejdzie w zupełnie nową, znacznie bardziej agresywną fazę.

To wywiera naturalną presję na zachodnich dostawców, którzy wciąż inkasują ogromne kwoty za dostęp do swoich modeli premium (jak GPT-5 czy rodzina modeli Claude). Dla zwykłych użytkowników i czytelników to doskonała wiadomość – tańsze modele na poziomie programistów oznaczają w niedalekiej przyszłości wysyp tańszych, a być może nawet w pełni darmowych aplikacji i funkcji opartych na sztucznej inteligencji, z których korzystamy na co dzień w naszych smartfonach i komputerach. Z drugiej jednak strony rośnie też obawa, że zmniejszenie ceny dostawcy AI wcale nie musi oznaczać tańszych usług docelowych, wszak wystarczy, że ktoś w łańcuchu wartości okaże się bardziej chciwy.

#DeepSeek #DeepSeekV4Pro #HuaweiAscend950 #kosztyAI #modeleAI #rynekSztucznejInteligencji #sankcjeUSAChiny #wojnaTechnologiczna

Google tnie ceny. Nowy model Veo 3.1 Lite to pragmatyczny cios w rynek wideo AI

Podczas gdy OpenAI wycofuje się z dotychczasowej formy swojego produktu i zamyka aplikację Sora, Google udowadnia, że wideo generowane przez sztuczną inteligencję wciąż ma sens – pod warunkiem, że potrafi na siebie zarobić.

Gigant z Mountain View właśnie zaprezentował nowy, zoptymalizowany kosztowo model Veo 3.1 Lite i ogłosił ostre cięcia cennika dla wariantu Fast. Wyścig o generatywne wideo wchodzi w fazę chłodnej, rynkowej kalkulacji.

Wideo za grosze, ale nie dla zwykłego użytkownika

To nie jest narzędzie dla przeciętnego konsumenta, który chce wygenerować darmowy film za pomocą aplikacji na smartfonie. Google jasno pozycjonuje Veo 3.1 Lite jako rozwiązanie dla profesjonalnych deweloperów korzystających z płatnej platformy Google AI Studio.

Nowy model to odpowiedź na zaporowe koszty generowania multimediów. Veo 3.1 Lite pozwala na tworzenie krótkich form (do wyboru klipy o długości 4, 6 lub 8 sekund) w bardzo przystępnych cenach. Wygenerowanie jednej sekundy wideo (wraz z warstwą audio) w rozdzielczości 720p kosztuje zaledwie 5 centów, a w 1080p – 8 centów. W praktyce oznacza to, że wyprodukowanie gotowego, niemal 10-sekundowego klipu (np. w pionowym formacie 9:16 na TikToka czy Reels) będzie kosztować dewelopera mniej niż dolara (ok. 80 centów za 1080p). Jedynym kompromisem jest brak wsparcia dla rozdzielczości 4K.

Cięcia cen dla modelu Veo 3.1 Fast

Na debiucie wersji Lite się nie kończy. Google uderza w rynek obniżkami cen swojego szybszego, bardziej zaawansowanego modelu Veo 3.1 Fast.

Od 7 kwietnia zaczną obowiązywać nowe stawki:

  • Wideo 720p: 10 centów / sek. (obniżka o 5 centów)
  • Wideo 1080p: 15 centów / sek. (obniżka o 3 centy)
  • Wideo 4K: 35 centów / sek. (obniżka o 5 centów)

Wszystkie nowe stawki dla modelu Fast są już powoli wdrażane dla płacących użytkowników Google AI Studio.

Koniec hype’u, czas na biznes

Taka polityka Google to świetny kontrast dla tego, co dzieje się obecnie u konkurencji. Decyzja OpenAI o zamknięciu aplikacji Sora pokazuje, że utrzymanie drogich w eksploatacji generatorów wideo w formie ogólnodostępnego, konsumenckiego narzędzia jest na ten moment niezwykle trudne do spięcia biznesowo.

Co to oznacza dla rynku w praktyce? Google przyjmuje znacznie bezpieczniejszą strategię. Zamiast rzucać zabawki w ręce milionów użytkowników, optymalizuje architekturę swoich modeli i celuje w programistów, którzy obudują je własnymi aplikacjami. Sztuczna inteligencja wideo przestała być magiczną sztuczką – stała się płatną, mierzalną i wycenioną co do centa usługą API.

Zaskakująca decyzja. OpenAI zamyka aplikację Sora, generator wideo znika w obecnej formie

#Google #GoogleAIStudio #kosztyAI #OpenAISora #sztucznaInteligencja #Veo31Fast #Veo31Lite #wideoAI
AI bez lukru #37: Zatrudniliśmy AI i jest drożej

Cześć! Z tej strony Tomek Turba. AI bez lukru to cykl moich felietonów o sztucznej inteligencji bez marketingowego lukru, bez korporacyjnych slajdów i bez bajek o “rewolucji, która wszystko zmieni”. Pokazuję AI taką, jaka jest naprawdę: z absurdami, wpadkami, halucynacjami i konsekwencjami, o których rzadko mówi się głośno. Bez zadęcia,...

Sekurak

AI bez lukru #37: Zatrudniliśmy AI i jest drożej

Cześć! Z tej strony Tomek Turba. AI bez lukru to cykl moich felietonów o sztucznej inteligencji bez marketingowego lukru, bez korporacyjnych slajdów i bez bajek o “rewolucji, która wszystko zmieni”. Pokazuję AI taką, jaka jest naprawdę: z absurdami, wpadkami, halucynacjami i konsekwencjami, o których rzadko mówi się głośno. Bez zadęcia,...

#Aktualności #Teksty #Ai #BezLukru #Felieton #KosztyAI #ModelLokalny #Wdrożenie

https://sekurak.pl/ai-bez-lukru-37-zatrudnilismy-ai-i-jest-drozej/

AI bez lukru #37: Zatrudniliśmy AI i jest drożej

Cześć! Z tej strony Tomek Turba. AI bez lukru to cykl moich felietonów o sztucznej inteligencji bez marketingowego lukru, bez korporacyjnych slajdów i bez bajek o “rewolucji, która wszystko zmieni”. Pokazuję AI taką, jaka jest naprawdę: z absurdami, wpadkami, halucynacjami i konsekwencjami, o których rzadko mówi się głośno. Bez zadęcia,...

Sekurak

Ukryty kryzys AI, o którym nikt nie mówi. „Firmy toną w kosztach, a ich AI po cichu się psuje”

Wszyscy ekscytują się nowymi chatbotami i integracjami ze sztuczną inteligencją, a firmy chwalą się wzrostem produktywności.

Jednak za kulisami rewolucji AI rozgrywa się cichy dramat, który spędza sen z powiek dyrektorom technologii. Problem jest tak duży, że analitycy nazywają go „ślepym punktem AI”, a jego skala zaczyna przerażać.

Tajemnica gigantycznych przychodów Nvidii. 40% pochodzi od zaledwie dwóch klientów-widmo

Joel Wembo, konsultant wdrażający systemy AI, w swojej publikacji na portalu Medium ujawnia, co tak naprawdę dzieje się w firmach, które postawiły na sztuczną inteligencję. Okazuje się, że największym wyzwaniem nie jest już samo stworzenie modelu AI, ale jego monitorowanie – czyli sprawdzanie, czy system działa poprawnie, nie myli się i, co najważniejsze, nie generuje absurdalnych kosztów.

Kosztowna strona inteligencji

Skala problemu jest szokująca. Jak podaje Wembo, średniej wielkości firma z chatbotem AI może generować 50 terabajtów danych monitoringowych miesięcznie. To tak, jakby codziennie nagrywać każdą rozmowę w stutysięcznym mieście. Dlaczego tak dużo? Bo systemy AI to bestie o niespotykanej złożoności. Trzeba śledzić każde zapytanie do bazy danych, każdą prognozę modelu i każdą interakcję użytkownika.

Efekt? Koszty eksplodują. Wembo przytacza przykład firmy z branży fintech, której miesięczny rachunek za samo monitorowanie systemów wzrósł z 5 tysięcy do 80 tysięcy dolarów w zaledwie pół roku po dodaniu funkcji AI. Firmy zaczynają wydawać więcej na obserwowanie swojej sztucznej inteligencji, niż wydały na jej zbudowanie.

Ciche umieranie sztucznej inteligencji

Pieniądze to jednak tylko część problemu. Znacznie gorsze jest to, że – jak twierdzi autor – większość aplikacji AI psuje się po cichu, a firmy nawet o tym nie wiedzą. Tradycyjne systemy monitoringu potrafią sprawdzić, czy serwer działa i jak szybko ładuje się strona. Ale w przypadku AI to jak „mierzenie prędkości statku kosmicznego za pomocą rowerowego prędkościomierza”.

Stary system widzi, że serwer odpowiedział w 200 milisekund i oznacza go jako „zdrowy”. Tymczasem model AI od dłuższego czasu podaje klientom całkowicie błędne odpowiedzi, złe rekomendacje produktów lub nieprawdziwe informacje. Firmy chwalą się wydajnością, nie zdając sobie sprawy, że ich flagowy produkt AI przez połowę czasu jest po prostu zepsuty. To dlatego, zdaniem Wembo, użytkownicy wciąż wolą płatne i dopracowane wersje, jak ChatGPT Pro czy Claude Pro – bo niezawodność zawsze wygrywa z funkcjami.

Dolina Krzemowa już to wie

Problem ten nie jest nowy dla gigantów. Firmy takie jak Netflix (monitorowanie rekomendacji), Uber (śledzenie tras w czasie rzeczywistym) czy Airbnb (obserwowanie dynamicznych cen) zrozumiały to już dawno temu. Zbudowały swoją przewagę konkurencyjną nie tylko na lepszych modelach AI, ale na doskonałym monitoringu, który pozwala im wyłapywać problemy, zanim zauważą je klienci.

Dla reszty świata to dopiero początek bolesnej nauki. Rynek narzędzi do monitorowania AI ma wzrosnąć z 1,4 mld do ponad 10 mld dolarów do 2033 roku. Specjaliści w tej dziedzinie już teraz zarabiają o 40% więcej niż zwykli inżynierowie. Jak podsumowuje Wembo, firmy, które zrozumieją, że przyszłość AI to nie tylko tworzenie, ale przede wszystkim niezawodne i efektywne kosztowo działanie polegające na nieustannym śledzeniu poprawności działania AI, „zjedzą lunch całej reszcie”.

Ted Cruz chce dać firmom AI wolną rękę. Krytycy ostrzegają przed „eksperymentami na społeczeństwie”

#AI #BigTech #biznes #ChatGPT #innowacje #kosztyAI #kryzysAI #monitoringAI #news #problemZAI #sztucznaInteligencja #technologia