Companiile care au petrecut ultimul an împingând angajații să folosească instrumentele AI cât mai agresiv posibil se confruntă acum cu dificultăți în gestionarea costurilor.
Directorii financiari (CFO) cer acum dovezi ale unor randamente măsurabile pentru facturile API în continuă creștere, amenințând proiecțiile de creștere ale OpenAI, Anthropic și ale altor furnizori de modele lingvistice de mari dimensiuni.

Companiile își reduc acum cheltuielile pentru AI, deoarece CFO-urile cer justificări pentru facturile API tot mai umflate. Această inversare marchează sfârșitul a ceea ce industria a numit „tokenmaxxing", iar corecția vine rapid.
Amazon a desființat recent un clasament intern care urmărea utilizarea AI de către angajați, după ce conducerea a concluzionat că sistemul genera mai multă muncă inutilă alimentată de AI decât rezultate utile. „Vă rog să nu folosiți AI doar de dragul de a folosi AI", a transmis un vicepreședinte senior Amazon angajaților.
Uber și-a epuizat întregul buget de codare AI pentru 2026 în doar patru luni, iar Meta a trimis un memo intern către aproximativ 6.000 de angajați, semnalând ceea ce a numit o „creștere exponențială" a utilizării AI și avertizând că compania se confruntă cu miliarde în costuri interne AI. Uber a impus de atunci un plafon lunar de cheltuieli de 1.500 USD per angajat pentru instrumentele de codare AI.
Gigantul de consultanță Accenture avertizase anterior angajații că ar putea „risca să piardă promovările" dacă nu adoptau instrumentele AI. Acum, Accenture încearcă să oprească personalul de la utilizarea AI pentru sarcini banale.
O înregistrare audio scursă dintr-o ședință internă a surprins un executiv Accenture spunând că cheltuielile pentru AI „devin foarte imprevizibile." Același executiv a spus că liderii „la nivel de CFO, COO și CIO încă se întreabă dacă obțin valoare din ceea ce cheltuim."
Adam McDaniel și Markus Eisele de la International Business Machines (IBM) au susținut într-o analiză recentă că minimizarea tokenurilor este la fel de rea ca tokenmaxxing-ul, deoarece ambele fac din consumul de tokenuri obiectivul principal, în loc să se concentreze pe rezultatele de afaceri.
IBM pledează pentru ceea ce numește „valuemaxxing", care se concentrează pe măsurarea sarcinilor finalizate, a timpului economisit și a relucrărilor evitate, mai degrabă decât a tokenurilor consumate.
OpenAI și Anthropic și-au construit planurile de creștere pe ideea că întreprinderile vor continua să consume din ce în ce mai multe tokenuri.
OpenAI a depășit 25 de miliarde de dolari în venituri anuale la începutul acestui an, estimându-și propria valoare la 1 trilion de dolari, în timp ce Anthropic este evaluată cu câteva miliarde de dolari mai puțin. Ambele companii consumă lichidități pentru calcul, cercetare și angajări, sperând că adoptarea de către întreprinderi le va face profitabile.
Dar întreprinderile rezervă deja modelele flagship scumpe pentru lucrări complexe și folosesc alternative mai mici și mai ieftine pentru sarcinile de rutină. Unele mută sarcinile de lucru pe modele open-source care rulează pe propria infrastructură, fără taxe per token.
International Data Corporation (IDC) prezice că până în 2028, 70% dintre întreprinderile de top conduse de AI vor utiliza mai multe modele, în loc să se bazeze pe un singur furnizor. Acest lucru ar transforma AI într-o marfă în care furnizorii concurează pe preț, nu doar pe capacități.
Cu toate acestea, problema banilor nu va dispărea prea curând. Chiar și CEO-ul OpenAI, Sam Altman, a recunoscut că costul AI a devenit o „problemă uriașă" pentru clienți în acest an.
Dacă citești acest articol, ești deja în avantaj. Rămâi acolo cu newsletter-ul nostru.


