Các công ty đã dành cả năm qua thúc đẩy nhân viên sử dụng các công cụ AI một cách mạnh mẽ nhất có thể giờ đây đang vật lộn để kiểm soát chi phí.
Các CFO hiện đang yêu cầu thấy được lợi nhuận đo lường được từ những hóa đơn API ngày càng tăng, đe dọa các dự báo tăng trưởng tại OpenAI, Anthropic và các nhà cung cấp mô hình ngôn ngữ lớn khác.

Các công ty hiện đang thu hẹp chi tiêu AI khi các CFO yêu cầu lý giải cho những hóa đơn API phình to. Sự đảo chiều này đánh dấu sự kết thúc của cái mà ngành gọi là "tokenmaxxing," và sự điều chỉnh đang diễn ra rất nhanh.
Amazon gần đây đã dỡ bỏ bảng xếp hạng nội bộ theo dõi mức độ sử dụng AI của nhân viên sau khi ban lãnh đạo kết luận rằng hệ thống này tạo ra nhiều công việc vô bổ được hỗ trợ bởi AI hơn là đầu ra hữu ích. "Xin đừng sử dụng AI chỉ vì muốn dùng AI," một Phó Chủ tịch cấp cao của Amazon nói với nhân viên.
Uber đã tiêu hết toàn bộ ngân sách lập trình AI cho năm 2026 chỉ trong bốn tháng, và Meta đã gửi một bản ghi nhớ nội bộ cho khoảng 6,000 nhân viên để cảnh báo về điều mà công ty gọi là "sự gia tăng theo cấp số nhân" trong việc sử dụng AI, cảnh báo rằng công ty đang đối mặt với hàng tỷ đô la chi phí AI nội bộ. Uber kể từ đó đã áp đặt mức giới hạn chi tiêu hàng tháng là $1,500 mỗi nhân viên cho các công cụ lập trình AI.
Gã khổng lồ tư vấn Accenture trước đây đã cảnh báo nhân viên rằng họ có thể "có nguy cơ mất cơ hội thăng tiến" nếu không áp dụng các công cụ AI. Nay, Accenture đang cố gắng ngăn nhân viên sử dụng AI cho các công việc không quan trọng.
Audio bị rò rỉ từ một cuộc họp nội bộ ghi lại lời một giám đốc điều hành Accenture nói rằng chi tiêu AI đang "trở nên rất khó đoán." Vị giám đốc điều hành đó cũng nói rằng ban lãnh đạo ở "cấp độ CFO, COO và CIO vẫn đang đặt câu hỏi liệu họ có đang nhận được giá trị từ những gì chúng ta đang chi tiêu hay không."
Adam McDaniel và Markus Eisele của International Business Machine (IBM) đã lập luận trong một phân tích gần đây rằng việc tối thiểu hóa token cũng tệ như tokenmaxxing vì cả hai đều biến mức tiêu thụ token thành mục tiêu chính thay vì tập trung vào kết quả kinh doanh.
IBM ủng hộ điều mà họ gọi là "valuemaxxing," tập trung vào việc đo lường các nhiệm vụ đã hoàn thành, thời gian tiết kiệm được và công việc làm lại được tránh khỏi thay vì số token tiêu thụ.
OpenAI và Anthropic đã xây dựng kế hoạch tăng trưởng của họ dựa trên ý tưởng rằng các doanh nghiệp sẽ tiếp tục tiêu thụ ngày càng nhiều token hơn.
OpenAI đã vượt mức $25 tỷ doanh thu hàng năm hóa vào đầu năm nay, trong khi định giá bản thân ở mức $1 nghìn tỷ, còn Anthropic được định giá thấp hơn vài tỷ đô la. Cả hai công ty đều đang đốt tiền vào điện toán, nghiên cứu và tuyển dụng trong khi hy vọng việc doanh nghiệp áp dụng sẽ giúp họ có lãi.
Nhưng các doanh nghiệp đã bắt đầu dành riêng các mô hình flagship đắt tiền cho công việc phức tạp và sử dụng những lựa chọn thay thế rẻ hơn cho các nhiệm vụ thông thường. Một số đang chuyển khối lượng công việc sang các mô hình mã nguồn mở chạy trên cơ sở hạ tầng của riêng họ mà không tính phí theo token.
International Data Corporation (IDC) dự đoán rằng vào năm 2028, 70% các doanh nghiệp hỗ trợ bởi AI hàng đầu sẽ sử dụng nhiều mô hình thay vì phụ thuộc vào một nhà cung cấp duy nhất. Điều đó sẽ biến AI thành một hàng hóa phổ thông nơi các nhà cung cấp cạnh tranh về giá cả thay vì chỉ về năng lực.
Tuy nhiên, vấn đề tiền bạc sẽ không sớm biến mất. Ngay cả CEO của OpenAI, Sam Altman, cũng đã thừa nhận rằng chi phí AI đã trở thành một "vấn đề lớn" đối với khách hàng trong năm nay.
Nếu bạn đang đọc điều này, bạn đã đi trước một bước. Hãy duy trì điều đó với bản tin của chúng tôi.

