Tether AI vừa công bố QVAC MedPsy, mô hình ngôn ngữ y tế có thể chạy cục bộ trên điện thoại và thiết bị đeo, không cần dựa vào đám mây.
Đội ngũ nghiên cứu của Tether AI cho biết mô hình này được thiết kế cho các môi trường cần bảo mật và độ trễ thấp, như hệ thống nội bộ của bệnh viện và thiết bị di động. Hãng cũng cung cấp bản GGUF lượng tử hóa để triển khai cục bộ.
Theo công bố, bản 1,7B tham số của QVAC MedPsy đạt điểm trung bình 62,62 trong bảy bài kiểm tra y khoa kín, cao hơn Google MedGemma-1.5-4B-it 11,42 điểm và vượt MedGemma 27B trong một số tình huống lâm sàng như HealthBench Hard.
Bản 4B đạt 70,54 điểm trong cùng bộ тест, đồng thời được cho là tạo ra số token trung bình ít hơn một phần ba đến một nửa so với các hệ thống tương đương. Tether AI nói các cấu hình Q4_K_M được khuyến nghị lần lượt ở mức khoảng 1,2 GB cho bản 1,7B và 2,6 GB cho bản 4B.


