研究huggingface2026-04-29
AIテストが計算資源の壁に
AI evals are becoming the new compute bottleneck

AIモデルの性能や安全性を確認するテストに、膨大なコンピューターの力が必要になり、新しいAIの開発を遅らせる可能性が出ています。
- ・AIが正しく動くか試す「評価」に、とても大きなコンピューターの力が必要になってきた。
- ・AIの能力が上がり、安全か正確か確認するテストが増え、計算量が増大したため。
- ・これが新しいAIを作る速さを遅くする可能性があり、大きな課題となっている。