研究huggingface2026-05-27
AI、企業IT業務で5割以下に
ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM

最先端のAIが企業IT業務の自動化テストで50%以下の成績を記録。AIが複雑なIT課題を自律的に解決するには、まだ大きな進化が必要だと示されました。
- ・新AIテストで、最先端AIが企業IT業務を自動で行う能力が50%以下と判明しました。
- ・Artificial AnalysisとIBMが共同開発したITBench-AAという初の専門テストで、AIの課題解決能力を評価しました。
- ・AIが企業でIT業務を完全に自動化するには、まだ多くの改善が必要であることが明らかになりました。