プロダクトtldr-ai2026-06-01
AIが自分で開発を大規模に検証
Verifying Agentic Development at Scale
AI開発者Devinが、開発したものを自分で大規模に検証する仕組みを導入。AIが自動で品質を保証し、開発効率が大幅に向上します。
CognitionのIdo Pesok氏は、Devinに自律的なエンドツーエンドテストを組み込むことから得られた教訓を共有しました。Devinのセッションが、初めて対話式よりも非同期でトリガーされることが多くなったと指摘しており、これによりマージ前の検証済み結果は、あると便利なものではなく、必須の要件となっています。Devinのハーネスは、約6ヶ月前にコンピューター使用ツールを獲得しました。そして、エンジニアが10〜20台のDevinをそれぞれ独自のdev server(開発サーバー)で並行して実行し始めたときにブレークスルーが訪れました。これは、1台のノートパソコンでは不可能なことです。