Genesis AI、ロボットAI評価基盤発表
Genesis AI Releases Nyx, Quadrants, and Genesis World 1.0 Physics Platform for Scalable Robotics Foundation Model Evaluation

Genesis AIがロボットAIの評価を実機より200倍速く行うシミュレーション基盤を発表。ロボットAIの開発が大幅に加速されるため重要です。
Genesis AIはGenesis World 1.0をリリースしました。このプラットフォームは、Genesis World physics engine、Nyx(リアルタイムのpath-traced renderer)、Quadrants(Python-to-GPU compiler)、そしてシミュレーションインターフェースの4つのコンポーネントで構成されています。これは、シミュレーションベースの評価を通じて、robotics foundation modelの開発を加速するように設計されています。ロボットモデルの開発には、データとイテレーション速度という2つのボトルネックがあります。この分野はデータに重点を置いてきました。Genesis AIは、より遅く、あまり議論されていないボトルネックは、モデル開発サイクルそのもの、具体的にはチームが候補となるポリシーをどれだけ速く評価し、model checkpointsを比較できるかであると主張しています。これが解決する問題とは?Genesisにおける典型的なポリシー評価は、それぞれ数百のエピソードを持つ数百のタスクに及びます。これを実世界で実行するには、1人のオペレーターと1つのロボットステーションで200時間以上の連続的なロボット操作が必要となります。これは単一の評価パスのためです。checkpoints間での統計的に意味のある比較には、このようなパスが多数必要です。Genesis World 1.0は、人間やハードウェアを介さず、実行間でbit-exactな結果の一貫性を保ちながら、同じ評価を0.5時間未満で実行します。これは、実世界での評価よりもおよそ2桁高速です。研究チームは、トレーニングデータ生成にシミュレーションを使用する前に、意図的に評価を優先することを選択しました。彼らの推論は、トレーニングと評価が同じシミュレートされた分布を共有する場合、パフォーマンスの向上は、真に優れたモデルというよりも、シミュレーターのダイナミクスへのより厳密な適合を反映する可能性があるというものです。2つのパイプラインを分離することで、よりクリーンなシグナルが得られます。研究チームは、この評価アプローチをzero-shot real-to-simと表現しています。シミュレーションで評価されるポリシーは、実世界のデータのみでトレーニングされます。pretrainingにシミュレートされたデータは一切使用されません。Sim-to-Real Correlation Results Genesisの研究チームは、シミュレーションと実機でのrolloutsの間で0.8996(95%信頼区間: [0.7439, 0.9314])のPearson相関を報告しています。この評価は3つのmodel variantsを対象としました(