Hexo Labsが自己改善型AIをオープンソース化
Hexo Labs Open-Sources SIA: A Self-Improving Agent That Updates Both the Harness and the Model Weights

Hexo Labsが自己改善型AIをオープンソース化し、モデルと仕組みを同時に改善できるようになったことで、AIの性能向上が期待されます。
ほとんどのAIエージェントは、人間による調整が止まると改善が止まります。モデルは固定され、周囲の仕組みも固定されます。Hexo Labsは、両方を同時に動かすことを目指しています。今週、自己改善型AI(SIA)をMITライセンスのもとオープンソースフレームワークとして公開しました。この研究の核心的な主張は狭いですが具体的です。SIAは、エージェントの周囲の仕組みとモデルの重みを自己改善ループ内で編集します。
SIA(自己改善型AI)は、タスク特化型エージェントを二つの部分に分けています。第一は、ハーネス(周囲の仕組み)で、システムプロンプト、ツールの配信ロジック、再試行ポリシー、回答抽出コードを含みます。第二の部分は、モデルの重みそのものです。このループは三つのAIコンポーネントによって駆動されます。メタエージェントは、タスク仕様と参照コードに基づいて初期のハーネスを作成します。タスク特化型エージェントはタスクを実行し、すべてのステップを記録します。フィードバックエージェントは、その全経路を読み取り、何を変更するかを決定します。その決定が重要なアイデアです。各実行後、フィードバックエージェントは二つのアクションのうちの一つを選びます。ハーネスを再構築するか、重みを更新するかです。基本モデルはopenai/gpt-oss-120bで、重みの更新にはLoRA(低ランクアダプタ)を使用し、ランクは32です。メタエージェントとフィードバックエージェントはClaude Sonnet 4.6上で動作します。トレーニングは、チームのRLプラットフォームであるModalを通じてH100 GPUで行われます。研究チームは、二つの動作ポイントをSIA-HとSIA-W+Hとラベル付けしています。SIA-Hはハーネスの更新のみを使用し、SIA-W+Hは重みの更新を追加します。
ベンチマークケースとして、研究チームはSIAを三つの異なるドメインでテストしました。パターンはすべてのドメインで一致しました。重みの更新は、ハーネスの編集だけでは達成できなかった成果を追加しました。「初期」は、メタエージェントの最初のハーネスによる基本モデルで、フィードバックがない状態です。