AIがスマホで動く仕組み登場
Meet OpenJarvis: A Local-First Framework for On-Device Personal AI Agents with Tools, Memory, and Learning

スタンフォード大などが、AIを端末内で動かす仕組みOpenJarvisを発表。クラウドAIに匹敵する性能を低コスト・高速で実現し、AI利用の幅を広げます。
スタンフォード大学とLambda Labsの研究者たちは、OpenJarvisの論文を発表しました。これは、推論、エージェント、メモリ、学習を完全にデバイス上で実行するオープンソースのフレームワークです。<br>OpenJarvisを通じて構成されたオープンウェイトモデルは、研究のベンチマークプロトコルにおいて、最高のクラウドモデルと比較して平均で3.2パーセントポイント以内の性能を達成し、クエリあたりのAPI限界コストは約800分の1、レイテンシ(応答速度)は約4分の1に抑えられます。<br>この研究は、研究チームの以前の「Intelligence Per Watt」調査に基づいており、その調査では、ローカルモデルがすでにシングルターンのチャットおよび推論クエリの88.7%をインタラクティブなレイテンシで処理できること、そしてインテリジェンス効率が2023年から2025年にかけて5.3倍向上することが報告されていました。<br>モデルの概要とアクセス<br>OpenJarvisは単一のモデルではありません。これは、サポートされている任意のモデルと構成可能なエージェントスタックを組み合わせるフレームワークであり、4つのファミリーにわたる11のローカルモデルで評価されています。<br>プロパティ 値<br>ライセンス Apache 2.0<br>フレームワークリリース 2026年3月12日<br>論文 arXiv:2605.17172 (2026年5月16日公開)<br>リポジトリ github.com/open-jarvis/OpenJarvis<br>スター / フォーク数 約5.4k / 約1.2k (2026年6月時点)<br>言語 Python (~83%)、Rust (~9%)、TypeScript (~7%)<br>評価されたモデル 4つのファミリーにわたる11のローカルモデル: Qwen3.5, Gemma4, Nemotron, Granite<br>クラウドベースライン Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro<br>サポートされるエンジン Ollama, vLLM, SGLang, llama.cpp, Apple Foundation Models, Exo (その他)<br>コンテキストウィンドウ モデル依存<br>インストール 単一コマンド; ブロードバンド環境で約3分<br>ハードウェア Mac Mini M4からNVIDIA DGX Sparkまで、7つのプラットフォームでテスト済み<br>アーキテクチャ: 5つのプリミティブと1つのSpec<br>OpenJarvisは、パーソナルAIシステムを5つの型付きプリミティブに分解し、specと呼ばれる単一の宣言型設定オブジェクトを通じて構成します。<br>Intelligence — モデル、ウェイト、生成パラメータ、量子化形式。<br>Engine — 推論ランタイム (Ollama, vLLM, SGLangなど)、バッチ処理、KV-cache設定、ハードウェアパス。<br>Agents — 推論ループ (ReActまたはCodeAct)、システムプロンプト