研究marktechpost2026-06-04

AIがスマホで動く仕組み登場

Meet OpenJarvis: A Local-First Framework for On-Device Personal AI Agents with Tools, Memory, and Learning

スタンフォード大などが、AIを端末内で動かす仕組みOpenJarvisを発表。クラウドAIに匹敵する性能を低コスト・高速で実現し、AI利用の幅を広げます。

スタンフォード大学とLambda Labsの研究者たちは、OpenJarvisの論文を発表しました。これは、推論、エージェント、メモリ、学習を完全にデバイス上で実行するオープンソースのフレームワークです。 OpenJarvisを通じて構成されたオープンウェイトモデルは、研究のベンチマークプロトコルにおいて、最高のクラウドモデルと比較して平均で3.2パーセントポイント以内の性能を達成し、クエリあたりのAPI限界コストは約800分の1、レイテンシ（応答速度）は約4分の1に抑えられます。 この研究は、研究チームの以前の「Intelligence Per Watt」調査に基づいており、その調査では、ローカルモデルがすでにシングルターンのチャットおよび推論クエリの88.7%をインタラクティブなレイテンシで処理できること、そしてインテリジェンス効率が2023年から2025年にかけて5.3倍向上することが報告されていました。 モデルの概要とアクセス OpenJarvisは単一のモデルではありません。これは、サポートされている任意のモデルと構成可能なエージェントスタックを組み合わせるフレームワークであり、4つのファミリーにわたる11のローカルモデルで評価されています。 プロパティ値 ライセンス Apache 2.0 フレームワークリリース 2026年3月12日 論文 arXiv:2605.17172 (2026年5月16日公開) リポジトリ github.com/open-jarvis/OpenJarvis スター / フォーク数約5.4k / 約1.2k (2026年6月時点) 言語 Python (~83%)、Rust (~9%)、TypeScript (~7%) 評価されたモデル 4つのファミリーにわたる11のローカルモデル: Qwen3.5, Gemma4, Nemotron, Granite クラウドベースライン Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro サポートされるエンジン Ollama, vLLM, SGLang, llama.cpp, Apple Foundation Models, Exo (その他) コンテキストウィンドウモデル依存 インストール単一コマンド; ブロードバンド環境で約3分 ハードウェア Mac Mini M4からNVIDIA DGX Sparkまで、7つのプラットフォームでテスト済み アーキテクチャ: 5つのプリミティブと1つのSpec OpenJarvisは、パーソナルAIシステムを5つの型付きプリミティブに分解し、specと呼ばれる単一の宣言型設定オブジェクトを通じて構成します。 Intelligence — モデル、ウェイト、生成パラメータ、量子化形式。 Engine — 推論ランタイム (Ollama, vLLM, SGLangなど)、バッチ処理、KV-cache設定、ハードウェアパス。 Agents — 推論ループ (ReActまたはCodeAct)、システムプロンプト

元記事を読む→

この記事について質問

記事の内容に答えます。記事外のことは都度ウェブで調べます。