ブラウザ操作AIを試す方法
Microsoft Fara Tutorial: Run a Browser-Use Agent in Google Colab with a Mock OpenAI-Compatible Endpoint

Microsoft Faraというブラウザ操作AIを、仮想AI接続口でGoogle Colab上で試す方法が公開。重いAIなしで動作確認でき、学習や開発に有用です。
このチュートリアルでは、Google ColabでMicrosoft Faraをセットアップし、ブラウザを使用するワークフローを最初から最後まで実行します。私たちはまず、リポジトリをクローンし、パッケージをインストールし、Playwrightを準備し、パッケージのレイアウトが変更されてもインストールされたFaraファイルが機能することを確認します。代わりに、すぐに重いFara-7Bのデプロイに頼るのではなく、有効なブラウザアクションを返す小さなモックのOpenAI互換エンドポイントを作成します。これにより、タスクの送信、モデル形式のアクション応答の受信、ブラウザを介したそれらのアクションの実行など、Faraが実際のタスクに使用するのと同じエージェントループをテストできます。また、エンドポイントの構成を柔軟に保つことで、実際のFara-7Bモデルを使用したいときに、同じノートブックが後でAzure Foundry、vLLM、LM Studio、またはOllamaに接続できるようになります。Copy Code Copied Use a different Browserimport osimport sysimport jsonimport timeimport socketimport subprocessimport importlibfrom pathlib import PathUSE_REAL_FARA_ENDPOINT = FalseREAL_FARA_BASE_URL = "http://localhost:5000/v1"REAL_FARA_API_KEY = "not-needed"REAL_FARA_MODEL = "microsoft/Fara-7B"TASK = "Open example.com and tell me what the page is."WORKDIR = Path("/content/fara_tutorial")REPO_DIR = Path("/content/fara")REPO_SRC = REPO_DIR / "src"OUTPUT_DIR = WORKDIR / "outputs"ENDPOINT_CONFIG_PATH = WORKDIR / "endpoint_config.json"MOCK_SERVER_FILE = WORKDIR / "mock_fara_endpoint.py"WORKDIR.mkdir(parents=True, exist_ok=True)OUTPUT_DIR.mkdir(parents=True, exist_ok=True)必要なPythonライブラリをインポートし、チュートリアルの主要な設定値を定義します。モックエンドポイントを使用するか、実際のFaraエンドポイントに接続するかを決定し、エージェントが実行する必要のあるブラウザタスクを設定します。また、リポジトリ、エンドポイント構成、モックサーバー、および出力ファイル用の作業フォルダとファイルパスを作成します。Copy Code Copied Use a different Browserdef run_cmd(cmd, cwd=None, check=True, env=None):print(f"\n$ {cmd}")result = subprocess.run(cmd, shel