Skip to content

エージェント

Note: ⚠️ このドキュメントはAIによって自動翻訳されています。不正確な部分がある場合は、英語版を参照してください。

エージェントノードは、LLMにツールの自律的な制御権を与え、どのツールをいつ使用するかを反復的に決定できるようにします。すべてのステップを事前に計画する代わりに、エージェントは問題を動的に推論し、複雑なタスクを完了するために必要に応じてツールを呼び出します。

Agent node interface

エージェント戦略

エージェント戦略は、エージェントの思考と行動を定義します。モデルの能力とタスク要件に最も適したアプローチを選択してください。

Agent strategies selection

Function Calling:

大規模言語モデルのネイティブな関数呼び出し機能を使用して、toolsパラメータを通じてツール定義を直接渡します。大規模言語モデルは、組み込まれたメカニズムを使用して、いつどのようにツールを呼び出すかを決定します。

GPT-4、Claude 3.5、および関数呼び出しサポートが堅牢な他のモデルに最適です。

ReAct (Reason + Act):

明示的な推論ステップを通じて大規模言語モデルを導く構造化されたプロンプトを使用します。透明な行動→観察**サイクルに従います。

ネイティブな関数呼び出し機能を持たないモデルや、明示的な推論トレースが必要な場合によく機能します。

Info:

マーケットプレイス → エージェント戦略から追加戦略をインストールするか、コミュニティリポジトリにカスタム戦略を貢献してください。

Function calling setup

設定

モデル選択

選択したエージェント戦略をサポートする大規模言語モデルを選択してください。より高性能なモデルは複雑な推論をより良く処理しますが、反復あたりのコストが高くなります。その戦略を使用する場合は、モデルが関数呼び出しをサポートしていることを確認してください。

ツール設定

エージェントがアクセスできるツールを設定します。各ツールには以下が必要です:

認証 - ワークスペースで設定された外部サービス用のAPIキーと認証情報

説明 - ツールの機能と使用タイミングの明確な説明(これがエージェントの意思決定を導きます)

パラメータ - 適切な検証を伴うツールが受け入れる必須およびオプションの入力

指示とコンテキスト

自然言語の指示を使用してエージェントの役割、目標、コンテキストを定義します。上流のワークフローノードから変数を参照するには、Jinja2構文を使用します。

クエリは、エージェントが作業すべきユーザー入力またはタスクを指定します。これは以前のワークフローノードからの動的コンテンツにすることができます。

Agent configuration interface

実行制御

最大反復数は、無限ループを防ぐための安全制限を設定します。タスクの複雑さに基づいて設定してください - 単純なタスクには3-5回の反復が必要ですが、複雑な調査には10-15回必要な場合があります。

メモリは、TokenBufferMemoryを使用してエージェントが記憶する過去のメッセージ数を制御します。より大きなメモリウィンドウはより多くのコンテキストを提供しますが、トークンコストが増加します。これにより、ユーザーが以前のアクションを参照できる会話の継続性が可能になります。

ツールパラメータ自動生成

ツールには自動生成または手動入力として設定されたパラメータがあります。自動生成パラメータ(auto: false)はエージェントによって自動的に設定され、手動入力パラメータはツールの永続的な設定の一部となる明示的な値が必要です。