Skip to content

レッスン 4:カンニングペーパー(ナレッジ検索)

Note: ⚠️ このドキュメントはAIによって自動翻訳されています。不正確な部分がある場合は、英語版を参照してください。

前回までのレッスンで、AI メールアシスタントは基本的なメールを作成できるようになりました。しかし、もし顧客が具体的な料金プランや返金ポリシーについて質問した場合、AI はハルシネーション(Hallucination)を起こす可能性があります。つまり、自信満々にでたらめを言ってしまうということです。

AI のハルシネーションを防ぐにはどうすればよいでしょうか?答えは、カンニングペーパーを渡すことです。

検索拡張生成(RAG)とは

この技術の正式名称は RAG(Retrieval-Augmented Generation)です。これは、AI を一般的なレシピを暗記しているシェフから、カウンターに専用のレシピブックを置いているシェフに変えるようなものです。

これは 3 つのシンプルなステップで行われます。

1. 検索(Retrieval)- レシピを探す

ユーザーが質問すると、AI はあなたのレシピブック(アップロードしたファイル)をめくって、最も関連性の高いページを探します。

例:誰かがおばあちゃん特製のアップルパイを注文します。あなたはその特定のレシピページを探しに行きます。

2. 拡張(Augmentation)- 材料を準備する

AI はその特定のレシピを目の前に置き、記憶に頼る必要がないようにします。

例:レシピをカウンターに広げ、必要なリンゴとシナモンを正確に準備します。

3. 生成(Generation)- 焼き上げる

AI は見つけた事実のみに基づいて回答を作成します。

例:レシピ通りに正確にパイを焼き、市販の一般的なものではなく、おばあちゃんの味を再現します。

ナレッジ検索ノード

これは、AI アシスタントの隣に参考資料の束を置くようなものです。ユーザーが質問すると、AI はまずこのカンニングペーパーをめくって最も関連性の高いページを探します。そして、見つけた内容とユーザーの元の質問を組み合わせて、最適な回答を考えます。

この実践では、ナレッジ検索ノードを使用して AI アシスタントに公式のカンニングペーパーを提供し、回答が常に事実に基づいたものになるようにします。

ハンズオン 1:ナレッジベースを作成する

ライブラリに入る

上部ナビゲーションバーの**ナレッジ**をクリックし、**ナレッジを作成**をクリックします。


  ![ナレッジを作成](/images/difyworkflow101-lesson04-createknowledge.png)

FlexAI では Notion やウェブサイトから同期することもできますが、今日はデバイスからファイルをアップロードしましょう。[こちら](https://drive.google.com/file/d/1imExB0-rtwASbmKjg3zdu-FAqSSI7-7K/view)をクリックして、後でアップロードする FlexAI Intro をダウンロードしてください。

ファイルをアップロードする

**ファイルからインポート**をクリックします。次に、先ほどダウンロードしたファイルを選択してアップロードします。


  ![ファイルからインポート](/images/difyworkflow101-lesson04-importfromfile.png)

テキスト分割のステップ

関連性の高いチャンクは、AI アプリケーションが正確で包括的な回答を提供するために不可欠です。長い本を想像してみてください。500 ページの中から 1 つの文を見つけるのは大変です。FlexAI は本をさまざまなナレッジカードに分割し、正しい答えをより速く見つけられるようにします。

**チャンク構造**

ここでは、FlexAI が長いテキストを自動的に小さく検索しやすいチャンクに分割します。ここでは通用モードのままにしておきましょう。


  ![チャンク構造](/images/difyworkflow101-lesson04-chunkstructure.png)

**インデックス方法**

- **高品質**:LLM モデルを使用してドキュメントを処理し、より正確な検索を実現して、LLM が高品質な回答を生成できるようにします。
- **エコノミー**:チャンクごとに 10 個のキーワードを使用して検索を行います。トークンは消費されませんが、検索精度は低下します。


  ![インデックス方法](/images/difyworkflow101-lesson04-indexmethod.png)

検索設定

ドキュメントの処理が完了したら、検索設定の最終確認を行います。ここでは、FlexAI が情報を検索する方法を設定できます。

エコノミーモードでは、転置インデックスのみが利用可能です。


  ![検索設定](/images/difyworkflow101-lesson04-retrievalsetting.png)

- **転置インデックス**

  これは FlexAI が使用するデフォルトの構造です。本の巻末にある索引のようなもので、重要な用語が一覧表示され、それらがどのページに出現するかを FlexAI に正確に伝えます。

  これにより、FlexAI は最初から本全体を読むのではなく、キーワードに基づいて適切なナレッジカードに即座にジャンプできます。
- **Top K**

  3 に設定されたスライダーが表示されます。これは FlexAI に次のように指示しています:ユーザーが質問したとき、レシピブックから最も関連性の高い上位 3 枚のナレッジカードを見つけて AI に表示せよ。

  値を高く設定すると、AI はより多くのコンテキストを読むことができますが、高すぎると情報過多になる可能性があります。

今のところ、デフォルト設定のままにしておきましょう。現在のニーズに十分対応できる設定になっています。


  ![ドキュメント処理](/images/difyworkflow101-lesson04-documentprocessing.png)

保存して処理する

**保存して処理**をクリックします。ナレッジベースの準備が完了しました。

素晴らしい!

最初のナレッジベースの作成に成功しました。次に、このナレッジベースを使って AI メールアシスタントをアップグレードしましょう。

ハンズオン 2:ナレッジ検索ノードを追加する

ノードを追加する

1. メールアシスタントのワークフローに戻ります。
2. 開始ノードと LLM ノードの間の線にカーソルを合わせます。
3. **プラス(+)**アイコンをクリックし、**ナレッジ検索**ノードを選択します。


  ![ナレッジ検索ノードを追加](/images/difyworkflow101-lesson04-addknowledgetrievalnode.png)

ナレッジベースを接続する

1. ノードをクリックし、右側のパネルに移動します。
2. **ナレッジ**の横にある**プラス(+)**ボタンをクリックしてナレッジを追加します。


     ![ナレッジを追加](/images/difyworkflow101-lesson04-addknowledge.png)

3. **What's FlexAI** を選択し、**追加**をクリックします。


     ![ナレッジを選択](/images/difyworkflow101-lesson04-selectknowledge.png)

クエリテキストを設定する

ナレッジベースの準備ができました。では、AI がナレッジベースを参照してメールの回答を検索するようにするにはどうすればよいでしょうか?

パネルにとどまり、上部の**クエリテキスト**に移動して、`email_content` を選択します。

これにより、AI に次のように指示しています:*顧客のメッセージを検索キーワードとして使用し、レシピブックをめくって一致する情報を見つけよ。*クエリがなければ、AI は閉じた本を見つめているだけです。


  ![クエリテキスト](/images/difyworkflow101-lesson04-querytext.png)

このようにして、メールアシスタントは顧客の元のメールを検索キーワードとして使用し、ナレッジベースから最も関連性の高い回答を見つけます。

ハンズオン 3:メールアシスタントをアップグレードする

ナレッジベースの準備ができました。次に、LLM ノードに返信を生成する前にナレッジをコンテキストとして実際に読むよう指示する必要があります。

コンテキストを追加する

1. **LLM ノード**をクリックします。**コンテキスト**という新しいセクションが表示されます。
2. それをクリックし、ナレッジ検索ノードの **result** を選択します。


     ![コンテキストを追加](/images/difyworkflow101-lesson04-addcontext.png)

プロンプトを更新する

AI にコンテキストに基づいて返信を生成するよう指示する必要があります。

**System** に、追加の要件として **Generate response based on** `/` と入力し、**Context** を選択します。


  ![プロンプトを更新](/images/difyworkflow101-lesson04-updateprompt.png)

お疲れ様でした! 最も難しい部分を完了しました。これで、メールアシスタントは返信を生成する際に参照できるナレッジベースを持っています。どのように動作するか見てみましょう。

以下のサンプルテキストを使って自由にテストしてみてください。

```text テスト用サンプルメール 顧客名:Amanda

メール原文: Hi,

What does the name 'FlexAI' actually stand for, and what can it do for my business?

Best regards, Amanda ```

結果を確認すると、一般的な推測ではなく、AI がナレッジベースを参照して FlexAI の意味を説明していることがわかります。

テスト結果

ミニチャレンジ

  1. 顧客がナレッジベースにない質問をした場合、どうなりますか?
  2. ナレッジベースとしてどのような情報をアップロードできますか?
  3. チャンク構造、インデックス方法、検索設定を探索してみましょう。