Session 1: ハルシネーション | 生成AIセキュリティ・ガバナンス研修

LECTURE / 8 MIN

ハルシネーションとは何か

定義

モデルが学習データに存在しない情報を、あたかも事実であるかのように生成する現象です。「幻覚」の名の通り、AI自身は嘘をついている自覚がありません。出力の文体が自信に満ちているほど、人間は騙されやすくなります。

発生メカニズム

次トークン予測の確率的性質 ── 「もっともらしい続き」を生成するだけで、真偽の判断は行いません
学習データの偏り ── 特定の分野やトピックの情報が薄いと、つじつまを合わせるために架空の情報を生成します
知識のカットオフ ── 学習データに含まれない最新情報は原理的に出力できません

実際に起きた事例

CASE 01

架空の判例を引用した弁護士

2023年、米国の弁護士がChatGPTで判例を調査。AIが生成した架空の判例6件を裁判所に提出し、制裁処分を受けた。

Mata v. Avianca, Inc. (2023) ↗

CASE 02

存在しない論文のDOI

学術論文の参考文献をAIに生成させると、実在しないDOI（デジタルオブジェクト識別子）を返すことがある。形式は正しいが、リンク先は存在しない。GPT-4oでもDOIの36.2%にエラーがあるとの報告。

Scientific Reports: Fabrication and errors in bibliographic citations (2023) ↗

CASE 03

AI Package Hallucination ↗

AIが架空のライブラリ名を提案し、攻撃者がその名前で悪意あるパッケージを登録する手口（Slopsquatting）。約20%のAI生成コードに存在しないパッケージ名が含まれるとの研究報告がある。

事前対策 ── プロンプト設計で防ぐ

「わからない」を許可する

プロンプトに「わからない場合はわからないと答えてください」と明示します。これだけで架空の情報を生成するリスクが下がります。

出典を要求する

「回答には出典URLを付けてください」と指示します。実在する出典を付けられない場合、AIは回答を控えるか、不確実であることを示唆しやすくなります。

確信度を数値化

「この回答の確信度を0-100で示してください」と追加します。AIに自己評価させることで、人間が判断しやすくなります。

Ground Truthを添付

正解データ（社内文書、公式マニュアル等）をプロンプトに添付し、その範囲内で回答させます。RAG的なアプローチを手動で実現する方法です。

生成物のチェック方法

ファクトチェック 3ステップ

生成されたテキストを検証する際は、この順序で確認してください。

1. 固有名詞の検証

→

2. 数値の検証

→

3. 論理構造の検証

Deep Researchを使ったクロスリファレンス ── 同じトピックを別の情報源と突き合わせます
同じ質問を別セッションで再生成し、回答の一貫性を確認します ── 回答が変わる箇所はハルシネーションの可能性が高いです

参考リンク

Google Gemini Blog OWASP Top 10 for LLM

HANDS-ON / 12 MIN

ハルシネーション発見 & Gemファクトチェッカー作成

前半 ── 発見チャレンジ（7分）

EXERCISE

AIが生成した事例の真偽を判定する

Geminiに以下のプロンプトを入力してください

// Geminiに入力するプロンプト

日本の中小企業のDX成功事例を5つ、具体的な社名と施策を挙げてください。

Step 1: 生成結果を受け取る

Geminiが5つの事例を生成します。社名、施策内容、数値データが含まれるはずです。

Step 2: 自分で真偽を判定する

5事例のうち、実在する事例と架空の事例をご自身の知識と直感で分類してください。まだ検索しないでください。

Step 3: Deep Researchで検証

GeminiのDeep Research機能で各事例を検証する。社名・施策内容・数値のどこにハルシネーションがあるか特定してください。

Step 4: 全体で共有

どの要素（社名 / 施策内容 / 数値）にハルシネーションが多かったか議論してください。

後半 ── Gem作成（5分）

EXERCISE

ファクトチェック専用アシスタントをGemで作成する

GeminiのGem機能を開いてください
以下のシステム指示を設定してください
作成したGemに先ほどと同じ質問を投げ、出力の違いを確認してください

// Gem のシステム指示（例）

あなたはファクトチェック専用アシスタントです。
以下のルールを厳守してください:

1. 回答には必ず出典元URLを付与すること
2. 確信度が70%未満の情報には [要確認] タグを付けること
3. 数値データには出典年と調査機関名を明記すること
4. 確認できない情報は「確認できませんでした」と明記すること

比較のポイント

Gem適用前と適用後で、出典の有無、[要確認]タグの付与、数値の根拠の明示がどう変わるかを確認してください。プロンプト設計だけでハルシネーションのリスクを大幅に下げられることを体感していただければ幸いです。

COMPREHENSION CHECK

理解度チェック

Q1. ハルシネーションが発生する根本原因はどれか

A AIが意図的に嘘をついている不正解。AIには「嘘をつく意図」はない。生成モデルは確率分布に基づいて次のトークンを予測しているだけで、真偽の判断を行う仕組みを持っていない。

B 次トークン予測の確率的性質で、真偽の判断を行わないため正解。LLMは「もっともらしい続き」を生成する確率モデルであり、出力内容の真偽を検証する機能を持たない。これがハルシネーションの根本原因。

C インターネットからリアルタイムで情報を取得しているため不正解。LLMは学習時点のデータに基づいて回答する。リアルタイムでインターネットを参照しているわけではない（検索連携機能は別）。

D プロンプトの文字数が少なすぎるため不正解。プロンプトの長さとハルシネーションの発生率に直接的な相関はない。短くても長くても発生し得る。

Q2. AI生成テキストのファクトチェックで最初に確認すべき要素は

A 文章の文法的な正しさ不正解。LLMは文法的に正しい文章を生成する能力が高い。文法の正しさは内容の正確性を保証しない。

B 固有名詞（人名・社名・地名等）の実在性正解。ファクトチェック3ステップの第1段階は固有名詞の検証。AIは実在しない人名・社名・論文名を自信を持って生成することがある。

C 回答の生成にかかった時間不正解。生成速度と回答の正確性に相関はない。速く生成された回答が正確なこともあれば、時間がかかっても不正確なこともある。

D AIモデルのバージョン番号不正解。新しいモデルでもハルシネーションは発生する。GPT-4oでもDOIの36.2%にエラーがあるとの報告がある。

Q3. ハルシネーション対策として最も効果的なプロンプト設計は

A 「必ず回答してください」と指示する不正解。「必ず回答して」はAIに無理に答えを作らせることになり、ハルシネーションのリスクがかえって高まる。

B 質問をできるだけ短く簡潔にする不正解。質問の短さよりも、「わからない場合の振る舞い」の指定や「出典の要求」の方がハルシネーション対策として効果的。

C 「わからない場合はわからないと答えてください」と指示する正解。AIに「不確実な場合は回答を控える」選択肢を与えることで、架空の情報を生成するリスクを大幅に下げられる。出典の要求や確信度の数値化と組み合わせるとより効果的。

D 英語でプロンプトを書く不正解。英語は学習データ量が多いが、ハルシネーション対策としての本質的な効果はない。言語に関わらず発生し得る。

ハルシネーション見抜く力と防ぐ仕組み

架空の判例を引用した弁護士

存在しない論文のDOI

AI Package Hallucination ↗

「わからない」を許可する

出典を要求する

確信度を数値化

Ground Truthを添付

AIが生成した事例の真偽を判定する

ファクトチェック専用アシスタントをGemで作成する

ハルシネーション
見抜く力と防ぐ仕組み