生成 AI の見えないプライバシーリスク

　個人情報やプライバシーリスクの視点では注意が必要な項目だ。なぜなら、プロンプトインジェクションは、必要な個人情報・プライバシー情報を直接手に入れることができるからだ。アプリケーションセキュリティの場合は、脆弱性を利用してファイルを特定し盗み出す必要がある。

研修・セミナー・カンファレンスセミナー・イベント

759 views

2025.3.21 Fri 8:10

　AI の発達によって人間の職が奪われる。そんな懸念が流布しているが新技術が雇用や産業を塗り替えていくのは AI に限った話ではない。企業が人を機械に置き換えるのは産業革命以来、いやそれ以前から行われてきた。もう少し俯瞰した見方が必要だろう。たとえばプライバシーの問題だ。

　もちろん、他にも著作権や人権といった問題も現実には起きている。本稿は「CODE BLUE 2023」で行われた先進的講演「Pennywise: Invisible pribacy risk in the new AI era」の内容をベースに、プライバシーや個人情報（PII：Personally Identifiable Information）に対する問題やリスクについて考えてみたい。

　講演者は Joy Ho 氏（東呉大学教授）と Vic Huang 氏（UCCUハッカー）氏。Ho 氏は個人情報保護の専門家として台湾 PDPA（個人情報保護法）の監査も行っている。Huang 氏は台湾セキュリティベンダーのエンジニアで、DEFCON、HITCON 他でも活躍する。

● 優しいおばあちゃんを演じさせる：プロンプトインジェクション

　大規模言語モデル（LLM）のセキュリティ課題については、OWASP Top 10 for LLM がひとつの指標になっている。Huang 氏よれば、LLM に対するリスクは、

　1．プロンプト
　2．アプリケーションセキュリティ
　3．信頼性と制御
　4．モデルとデータ

の 4 つのカテゴリに分類されるという。10 のリスクのうちプロンプトにかかわるリスクは「LLM 01：プロンプトインジェクション」のみだ。

　だが、個人情報やプライバシーリスクの視点では注意が必要な項目だ。なぜなら、プロンプトインジェクションは、必要な個人情報・プライバシー情報を直接手に入れることができるからだ。アプリケーションセキュリティの場合は、脆弱性を利用してファイルを特定し盗み出す必要がある。「信頼性と制御」「モデルとデータ」は、データ破壊や整合性操作にはつながるが、目的データを取得するには制御を奪取する必要がある。

　例で示そう。公開されている LLM やそのアプリケーションは、個人情報に関する問い合わせ、違法行為につながる情報にはベースラインルールが設定され、出力が抑制される。だが、プロンプトを工夫することで、禁止されている情報にアクセス可能な場合がある。たとえば、古い LLM では、プロンプトに注入した Python コードを実行できてしまうものがある。

　プロンプトを工夫することでベースラインを突破する手法を「DAN（Do Anyting Now）」という。