ChatGPTに個人情報を開示させる実験、MBSD研究者 | ScanNetSecurity
2024.04.25(木)

ChatGPTに個人情報を開示させる実験、MBSD研究者

 三井物産セキュアディレクション株式会社(MBSD)は5月11日、ChatGPTなどの生成AIを介した個人情報の開示について、同社ブログで発表した。同社のプロダクト&ソリューション事業部 AI&高度先端技術開発の高江洲 勲氏が解説している。

調査・レポート・白書・ガイドライン 調査・ホワイトペーパー

 三井物産セキュアディレクション株式会社(MBSD)は5月11日、ChatGPTなどの生成AIを介した個人情報の開示という挑戦的なテーマに関する研究調査結果について、同社ブログで発表した。同社のプロダクト&ソリューション事業部 AI&高度先端技術開発の高江洲 勲氏が解説している。

 ChatGPTでは、12年間にわたる大量のWebクロールデータや英語版Wikipediaなどペタバイト級の情報、ChatGPTユーザーが入力した文章を学習していると言われ、過去に誤って公開された機微情報を含むWebページやユーザーが誤入力した社外秘や個人情報などを学習している可能性がある。また、OSSの開発者や研究者などは、GitHubなどの公開リポジトリや研究組織のWebページ上でメールアドレスを公開する傾向があり、ChatGPTがこれらの個人情報を学習している可能性がある。

 同ブログでは、ChatGPTなどの生成AIが学習した情報が第三者に開示され得るのか確認するとともに、想定される対策を解説している。

 同ブログでは、個人情報の開示を意図したプロンプトを拒否するフィルター「Guardrail」を回避し、ChatGPTで他者のメールアドレスを開示させることができるか、既知のメジャーなJailbreak手法と応答精度を高めるCoT(Chain of Thought)を組み合わせることで実現している。また、ChatGPT以外の生成AIでも同様に個人情報を開示できるか検証を行っている。

 さらに同ブログでは、ChatGPTなど生成AIによる個人情報開示の対策例を、下記の2つの視点で解説している。

・生成AIを利用するユーザーの視点
プロンプトに個人情報や機密情報を入力しない
「会話を学習させない」モードを有効にする
プライバシーに配慮したサービスを利用する

・生成AIを活用してサービス提供する企業・行政などの視点
ユーザーの入力を学習させないようにする
Prompt Injectionを検知する
不正なプロンプトを拒否する
検閲用のAIを使用する

《高橋 潤哉》

関連記事

特集

PageTop

アクセスランキング

  1. 訃報:セキュリティの草分けロス・アンダーソン氏 死去 67 歳、何回分かの生涯に匹敵する業績

    訃報:セキュリティの草分けロス・アンダーソン氏 死去 67 歳、何回分かの生涯に匹敵する業績

  2. 今日もどこかで情報漏えい 第23回「2024年3月の情報漏えい」なめるなという決意 ここまでやるという矜恃

    今日もどこかで情報漏えい 第23回「2024年3月の情報漏えい」なめるなという決意 ここまでやるという矜恃

  3. 社員のセキュリティ意欲高める施策とは? 罰則は逆効果 ~ プルーフポイント「2024 State of the Phish」日本語版公表

    社員のセキュリティ意欲高める施策とは? 罰則は逆効果 ~ プルーフポイント「2024 State of the Phish」日本語版公表

  4. LINEヤフー委託先への不正アクセス、報告書を受け 2 度目の行政指導

    LINEヤフー委託先への不正アクセス、報告書を受け 2 度目の行政指導

  5. スペシャリスト集結! マネーフォワード・ラック・富士ソフト・電通総研から学ぶ、脆弱性診断内製化の成功法則とは? AeyeScan 導入企業との公開対談

    スペシャリスト集結! マネーフォワード・ラック・富士ソフト・電通総研から学ぶ、脆弱性診断内製化の成功法則とは? AeyeScan 導入企業との公開対談PR

  6. タカラベルモントの海外向けウェブサイトのサーバがフィッシングメール送信の踏み台に

    タカラベルモントの海外向けウェブサイトのサーバがフィッシングメール送信の踏み台に

  7. 情報処理学会、高等学校情報科の全教科書の用語リスト公開

    情報処理学会、高等学校情報科の全教科書の用語リスト公開

  8. Acompany で 4 件の Google フォーム誤設定、最大 164 名の個人情報が閲覧可能に

    Acompany で 4 件の Google フォーム誤設定、最大 164 名の個人情報が閲覧可能に

  9. 国内カード発行会社のドメイン毎の DMARC 設定率 36.2%「キャッシュレスセキュリティレポート(2023年10-12月版)」公表

    国内カード発行会社のドメイン毎の DMARC 設定率 36.2%「キャッシュレスセキュリティレポート(2023年10-12月版)」公表

  10. LINE client for iOS にサーバ証明書の検証不備の脆弱性

    LINE client for iOS にサーバ証明書の検証不備の脆弱性

ランキングをもっと見る