近年,機械学習技術はその多様な応用可能性から注目を集めている.医療,金融,交通などの多岐にわたる分野での活用が進み,特にIoT デバイスの普及に伴い,これらの技術は日常生活に不可欠な要素となっている.機械学習はデータ駆動型の意思決定を可能にし,複雑なパターンの識別や予測モデリングにおいて顕著な成果を示している.しかし,機械学習モデルは,その設計と訓練の過程において,潜在的な脆弱性を持つ.特に,外部からの悪意ある介入によって,バックドア攻撃のようなセキュリティ上の脅威に晒されることがある.このタイプの攻撃は,モデルに秘密裏に組み込まれ,特定のトリガーが存在する場合にのみ活動する.例えば,BadNets 攻撃は,訓練データに微妙なパターンを埋め込むことで,モデルが特定の入力に対して不適切な出力を生成するよう操作する. 本研究では,この種の攻撃を検出し,対処するための新しいアプローチを提案する.第一に,攻撃が組み込まれたデータセットを識別するための分析手法を開発した.この手法は,データ内の異常なパターンをシャノン・エントロピーを用いて検出することで,攻撃の兆候を特定する.第二に,運用環境においてモデルへの入力データにバックドアが仕込まれている場合を検知するシステムを開発した.これにより,モデルが攻撃に利用される前に効果的に対処することを可能とする.本研究は,機械学習モデルのセキュリティを強化することに焦点を当て,システム全体の信頼性向上を目的としている.また,機械学習が持つ潜在的なリスクに対する意識を高めることで,将来の技術展開への貢献を期待する.

Top