2024年06月20日 18:38

千葉大学大学院情報学研究院の川本一彦教授らの研究チームは、画像認識AIが画像のどの箇所に注目して判断をしているのかを可視化する、新たな手法を開発した。
画像認識AI技術により、画像や動画内にある物体の種類の判別、顔認識、歩行者の検出などの高度な認識が可能になっており、広く応用されている。そのような状況で、AIの認識において画像中のどの箇所が、どの程度重要かを可視化する技術は、AIの誤作動等の防止・理解の上で非常に重要。
従来の手法では、画像ピクセル個々の重要度を考慮していたが、本手法では画像ピクセル群全体としての重要度を測ることで、より精密な可視化を実現した。より具体的には、ゲーム理論で用いられるシャープレイ値と相互作用値という2つの量を画像に対して計算することで、個々のピクセルの貢献度に加えてピクセル間の協調による貢献度を考慮している。
その結果、Vision Transformerなどの代表的な画像認識モデルはほとんどの画像において、わずか4%から16%程度の画像領域のみから画像中の物体等を正確に認識することが可能であるとわかった。本研究により、画像認識AI技術の判断根拠をより正確に可視化することが可能になった。今後は、自動運転における歩行者や標識の検出の信頼性を高めるなど、安心・安全なAIを実現するための応用が期待される。