2024年01月26日 13:05

IEEE ICASSP2024にて、ファーストアカウンティング社共同創業者でありチーフ・リサーチ・サイエンティスト(CRS)の藤武将人さんの論文が採択された。IEEE ICASSP2024は、4月14日~19日に韓国にて開催される、信号処理技術などを取り扱う世界最大規模の国際学術会議のひとつ。この度採択された論文は、従来のロゴ認識手法とは一線を画した、新しいロゴ認識技術に関する技術論文。

風景やウェブ画像中のロゴに関連するブランドを識別するロゴ認識は、ドキュメント、広告分析などのロゴ画像を扱う様々なアプリケーションにおいて重要な技術。これまでの手法では、入力画像全てを用いて、そこから対象のブランドを推定する方法が取られていた。しかし、画像を占めるロゴの割合がまちまちである、スケールのばらつきや背景がノイズとなり誤認識を起こす、という課題があった。

そこで同社が提案したのが、ロゴ位置を特定しながら認識するという新しいロゴ認識手法。画像内のロゴの位置を特定するためには、従来では座標の教師データが必要だったが、本手法では近年注目を浴びている大規模言語モデル(LLM)においても使用される強化学習を用いて、座標教師データなしにこれを実現した。

本手法を検証するために包括的な実験を行ったところ、複数のベンチマークデータセットにおいて、既存の手法と比べても高い精度を達成していることが実証された。採択された本論文のプレプリントは、arXivにて閲覧可能。