2023年06月12日 16:05

rinnaは、テキストを入力するだけで音声合成とフェイスモーション生成が同時にできるサービス「Koemotion(コエモーション)」の提供開始とAPIの公開を発表した。

rinnaでは、テキスト生成の技術を活用したAIキャラクター「りんな」や、AIキャラクターの育成と交流ができるSNS「キャラる」を提供しており、その運営の中で音声やビジュアル表現を用いたコミュニケーションの需要の高まりを目の当たりにしている。AIと人間のコミュニケーションの可能性を広げるため、3月には音声合成サービスKoeiromapを先行公開した。

「Koemotion」は、サービス名に含まれている「コエ」「エモーション」「モーション」を扱う生成AIサービス。「Koemotion」サービスを構成する音声合成には先行公開したKoeiromapが組み込まれており、従来の音声合成製品のように事前に用意された特定の話者の音声を合成するのではなく、2次元空間から任意の座標を選択することで話者の声色を多種多様に変更して音声を合成することができる。Koeiromapでは、座標で指定された全ての話者の声色に7種類の感情を乗せて合成することができ、様々な組み合わせを実現。また、入力されたテキストに込められた感情を推定する機能もある。「Koemotion」は、Koeiromapで合成した音声と同期したフェイスモーションを生成し、2D・3Dモデルや画像生成AIと組み合わせることでキャラクターの表情を音声に合わせて動かすことができる。

製品紹介ページ