2021年08月13日 13:56

インプレスは、音声合成の基礎から実装までを解説した書籍「Pythonで学ぶ音声合成」を8月12日に発売する。
「音声合成」とは、人間の音声を人工的に作り出す音声情報処理の一分野。近年、深層学習の発展に伴い、機械学習による音声合成の技術は飛躍的に進歩している。また、PyTorch、TensorFlowをはじめとした、深層学習のためのオープンソースソフトウェアとオープンソースコミュニティの発展により、研究者や技術者が公開しているソフトウェアやソースコードを無償で誰もが手に入れることができるようになったことで、専門家でなくても取り組みやすくなってきているといえる。
しかしその一方で、音声合成の最新手法について書かれた日本語の書籍は限られており(執筆当時)、初学者にはハードルが高い、という声もあった。本書はその問題を解決したいとの思いで誕生した。全章を通して、従来の統計的音声合成システムの基礎から深層学習による近年の音声合成の発展まで詳説している。また、Pythonを使って深層学習に基づく日本語の音声合成システムを作る方法も丁寧に解説。ソースコードはすべてGitHubで公開しているので、初学者も実際に手を動かしながら学ぶことができる。
本書は、2020年8月24日刊行「Pythonで学ぶ音源分離」、5月20日刊行「Pythonで学ぶ音声認識」に続く「機械学習実践シリーズ」の3冊目。
定価は3850円(税込)。発売日は8月12日。