コエステーション
From Wikipedia, the free encyclopedia
コエステーションは、音声合成を使った声の権利化・流通プラットフォームで、ある人の声の特徴をもった声の分身=「コエ」を生成することで、そのコエを使ってテキストを読み上げることができるようにする。一般人から有名人まで広くコエを集め、音声を使ったさまざまなサービスで活用できるようにしている。
一般ユーザー向けには専用のスマホアプリが提供されており、ユーザー自身でスマートフォンを使って自分のコエ(デジタルボイス)を登録することが出来る。
タレントや声優などの有名人のコエは、ビジネスユースが前提となるため、さらに高品質にする必要があり、通常、防音スタジオで声の特徴学習のための音声収録を行う。約300~400文ほどの文章を読み上げて、時間としては1~3時間ほど要するのが一般的である。
このようにして一般人から有名人まで多種多様なコエを収集・蓄積する。そして様々なサービス企業に、音声合成ツールとコエの利用権をセットで提供する仕組みがコエステーションである。
サービス企業がコエステーションの音声合成サービスを利用する場合、ツール利用料とコエ利用料を支払う。有名人のコエが利用された場合、その声主(コエの権利者)にもコエの利用に見合ったギャランティが支払われるエコシステムになっている。
コエステーションの法人向け音声合成サービス
コエステーションではサービス企業に対し、様々なビジネス・サービス形態に適した音声合成ツールを提供している。
- エディター
- 人手で音声合成コンテンツを制作・編集するためのツール。喜び・怒り・哀しみ等の感情表現や、ピッチ、話速等、簡単な画面操作で細かい作り込みが出来る。完成した音声は、mp3やwavなどの形式の音声ファイルとしてダウンロードして利用することが可能である。
- Web API
- リアルタイムに音声合成処理が必要な場合に利用するツール。音声チャットボットや毎日情報が変わる天気予報の読み上げ等、あらかじめ音声を作り置き出来ず、都度、音声合成が必要な場合に利用するREST APIで、コエと読み上げさせたいテキストを指定してリクエストすると、コエステーションのクラウドサーバーで音声合成処理が行われ、生成された音声データがリアルタイムに取得出来る。
エディターやWeb APIで生成した合成音声だけでなく、収録音声(生声)と組み合わせてハイブリッドに利用することも可能である。例えば、大事なキメ台詞だけは収録音声を使うことで臨場感をより向上させるといった使い方が為されている。
通常は、このエディターとWeb APIのツールを利用するが、ネットワークに繋がらない環境の場合や、音声合成回数が膨大過ぎてWeb APIではサーバーコストが掛かり過ぎてしまうような場合には、組込用ミドルウェアも提供されている。