音声合成に関して色々やってみる

テキストを投げるとWAVが帰ってくるAPIを作りたい。

サービスとしてはいくつかあってDocomoは使いやすかった。

こういうのは制限もあるので自分で作ってみたい。

慣れてるし、他にいいのも思いつかないのでAWSを使う。

LambdaでテキストからWAVを作る処理を書いてトリガーでAPIを指定する。

Lambdaで実行ファイルを起動したいときは次みたいな処理をはさむ。

cp -r /var/task/aquestalkpi /tmp/; chmod -R 755 /tmp/aquestalkpi/AquesTalkPi;

1	cp -r /var/task/aquestalkpi /tmp/; chmod -R 755 /tmp/aquestalkpi/AquesTalkPi;

ためしにAquesTalkPiがLambdaで動かないかなと思ったけど無理だった。

sh: /tmp/aquestalkpi/AquesTalkPi: cannot execute binary file

1	sh: /tmp/aquestalkpi/AquesTalkPi: cannot execute binary file

次に音声合成ソフトを色々調べてみた。

組み込み用
- AquesTalk,AquesTalk2：アクエスト規約に従う。
- OpenJTalk：修正BSDライセンス。
フリーソフト（実行ファイル）
- softalk（ソフトーク）：Windows向け。Aquestalk使用でアクエスト規約に従う必要あり。
- textalk（テキストーク）：Windows向け。OpenJTalk使用。
- AquesTalkPi：ラズベリーパイ向け。アクエスト規約に従う必要あり。

実行ファイルは基本Winbdows向けだし、いろいろ自由に使うためにOpenJTalk使って自分で実行ファイル作ることにする。

他にもnodejsのモジュールが２つ見つかったけど、やりたいことと微妙に違ったのとEC2でインストールできなかったのでこれらはいったん保留。