【AIきりたん】初心者でもNEUTRINOでNSF法を試す

音関係に疎い人間がNEUTRINO(AIきりたん)を使って歌を作る記事の第3弾。

NEUTRINONSF法を使った音声合成ができるとのことで試してみます。

NSF法はニューラルソースフィルタモデルを使った手法で高速に高品質な音声を合成できる方法みたいです。理屈はともかく早速試そう。

最終的な聞き比べは最後にあります。

続きを読む 【AIきりたん】初心者でもNEUTRINOでNSF法を試す

【AIきりたん】初心者でもNEUTRINOで調声してみる

前回AIきりたんにつられて挑戦を行ったNEUTRINO。

今回はもう少し踏み込んで調声してみます。

続きを読む 【AIきりたん】初心者でもNEUTRINOで調声してみる

【AIきりたん】初心者でもNEUTRINOで歌を作りたい

最近よく聞くAIきりたん。

簡単といってもどうせ音楽系技能がないと使えないんだろうと思いつつも何とかならんのかという内容です。

楽譜が読めないレベルの人間の挑戦。

続きを読む 【AIきりたん】初心者でもNEUTRINOで歌を作りたい

為替レートを読み上げるサービスが欲しい

為替レートを定期的に読み上げるサービスが欲しいんだけど見つからなかった。ないものはしかたがないので自作してみる。

node.jsで作るのが個人的に一番楽だろうけど、今後のWEBサービスにつながるかもしれないからHTMLベースで作ってみる。

続きを読む 為替レートを読み上げるサービスが欲しい

音声合成に関して色々やってみる

テキストを投げるとWAVが帰ってくるAPIを作りたい。

サービスとしてはいくつかあってDocomoは使いやすかった。

こういうのは制限もあるので自分で作ってみたい。

 

Lambdaでお試し

慣れてるし、他にいいのも思いつかないのでAWSを使う。

LambdaでテキストからWAVを作る処理を書いてトリガーでAPIを指定する。

Lambdaで実行ファイルを起動したいときは次みたいな処理をはさむ。

 

ためしにAquesTalkPiがLambdaで動かないかなと思ったけど無理だった。

 

音声合成ソフトについて

次に音声合成ソフトを色々調べてみた。

  • 組み込み用
    • AquesTalk,AquesTalk2:アクエスト規約に従う。
    • OpenJTalk:修正BSDライセンス。
  • フリーソフト(実行ファイル)
    • softalk(ソフトーク):Windows向け。Aquestalk使用でアクエスト規約に従う必要あり。
    • textalk(テキストーク):Windows向け。OpenJTalk使用。
    • AquesTalkPi:ラズベリーパイ向け。アクエスト規約に従う必要あり。

 

実行ファイルは基本Winbdows向けだし、いろいろ自由に使うためにOpenJTalk使って自分で実行ファイル作ることにする。

 

他にもnodejsのモジュールが2つ見つかったけど、やりたいことと微妙に違ったのとEC2でインストールできなかったのでこれらはいったん保留。

 

OpenJTalkのインストール

とりあえずWindowsにインストールしてみる。

ここを参考にした。

Visual Studio 2015にVcvarsall.batがなかったので2013を追加インストール。

2015のときも思ったけど西暦よりバージョンが1少ないのは紛らわしい。

(今回はMicrosoft Visual Studio 12.0に配置された。)

 

これでWindows上で動作するようになりました。

今日はとりあえずここまで。

ここから先が果てしなく長そう…。