最近よく聞くAIきりたん。
簡単といってもどうせ音楽系技能がないと使えないんだろうと思いつつも何とかならんのかという内容です。
楽譜が読めないレベルの人間の挑戦。
Links
今回使用させていただくソフトとそのホームページは以下になります。
- NEUTRINO:https://n3utrino.work/
- MuseScore:https://musescore.org/ja
NEUTRINO
まずはインストールですが、公式からVectorに飛んでDL&解凍するだけ。
ダウンロードは複数ありますが特に意図がなければ一番上のライブラリ同梱版。
解凍して中のRun.bat
というバッチファイルをダブルクリックするとサンプル音声が作成できます。
初回は保護されるかもですが「詳細情報 → 実行」で実行できます。
Run.bat
を実行するとターミナル起動し、中身に従って処理が行われます。
無事終わればoutput
フォルダ内にwav
ファイルなどが生成されます。
このサンプルを聞いたあたりでこれヤバい技術なんだなと思い知りました。
バッチの中身を見るとこのような感じ。
-
MusicXML
というオープンフォーマットをlabel
変換 -
label
から各種音声パラメータを推定(NEUTRINO) - それらを合成(WORLD)
きりたんが多く話題に上がりますが、もう1つのライブラリである謡子も非常にレベルが高いです。オペラのような感じ。
Run.bat
のModelDir
をKIRITAN
からYOKO
にするだけです。
1 2 3 |
: NEUTRINO.exe rem set ModelDir=KIRITAN set ModelDir=YOKO |
心なしかきりたんより時間がかかる気もしますが無事にできます(BASENAME
が同じなのでファイルは上書きされる)。
さらに合成音声の調整(Pitch
, Formant
)ができたり、音声合成にNSFが使えるなど色々あるようですが、まずはMusicXML
をどうにか作る必要があります。
しかし私はオタマジャクシも読めない。困った。
MuseScore
MusicXML
を作るにあたっての推奨の楽譜作成ソフトです。
こちらはインストーラ(.msi
)をダウンロードしてインストールですが、規約を受諾して場所指定するくらいです。
初回起動のスタートアップでは言語、キーボードレイアウト※、ツアーの有無を決めます。せっかくなのでツアーを見ておきましょう。
※キーボードは大体JIS、たまにQWERTYなんじゃないですかね?
動画も用意されていて丁寧に解説されているんですが、どうしても理解が及ばない。
イタリア語でスペイン語の解説を聞くような、基礎知識がなさ過ぎて何が起きているかわからない状態です。そしてそれほど意欲もわかない。
半ばやけになって小学生の落書きのような楽譜が出来ました。
あれ?歌わせたいのに歌詞はどうするんだと思ったら1つづつ指定して「Ctrl+L」で入力する必要があるようです。
とりあえずこれでwav
ファイルとmusicxml
ファイルをエクスポートします。
musicxml
はそのままNEUTRINO
にもっていって歌ってもらいます。
なんかすごくWARN
が出ますが変換はできました。
Audacityでピアノと歌を合成してトリミングしたものがこちら。
いい声ですね(現実逃避)。
所感
NEUTRINO
すごい → 楽譜きらい → 何とかズルできんのか(イマココ。
操作性の面倒さはツール探したり作ったりしたら何とでもなるんじゃないかと思いますが、音方面の知識のなさは頑張る以外の解決方法がない。つらい。
スタート地点にギリ届かないところまでこれましたが、それでもアウトプットができるのはやっぱり楽しいですね。
あとAIきりたんで始めたのに何故か途中からずっと謡子いじってた。
多分しばらく不定期で触ってみると思います。