巽のブログ

UTAUとかやってます

DeepVocal音源制作メモ

DeepVocal音源を作りつつ躓きそうなところをメモした感じのメモです。
UTAUの原音設定スキルがある人はたぶん作れます。
先に参考資料を読んでおくとわかりやすいです。むしろ必読です。
また今後、最適な手順が変わるかもしれませんので最新の情報を調べることをおすすめします。



■参考資料
https://forum.deep-vocal.com/d/31-deepvocalhttps://forum.deep-vocal.com/d/31-deepvocalforum.deep-vocal.com


DeepVocalの音源制作|くろ州の合成音声備忘録

私式DeepVocal音源制作まとめ1|くろ州の合成音声備忘録

私式DeepVocal音源制作まとめ2|くろ州の合成音声備忘録


【setParamですること】

※連続音の場合
・CVVC設定をしておく
  必要なのは[- CV],[CV],[VC]([- CV]が無ければ[CV]が使われるらしい)
  母音は[- あ]の先頭音、[あ]の単独音、[a あ]等の連続音設定が必要?らしい。
  [あ]は必須。[- あ]を複製して[あ]にするだけでいいみたい。


  UTAU方式の設定方法でもできるっぽいけどDeepVocal用に設定したほうがいいらしい。

プラグインで[- ○]のエイリアスを抽出したり、メモ帳で編集して母音連続音以外のエイリアス行を除外しておく
  [- CV]→「エイリアス並び替え&抽出プラグイン」で抽出するのがおすすめ
  [CV]と[VC]→「エイリアス複製さん」とVCV→CVVC切り出し設定で複製して原音設定するのがおすすめ
  この段階でUTAUで使うoto.iniとDeepVocal音源用のoto.iniに分けておく。

【oto2dvcfgですること(準備)】

oto2dvcfg配布ページ
最新版本(latest version)」からダウンロードしてください。

※記事執筆時点でのoto2dvcfgのバージョンはBeta_V0.3です。最新版と仕様が異なる可能性がありますのでご注意ください。(2020/02/14追記)

・oto2dvcfgフォルダにあるhi-ro.txtを編集しておく
  (でゅ、ぐぁ行などが無いので音源によっては追加する)
  hi-ro.txtと辞書リストは整合性を取っておかないと後々だめな気がする
  (特に「すぃ、ずぃ、てゅ、でゅ、ん」辺り)
  hi-ro.txtの最後の行を空欄にすると「JPN HIRA OTO」にチェックを入れた時点でエラーが出る。

・oto.iniをdvcfgに変換する際に最後の1行か2行が消える(不具合?)ので最後の行を複製しつつ一番最後の行を空の改行にしておく。
追記:oto2dvcfg_Beta_V1.3.1で改善されました。

【oto2dvcfgですること(本体)】

oto2dvcfg.exeが本体
・「Open OTO file」から音源にしたいフォルダのoto.iniを開く
  デフォルトだと「oto.ini」しか開けないがファイル形式選択をAll filesにするとoto.ini以外のiniが選択できる。
「JPN HIRA OTO」にチェック
・「Hiragana laias to romaji(n to N)」にチェック
  ローマ字に変換しておいたほうがDeepVocalでVSQなどをインポートしたときに無難とかなんとか
・Pitchに音階名(C3など)を入力して「Generate!!」を押して確認して「Save!」で保存

End note、Redefine end noteは語尾音の置換設定っぽい。
ここは無記入でも[a R]→[a_-]に変換してくれる。
Breath end note、Redefine bre end noteも同様。

追記:置換設定はすべて「Find and Replace rules」に統一されたみたいです。
語尾音や下記の「ん」、ブレスのエイリアスも必要に応じてここで置換しておきましょう。
必要な置換ルールを作りテンプレートを保存しておくと後々便利です。

置換例
[ R]→[ -]
[n ]→[N ]
[ R息]→[ V]
[ R吐]→[ H]

・んをNにした場合はメモ帳で[n_]→[N_]に置換しておく。

【DeepVocalToolBoxですること(本体)】

主に[Function]から色々します。

[Phonetic Dictionary]
・発音辞書を定義する。
  くろ州さんが配布されてるやつやoto2dvcfgに付属してるやつ(Dict and listフォルダ)をコピペすると便利

▽ブレスの設定の仕方
ブレスはindependent symbol listにbr1,br2,br3…と設定する。
Tail symbol listで「a 息」などの語尾吐息や連続ブレスを設定できる。
oto.iniのほうを「a H」と編集してTail symbol listにはHを記述する。
  私の場合は語尾吐息をH、連続ブレスをVにした。
単独の息音素も語尾音素も発想次第で増やし放題。


[Build Voice Config]
ここがUTAUでいう原音設定エディタ
・[New Location]から音源フォルダを開く
・編集する
  oto2dvcfgで出力したvoice.dvcfgは改行コードが違う?(ボイスモデル作成時にエラーが出る)ので、読み込んでからどれでもいいので[Edit markers]でエディタを開いてチェックを押して保存する(1つだけでOK)

マーカーの順序が違う?とかマーカーが規定領域外のときもエラーが出るとのこと。


[Build Voice Bank]
ここでDeepVocal音源としてボイスモデル生成したりパッケージ化する。
このあたりはマニュアルが一番詳しい。
ボイスモデルの生成は557行で30分くらい掛かりました。


【余談】
連続音エイリアスも通るっぽいけどボイスモデルの生成で時間が掛かるので間引いたほうがよさげ。
録音リストはCVVCからでもできるけどボイスモデル作成時に原音由来のエラーが出る場合に差し替えやすいので連続音のほうが無難。ていうかエラーめっちゃ出る。65/557出ました。


【発音表記を統一したほうがいいかもしれないリスト】
CVVCエイリアスを作るときに使う設定ファイル(エイリアス複製さんのiniやmkototempのiniなど
[Phonetic Dictionary]のリスト(DeepVocalコピペ用辞書リスト.txtなど
oto2dvcfgのhi-ro.txt
DeepVocal音源同梱の歌詞辞書.dict.txt


【音源と同じフォルダに入れる歌詞辞書について】
DeepVocal音源フォルダに「ほにゃらら.dict.txt」を入れるとDeepVocalで歌詞を日本語入力できるようになる。
ほにゃららのところの名前は何でもいいらしい。

歌詞入力時に歌詞辞書を参照する。
歌詞辞書はこのように書かれてる。
"か":"ka",
左の文字が入力された場合、右が発音シンボルになり、歌詞の表示は「か[ka]」となる。

南宮明子は音源側をひらがなで作成、歌詞辞書でローマ字対応
獣音ロウは音源側をローマ字で作成、歌詞辞書でひらがな対応

ひらがなustをUTAUのmidi出力してそのmidiをDeepVocalにインポートすると、インポートした際に選択されている音源の歌詞辞書を参照して発音シンボルが自動入力される。
歌詞辞書は配布されてる音源からコピーして持ってくるのが無難オブ無難
(書き方はあるみたいだけど自分で作ったら動作しなくなったZEYO…)


【手順のまとめ】
1回全て一通りやってしまえば準備はすっ飛ばせるので

①連続音リスト、またはCVVCリストで録音する
②setParamでCVVCの原音設定をする
③oto.iniをoto2dvcfgでvoice.dvcfgに変換する
④DeepVocalToolBoxでビルドする
⑤エラーが出た音節を修正する
⑥エラーが出なくなるまで④と⑤を繰り返す
⑦Build Voice Bankをして完成


記事が役立ったなーと思ったらgifteeでなにか送っていただけると今後の励みになります。
https://giftee.co/u/tatsu3