巽のブログ

UTAUとかやってます

OREMOでITAコーパスを句読点区切りで収録するキット

MYCOEIROINKの音声ライブラリを作成するためにITAコーパスを収録した際、長い文章を読み上げる時に何度も噛んでしまいスムーズに収録できなかったという経験から、なんとか対策したいと思い作成しました。

使い方

SoXのインストール

SoX - Sound eXchange - Browse /sox at SourceForge.net
から「14.4.2」をクリック
sox-14.4.2-win32.exe」をダウンロードしてください。
ダウンロードしたexeファイルを実行してインストールしてください。

C:\Program Files (x86)\sox-14-4-2\sox.exe 以外の場所に展開するとwav結合ができなくなるので注意してください。
(他の場所にSoXを置きたい場合はbatファイルをメモ帳で編集して1行目を編集してください)

録音

OREMOを開き[ファイル]→[音名リストの読み込み]から「EMOTION_OREMO.txt」を選択して開きます。
確認画面が出るのでコメントも読み込みます。
コメント欄の文章を読み上げて録音してください。
(音名リストの欄はファイル名です。)
RECITATION_OREMO.txtも同様に読み込んで録音してください。

EMOTIONとRECITATIONは同じフォルダになるように録音してください。

コメントの文字が小さく見づらい場合は[オプション]→[フォントサイズの設定]からコメント欄のフォントサイズを変更してください。
その他、OREMOの設定方法はソフト公式サイトやwikiなどを参照してください。
また、読み仮名はITAコーパス公式のpdfを参照してください。


wavファイルの結合

録音したresultフォルダに「ITACorpus_join.bat」をコピペしてダブルクリックして実行すると、wavファイルが結合されます。
録音した結合前のwavファイルは「backup」フォルダに移動します。

不具合に関して

テストはしてありますが、もしも不具合があればお知らせください。