MYCOEIROINKの音声ライブラリを作成するためにITAコーパスを収録した際、長い文章を読み上げる時に何度も噛んでしまいスムーズに収録できなかったという経験から、なんとか対策したいと思い作成しました。
使い方
SoXのインストール
SoX - Sound eXchange - Browse /sox at SourceForge.net
から「14.4.2」をクリック
「sox-14.4.2-win32.exe」をダウンロードしてください。
ダウンロードしたexeファイルを実行してインストールしてください。
C:\Program Files (x86)\sox-14-4-2\sox.exe 以外の場所に展開するとwav結合ができなくなるので注意してください。
(他の場所にSoXを置きたい場合はbatファイルをメモ帳で編集して1行目を編集してください)
録音
OREMOを開き[ファイル]→[音名リストの読み込み]から「EMOTION_OREMO.txt」を選択して開きます。
確認画面が出るのでコメントも読み込みます。
コメント欄の文章を読み上げて録音してください。
(音名リストの欄はファイル名です。)
RECITATION_OREMO.txtも同様に読み込んで録音してください。
EMOTIONとRECITATIONは同じフォルダになるように録音してください。
コメントの文字が小さく見づらい場合は[オプション]→[フォントサイズの設定]からコメント欄のフォントサイズを変更してください。
その他、OREMOの設定方法はソフト公式サイトやwikiなどを参照してください。
また、読み仮名はITAコーパス公式のpdfを参照してください。
wavファイルの結合
録音したresultフォルダに「ITACorpus_join.bat」をコピペしてダブルクリックして実行すると、wavファイルが結合されます。
録音した結合前のwavファイルは「backup」フォルダに移動します。
不具合に関して
テストはしてありますが、もしも不具合があればお知らせください。