三輪俊貴の卒業研究への道
履歴
- 3月5日、26日: NSF法について追加
- 2月5日:作成
2019年3月5日版
- Neural Source Filter (NSF)法について
- 春休み中には既存のモデルを動かし、自分でサンプル音声を作成する。
- NSF法についての情報が少ないので調べ学習をして理解を深める
2019年2月5日版
- 題目:
ディープラーニングを用いた日本語音声合成
- 目的:
音声をNeural Source Filter (NSF)法で学習させ、滑らかな日本語音声を出力する
- 動機:
- 音声認識の技術が確立されてきており、機械音声を感じさせない自然な音声であればもっと使いやすくなると思ったため。
- リアルタイムで声を入力とし、自分のなりたい声になるとおもしろいと思ったため
- 新規性:
- 従来手法であるWaveNet法から生成された音声よりも品質の高い音声を作り出すこと
- NSF法で日本語音声合成を実現し、様々な言葉を出力
- 予想される困難:
音声生成できた際の評価システムが定まっていない
- 関連研究:
- 資料:
- Xin Wang, Shinji Takaki, Junichi Yamagish (2018)
Neural source-filter-based waveform model for statistical parametric speech synthesis. arXiv:1810.11946
- 道具、準備、学習
- 研究計画
- 春休み期間
- 音声合成に関する技術について学習
- 従来手法であるWaveNetについて学習
- 機械学習における分類手法の復習
- 春学期
NSF法について学習
NSF法を利用し、プログラム作成
- 秋学期
システムの評価・まとめ
- 評価方法:
- 波及効果: