/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2011ホーム /

3B1-OS22c-2 調音運動のone-modelを用いた音声認識・合成の改良

06月03日(Fri) 13:00〜17:30 B会場(150名-研修室812)
3B2-OS22c オーガナイズドセッション「OS-22 記号創発ロボティクスとマルチモーダルセマンティックインタラクション (3)」

演題番号3B1-OS22c-2
題目調音運動のone-modelを用いた音声認識・合成の改良
著者新田 恒雄(豊橋技術科学大学 大学院工学研究科 情報・知能工学専攻)
小野田 高幸(豊橋技術科学大学 大学院工学研究科 情報・知能工学専攻)
荒木 厚太(豊橋技術科学大学 大学院工学研究科 情報・知能工学専攻)
入部 百合絵(豊橋技術科学大学 情報メディア基盤センター)
桂田 浩一(豊橋技術科学大学 大学院工学研究科 情報・知能工学専攻)
時間06月03日(Fri) 13:20〜13:40
概要音声認識と音声合成を共通の調音運動HMMを利用して実現する方式を開発している。今回の報告では,これまでのmonophoneからtriphoneとすると共に,調音運動の時間制御精度を向上させることで,標準的なMFCCのtriphoneを凌ぐ音声認識性能が得られることを示す。また音声合成では,音源の改良を行い,CELP方式の符号帳設計を改良することで,MOS値4の高い音質が得られることを示す。
論文PDFファイル