/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

2L2-OS-09a-3 聴覚系モデルを用いた音のテクスチャ変換

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月24日(Wed) 13:50〜15:30 L会場(ウインクあいち-10F 1003会議室)
2L2-OS-09a オーガナイズドセッション「OS-9 質感と感性(1)」

演題番号2L2-OS-09a-3
題目聴覚系モデルを用いた音のテクスチャ変換
著者上村 卓也(NTTコミュニケーション科学基礎研究所)
寺島 裕貴(日本電信電話株式会社 NTT コミュニケーション科学基礎研究所)
古川 茂人(日本電信電話株式会社 NTTコミュニケーション科学基礎研究所)
時間05月24日(Wed) 14:50〜15:10
概要ある音の内容は保持したままテクスチャのみを変換する手法を提案する。過去に提案された、聴覚系を模擬したモデルによる音のテクスチャ合成と、畳み込みニューラルネットワークによる画像のテクスチャ変換を組み合わせた。本手法では、異なる2音から計算したモデルの出力波形を元に、それぞれの特徴を受け継いだ新たな音を合成する。例として音声や音楽に適用し、水中で喋ったような音声や、鳥の鳴き声のような音楽を合成した。
論文PDFファイル