2L2-OS-09a-3 聴覚系モデルを用いた音のテクスチャ変換

*セッションの無断動画配信はご遠慮下さい。

05月24日(Wed) 13:50〜15:30 L会場(ウインクあいち-10F 1003会議室)
2L2-OS-09a オーガナイズドセッション「OS-9 質感と感性（１）」

演題番号	2L2-OS-09a-3
題目	聴覚系モデルを用いた音のテクスチャ変換
著者	上村卓也(NTTコミュニケーション科学基礎研究所) 寺島裕貴(日本電信電話株式会社 NTT コミュニケーション科学基礎研究所) 古川茂人(日本電信電話株式会社　NTTコミュニケーション科学基礎研究所)
時間	05月24日(Wed) 14:50〜15:10
概要	ある音の内容は保持したままテクスチャのみを変換する手法を提案する。過去に提案された、聴覚系を模擬したモデルによる音のテクスチャ合成と、畳み込みニューラルネットワークによる画像のテクスチャ変換を組み合わせた。本手法では、異なる2音から計算したモデルの出力波形を元に、それぞれの特徴を受け継いだ新たな音を合成する。例として音声や音楽に適用し、水中で喋ったような音声や、鳥の鳴き声のような音楽を合成した。
論文	PDFファイル