発表文献

2019年度に発表された文献の一覧

学術論文誌

S. Seki, H. Kameoka, L. Li, T. Toda, K. Takeda, "Underdetermined source separation based on generalized multichannel variational autoencoder," IEEE Access, Vol. 7, No. 1, pp. 168104-168115, Dec. 2019.
P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda, "Voice conversion with CycleRNN-based spectral mapping and finely-tuned WaveNet vocoder," IEEE Access, Vol. 7, No. 1, pp. 171114-171125, Dec. 2019.
A. Ando, R. Masumura, H. Kamiyama, S. Kobashikawa, Y. Aono, T. Toda, "Customer satisfaction estimation in contact center calls based on a hierarchical multi-task model," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 28, No. 1, pp. 715-728, Jan. 2020.
大平茂輝, 清谷峻也, 伊藤瑠哉, 岡本康佑, 谷川右京, 出口大輔, 戸田智基, "LMS経由で手書きレポートを返却するWebサービス「かみレポ」の開発・評価," 情報処理学会論文誌：教育とコンピュータ, Vol. 6, No.1, pp. 52–68 Feb. 2020.

国際会議

T. Komatsu, T. Hayashi, R. Kondo, T. Toda, K. Takeda, "Scene-dependent anomalous acoustic-event detection based on conditional WaveNet and i-Vector," Proc. IEEE ICASSP, pp. 870-874, Brighton, UK, May 2019.
P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda, "Voice conversion with cyclic recurrent neural network and fine-tuned WaveNet vocoder," Proc. IEEE ICASSP, pp. 6815-6819, Brighton, UK, May 2019.
T. Okamoto, T. Toda, Y. Shiga, H. Kawai, "Investigations of real-time Gaussian FFTNet and parallel WaveNet neural vocoders with simple acoustic features," Proc. IEEE ICASSP, pp. 7020-7024, Brighton, UK, May 2019.
S. Seki, H. Kameoka, L. Li, T. Toda, K. Takeda, "Generalized multichannel variational autoencoder for underdetermined source separation," Proc. EUSIPCO, 5 pages, A Coruna, Spain, Sep. 2019.
W.-C. Huang, Y.-C. Wu, H.-T. Hwang, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, Y. Tsao, H.-M. Wang, "Refined WaveNet vocoder for variational autoencoder based voice conversion," Proc. EUSIPCO, 5 pages, A Coruna, Spain, Sep. 2019.
Y.-C. Wu, T. Hayashi, P.L. Tobing, K. Kobayashi, T. Toda, "Quasi-periodic WaveNet vocoder: a pitch dependent dilated convolution model for parametric speech generation," Proc. INTERSPEECH, pp. 196-200, Graz, Austria, Sep. 2019.
P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda, "Non-parallel voice conversion with cyclic variational autoencoder," Proc. INTERSPEECH, pp. 674-678, Graz, Austria, Sep. 2019.
Y. Kurita, K. Kobayashi, K. Takeda, T. Toda, "Robustness of statistical voice conversion based on direct waveform modification against background sounds," Proc. INTERSPEECH, pp. 684-688, Graz, Austria, Sep. 2019.
W.-C. Huang, Y.-C. Wu, C.-C. Lo, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, Y. Tsao, H.-M. Wang, "Improving variational autoencoder based voice conversion by conditioning on F0 and fully convolutional networks," Proc. INTERSPEECH, pp. 709-713, Graz, Austria, Sep. 2019.
T. Okamoto, T. Toda, Y. Shiga, H. Kawai, "Real-time neural text-to-speech with sequence-to-sequence acoustic model and WaveGlow or single Gaussian WaveRNN vocoders," Proc. INTERSPEECH, pp. 1308-1312, Graz, Austria, Sep. 2019.
T. Hayashi, S. Watanabe, T. Toda, K. Takeda, S. Toshniwal, K. Livescu, "Pre-trained text embeddings for enhanced text-to-speech synthesis," Proc. INTERSPEECH, pp. 4430-4434, Graz, Austria, Sep. 2019.
W.-C. Huang, Y.-C. Wu, K. Kobayashi, Y.-H. Peng, H.-T. Hwang, P.L. Tobing, Y. Tsao, H.-M. Wang, T. Toda, "Generalization of spectrum differential based direct waveform modification for voice conversion," Proc. 10th ISCA Speech Synthesis Workshop (SSW10), pp. 57-62, Vienna, Austria, Sep. 2019.
Y.-C. Wu, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, "Statistical voice conversion with quasi-periodic WaveNet vocoder," Proc. 10th ISCA Speech Synthesis Workshop (SSW10), pp. 63-68, Vienna, Austria, Sep. 2019.
M. Eshghi, K. Tanaka, K. Kobayashi, H. Kameoka, T. Toda, "An investigation of features for fundamental frequency pattern prediction in electrolaryngeal speech enhancement," Proc. 10th ISCA Speech Synthesis Workshop (SSW10), pp. 251-256, Vienna, Austria, Sep. 2019.
F. Ahmadi, K. Kobayashi, T. Toda, "Development of a real-time bionic voice generation system based on statistical excitation prediction," Proc. ACM ASSETS, pp. 655-657, Posters and Demos, Pittsburgh, USA, Oct. 2019.
L. Li, T. Toda, K. Morikawa, K. Kobayashi, S. Makino, "Improving singing aid system for laryngectomees with statistical voice conversion and VAE-SPACE," Proc. ISMIR, pp. 784-790, Delft, the Netherlands, Nov. 2019.
P.L. Tobing, T. Hayashi, T. Toda, "Investigation of shallow WaveNet vocoder with Laplacian distribution output," Proc. IEEE ASRU, pp. 176-183, Sentosa, Singapore, Dec. 2019.
T. Okamoto, T. Toda, Y. Shiga, H. Kawai, "Tacotron-based acoustic model using phoneme alignment for practical neural text-to-speech synthesis," Proc. IEEE ASRU, pp. 214-221, Sentosa, Singapore, Dec. 2019.

著書・解説

林知樹, 戸田智基, "統計的手法による音響イベント検出," 日本音響学会誌, Vol. 75, No. 9, pp. 532-537, Sep. 2019.
戸田智基, "機械学習と音声生成：音声波形モデリングの進展," 計測と制御, Vol. 58, No. 12, pp. 951-954, Dec. 2019.

講習会

T. Toda, "Advanced Voice Conversion," Speech Processing Courses in Crete (SPCC), University of Crete, Heraklion, Greece, July 2019.
T. Toda, "Hands on Voice Conversion," Speech Processing Courses in Crete (SPCC), University of Crete, Heraklion, Greece, July 2019.
戸田智基, "音声分析・合成," 音声認識・音声対話技術講習会, 高度言語情報融合フォーラム（ALAGIN）技術開発部会　音声処理分科会, 京都大学, Aug. 2019.
T. Toda, K. Kobayashi, T. Hayashi, "Statistical voice conversion with direct waveform modeling" Tutorial, INTERSPEECH 2019, Graz, Austria, Sep. 2019.

招待講演

戸田智基, "音声を変換する技術と機能拡張への応用," 豊田工業大学研究談話会, Oct. 2019.
岡本拓磨, 戸田智基, 志賀芳則, 河井恒, "音声波形直接生成モデル「ニューラルボコーダ」の比較," 情報処理学会音声言語情報処理研究会, Oct. 2019.（チュートリアル講演）
戸田智基, "音声合成技術の進展," 第3回次期グローバルコミュニケーション計画検討WG, Nov. 2019.
林知樹, 山本龍一, 井上勝喜, 吉村建慶, 武田一哉, 戸田智基, 渡部晋治, "End-to-end音声合成の研究を加速させるオープンソースツールキットESPnet-TTS," 日本音響学会春季研究発表会スペシャルセッション「end-to-end音声合成とその周辺」, Mar. 2020.
戸田智基, "音声変換技術と音声生成機能拡張への応用," 電子情報通信学会2020年総合大会ソサイエティ合同企画「情報通信技術と人間相互理解の未来」, Mar. 2020.

研究会

彦坂秀, 小林和弘, 林知樹, 関翔悟, 武田一哉, 坂野秀樹, 戸田智基, "模擬難聴処理を活用した音声波形加工に基づく明瞭度改善," 信学技報, Vol. 119, No. 188, SP2019-13, pp. 25-29, Aug. 2019.
安原和輝, 林知樹, 戸田智基, "End-to-End型テキスト音声合成におけるWaveNetボコーダの学習についての調査," 信学技報, Vol. 119, No. 188, SP2019-14, pp. 31-36, Aug. 2019.
岡本拓磨, 戸田智基, 志賀芳則, 河井恒, "音声波形直接生成モデル「ニューラルボコーダ」の比較," 情報処理研報, Vol. 2019-SLP-129, No. 3, pp. 1-6, Oct. 2019.（チュートリアル講演）
岡田慎太郎, 安藤厚志, 戸田智基, "発話感情認識における音素事後確率を利用した表現学習とデータ拡張の評価," 信学技報, Vol. 119, No. 321, SP2019-43, pp. 91-96, Dec. 2019.
岡本拓磨, 松原圭亮, 戸田智基, 志賀芳則, 河井恒, "複数話者WaveNetボコーダを用いたニューラル話速変換の試み," 信学技報, Vol. 119, No. 441, SP2019-50, pp. 1-6, Mar. 2020.
中谷輝, Patrick Lumban Tobing, 武田一哉, 戸田智基, "CycleVAEを用いたクロスリンガル声質変換," 信学技報, Vol. 119, No. 441, SP2019-88, pp. 219-224, Mar. 2020.
関翔悟, 高田萌絵, 武田一哉, 戸田智基, "変分自己符号化器を用いた空気・体内伝導音の結合音源モデリングに基づく半教師あり自己発声音強調・抑圧," 信学技報, Vol. 119, No. 441, SP2019-89, pp. 225-230, Mar. 2020.

大会講演

大竹徹郎, 関翔悟, 戸田智基, "楽曲音源分離のための個別音源マスク推定ネットワークの統合法," 音講論, 1-1-4, pp. 165-166, Sep. 2019.
高田萌絵, 関翔悟, P.L. Tobing, 戸田智基, "空気／体内伝導音の対応関係を活用した自己発声音強調／抑圧法," 音講論, 1-1-7, pp. 173-174, Sep. 2019.
彦坂秀, 小林和弘, 林知樹, 関翔悟, 武田一哉, 坂野秀樹, 戸田智基, "模擬難聴処理を活用した補聴器フィルタ設計," 音講論, 1-6-6, pp. 567-568, Sep. 2019.
安藤厚志, 増村亮, 神山歩相名, 小橋川哲, 青野裕司, 戸田智基, "コンタクトセンタ顧客満足度推定におけるドメイン適応の検討," 音講論, 2-Q-3, pp. 885-886, Sep. 2019.
M. Eshghi, K. Tanaka, K. Kobayashi, H. Kameoka, T. Toda, "An investigation of fundamental frequency pattern prediction in electrolaryngeal speech enhancement," 音講論, 2-Q-14, pp. 915-916, Sep. 2019.
安原和輝, 林知樹, 戸田智基, "End-to-End型テキスト音声合成におけるWaveNetボコーダの学習に関する調査," 音講論, 1-4-9, pp. 951-952, Sep. 2019.
岡本拓麿, 戸田智基, 志賀芳則, 河井恒, "WaveGlowボコーダを用いたリアルタイムニューラルテキスト音声合成," 音講論, 3-4-3, pp. 985-986, Sep. 2019.
宮崎晃一, 小松達也, 林知樹, 渡部晋治, 戸田智基, 武田一哉, "Self-attentionを用いた弱教師あり音響イベント検出," 音講論, 1-1-5, pp. 181-182, Mar. 2020.
岡田慎太郎, 安藤厚志, 戸田智基, "発話感情認識における音韻・話者情報の低減," 音講論, 1-4-3, pp. 873-874, Mar. 2020.
松原圭亮, 岡本拓磨, 高島遼一, 滝口哲也, 戸田智基, 志賀芳則, 河井恒, "リアルタイムニューラルボコーダにおける学習データ量の影響の調査," 音講論, 1-2-3, pp. 1045-1048, Mar. 2020.
安原和輝, Yi-Chiao Wu, Patrick Lumban Tobing, 松永悟行, 大谷大和, 戸田智基, "テキスト音声合成におけるポストフィルタとしてのWaveNetボコーダ学習法," 音講論, 1-2-5, pp. 1051-1052, Mar. 2020.
林知樹, 山本龍一, 井上勝喜, 吉村建慶, 武田一哉, 戸田智基, 渡部晋治, "End-to-end音声合成の研究を加速させるオープンソースツールキットESPnet-TTS," 音講論, 1-2-7, pp. 1267-1268, Mar. 2020.（招待講演）
岡本拓磨, 松原圭亮, 戸田智基, 志賀芳則, 河井恒, "フルコンテキストラベル入力型リアルタイムニューラルテキスト音声合成の比較," 音講論, 1-2-9, pp. 1271-1274, Mar. 2020.
戸田智基, "音声変換技術と音声生成機能拡張への応用," 信学総大, TK-4-1, pp. 34-35, Mar. 2020.（招待講演）

その他発表

戸田智基, "空気・体内伝導音を対象とした音声・音環境情報処理," 2019年度第1回住友理工株式会社―名古屋大学探索型共同研究テーマ検討会, June 2019.
岡田慎太郎, "音素事後確率を利用したautoencoderに基づく発話感情認識のための特徴量抽出の検討," 第23回東海地区音声関連研究室修士論文中間発表会, 静岡, Aug. 2019.
高田萌絵, "空気／体内伝導マイクロフォンを用いた自己発声音強調・抑圧法に関する研究," 第23回東海地区音声関連研究室修士論文中間発表会, 静岡, Aug. 2019.
森川一穂, "喉頭摘出者のための歌唱支援システムにおける声質変換法の検討," 第23回東海地区音声関連研究室修士論文中間発表会, 静岡, Aug. 2019.【総合二位（受賞者：森川一穂）】
戸田智基, 高道慎之介, "音声翻訳のための柔軟な音声合成の進展," 次世代音声言語研究シンポジウム2019, 奈良, Sep. 2019.
戸田智基, "パソコン必携化を活用した授業設計に向けて," 令和元年度第2回名古屋大学情報連携統括本部公開講演会・研究会, 愛知, Oct. 2019.
T. Toda, "Speech waveform modeling for advanced voice conversion," APSIPA Distinguished Lecture at Carnegie Mellon University, Pittsburgh, USA, Oct. 2019.
戸田智基, "声を変える技術の発展と社会に与える影響," 名古屋大学-NTT技術交流会, Nov. 2019.
L. Li, T. Toda, K. Morikawa, K. Kobayashi, S. Makino, "Improving singing aid system for laryngectomees with statistical voice conversion and VAE-SPACE," 情報処理学会音楽情報科学研究会，国際会議既発表セッション, Nov. 2019.
T. Toda, "Creation of cooperative human augmentation techniques in sound media communication," 第2回JST-ANR連携「共生インタラクション」国際シンポジウム2019, 東京, Dec. 2019.
T. Toda, "Speech waveform modeling for advanced voice conversion," APSIPA Distinguished Lecture in Winter Seminar Series on Human Language Technology, National University of Singapore, Singapore, Dec. 2019.
Y.-C. Wu, "Quasi-Periodic WaveNet: an autoregressive raw waveform generative model with pitch-dependent dilated convolution neural network," Talk at Seminar, Research Center for Information Technology Innovation, Academia Sinica, Taipei, Taiwan, Jan. 2020.
戸田智基, "周りに内緒で通話できるか," 名古屋大学高等教育院卓越・先端・次世代シンポジウム, 愛知, Jan. 2020.
戸田智基, "音声コミュニケーションにおける機能拡張," 名古屋大学情報学シンポジウム2020, 愛知, Jan. 2020.
戸田智基, "ユーザの適応能力を活用する共創型音声生成機能拡張技術の構築," JSTさきがけ「新しい社会システムデザインに向けた情報基盤技術の創出」研究成果報告会, 東京, Jan. 2020.
森健策，戸田智基, 楫勇一, "名古屋大学における情報基盤を活用したCOVID-19対応 - オンライン学習の観点から," 国立情報学研究所「大学の情報環境のあり方検討会」4月からの大学等遠隔授業に関する取組状況共有サイバーシンポジウム, オンライン, Mar. 2020.

博士論文

Patrick Lumban Tobing, "High-quality and flexible voice conversion techniques based on statistical spectral and waveform modeling," 情報科学研究科メディア科学専攻博士論文, Feb. 2020.

修士論文

内野達貴, "嚥下音による嚥下障害診断のための咽頭残留識別に関する研究," 情報学研究科知能システム学専攻修士論文, Feb. 2020.
岡田慎太郎, "発話感情認識のための特徴抽出における冗長情報の低減," 情報学研究科知能システム学専攻修士論文, Feb. 2020.
高田萌絵, "空気・体内伝導マイクロフォンアレイを用いた自己発声音強調／抑圧に関する研究," 情報学研究科知能システム学専攻修士論文, Feb. 2020.
森川一穂, "喉頭摘出者のための歌唱支援における電気音声変換に関する研究," 情報学研究科知能システム学専攻修士論文, Feb. 2020.

卒業論文

犬塚雅也, "環境音の記号表現獲得に向けた教師なし学習法に関する検討," 令和元年度情報工学コース卒業研究報告, Feb. 2020.
中島健斗, "リアルタイム統計的声質変換における聴覚フィードバックに関する検討," 令和元年度情報工学コース卒業研究報告, Feb. 2020.

名古屋大学大学院情報学研究科戸田研究室

音メディア情報処理で新たな未来を切り拓く

発表文献

2019年度に発表された文献の一覧

学術論文誌

国際会議

著書・解説

講習会

招待講演

研究会

大会講演

その他発表

博士論文

修士論文

卒業論文

他の年度はこちら