2019年度に発表された文献の一覧
学術論文誌
- S. Seki, H. Kameoka, L. Li, T. Toda, K. Takeda, "Underdetermined source separation based on generalized multichannel variational autoencoder," IEEE Access, Vol. 7, No. 1, pp. 168104-168115, Dec. 2019.
- P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda, "Voice conversion with CycleRNN-based spectral mapping and finely-tuned WaveNet vocoder," IEEE Access, Vol. 7, No. 1, pp. 171114-171125, Dec. 2019.
- A. Ando, R. Masumura, H. Kamiyama, S. Kobashikawa, Y. Aono, T. Toda, "Customer satisfaction estimation in contact center calls based on a hierarchical multi-task model," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 28, No. 1, pp. 715-728, Jan. 2020.
- 大平 茂輝, 清谷 峻也, 伊藤 瑠哉, 岡本 康佑, 谷川 右京, 出口 大輔, 戸田 智基, "LMS経由で手書きレポートを返却するWebサービス「かみレポ」の開発・評価," 情報処理学会論文誌:教育とコンピュータ, Vol. 6, No.1, pp. 52–68 Feb. 2020.
国際会議
- T. Komatsu, T. Hayashi, R. Kondo, T. Toda, K. Takeda, "Scene-dependent anomalous acoustic-event detection based on conditional WaveNet and i-Vector," Proc. IEEE ICASSP, pp. 870-874, Brighton, UK, May 2019.
- P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda, "Voice conversion with cyclic recurrent neural network and fine-tuned WaveNet vocoder," Proc. IEEE ICASSP, pp. 6815-6819, Brighton, UK, May 2019.
- T. Okamoto, T. Toda, Y. Shiga, H. Kawai, "Investigations of real-time Gaussian FFTNet and parallel WaveNet neural vocoders with simple acoustic features," Proc. IEEE ICASSP, pp. 7020-7024, Brighton, UK, May 2019.
- S. Seki, H. Kameoka, L. Li, T. Toda, K. Takeda, "Generalized multichannel variational autoencoder for underdetermined source separation," Proc. EUSIPCO, 5 pages, A Coruna, Spain, Sep. 2019.
- W.-C. Huang, Y.-C. Wu, H.-T. Hwang, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, Y. Tsao, H.-M. Wang, "Refined WaveNet vocoder for variational autoencoder based voice conversion," Proc. EUSIPCO, 5 pages, A Coruna, Spain, Sep. 2019.
- Y.-C. Wu, T. Hayashi, P.L. Tobing, K. Kobayashi, T. Toda, "Quasi-periodic WaveNet vocoder: a pitch dependent dilated convolution model for parametric speech generation," Proc. INTERSPEECH, pp. 196-200, Graz, Austria, Sep. 2019.
- P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda, "Non-parallel voice conversion with cyclic variational autoencoder," Proc. INTERSPEECH, pp. 674-678, Graz, Austria, Sep. 2019.
- Y. Kurita, K. Kobayashi, K. Takeda, T. Toda, "Robustness of statistical voice conversion based on direct waveform modification against background sounds," Proc. INTERSPEECH, pp. 684-688, Graz, Austria, Sep. 2019.
- W.-C. Huang, Y.-C. Wu, C.-C. Lo, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, Y. Tsao, H.-M. Wang, "Improving variational autoencoder based voice conversion by conditioning on F0 and fully convolutional networks," Proc. INTERSPEECH, pp. 709-713, Graz, Austria, Sep. 2019.
- T. Okamoto, T. Toda, Y. Shiga, H. Kawai, "Real-time neural text-to-speech with sequence-to-sequence acoustic model and WaveGlow or single Gaussian WaveRNN vocoders," Proc. INTERSPEECH, pp. 1308-1312, Graz, Austria, Sep. 2019.
- T. Hayashi, S. Watanabe, T. Toda, K. Takeda, S. Toshniwal, K. Livescu, "Pre-trained text embeddings for enhanced text-to-speech synthesis," Proc. INTERSPEECH, pp. 4430-4434, Graz, Austria, Sep. 2019.
- W.-C. Huang, Y.-C. Wu, K. Kobayashi, Y.-H. Peng, H.-T. Hwang, P.L. Tobing, Y. Tsao, H.-M. Wang, T. Toda, "Generalization of spectrum differential based direct waveform modification for voice conversion," Proc. 10th ISCA Speech Synthesis Workshop (SSW10), pp. 57-62, Vienna, Austria, Sep. 2019.
- Y.-C. Wu, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, "Statistical voice conversion with quasi-periodic WaveNet vocoder," Proc. 10th ISCA Speech Synthesis Workshop (SSW10), pp. 63-68, Vienna, Austria, Sep. 2019.
- M. Eshghi, K. Tanaka, K. Kobayashi, H. Kameoka, T. Toda, "An investigation of features for fundamental frequency pattern prediction in electrolaryngeal speech enhancement," Proc. 10th ISCA Speech Synthesis Workshop (SSW10), pp. 251-256, Vienna, Austria, Sep. 2019.
- F. Ahmadi, K. Kobayashi, T. Toda, "Development of a real-time bionic voice generation system based on statistical excitation prediction," Proc. ACM ASSETS, pp. 655-657, Posters and Demos, Pittsburgh, USA, Oct. 2019.
- L. Li, T. Toda, K. Morikawa, K. Kobayashi, S. Makino, "Improving singing aid system for laryngectomees with statistical voice conversion and VAE-SPACE," Proc. ISMIR, pp. 784-790, Delft, the Netherlands, Nov. 2019.
- P.L. Tobing, T. Hayashi, T. Toda, "Investigation of shallow WaveNet vocoder with Laplacian distribution output," Proc. IEEE ASRU, pp. 176-183, Sentosa, Singapore, Dec. 2019.
- T. Okamoto, T. Toda, Y. Shiga, H. Kawai, "Tacotron-based acoustic model using phoneme alignment for practical neural text-to-speech synthesis," Proc. IEEE ASRU, pp. 214-221, Sentosa, Singapore, Dec. 2019.
著書・解説
- 林 知樹, 戸田 智基, "統計的手法による音響イベント検出," 日本音響学会誌, Vol. 75, No. 9, pp. 532-537, Sep. 2019.
- 戸田 智基, "機械学習と音声生成:音声波形モデリングの進展," 計測と制御, Vol. 58, No. 12, pp. 951-954, Dec. 2019.
講習会
- T. Toda, "Advanced Voice Conversion," Speech Processing Courses in Crete (SPCC), University of Crete, Heraklion, Greece, July 2019.
- T. Toda, "Hands on Voice Conversion," Speech Processing Courses in Crete (SPCC), University of Crete, Heraklion, Greece, July 2019.
- 戸田 智基, "音声分析・合成," 音声認識・音声対話技術講習会, 高度言語情報融合フォーラム(ALAGIN)技術開発部会 音声処理分科会, 京都大学, Aug. 2019.
- T. Toda, K. Kobayashi, T. Hayashi, "Statistical voice conversion with direct waveform modeling" Tutorial, INTERSPEECH 2019, Graz, Austria, Sep. 2019.
招待講演
- 戸田 智基, "音声を変換する技術と機能拡張への応用," 豊田工業大学 研究談話会, Oct. 2019.
- 岡本 拓磨, 戸田 智基, 志賀 芳則, 河井 恒, "音声波形直接生成モデル「ニューラルボコーダ」の比較," 情報処理学会音声言語情報処理研究会, Oct. 2019.(チュートリアル講演)
- 戸田 智基, "音声合成技術の進展," 第3回次期グローバルコミュニケーション計画検討WG, Nov. 2019.
- 林 知樹, 山本 龍一, 井上 勝喜, 吉村 建慶, 武田 一哉, 戸田 智基, 渡部 晋治, "End-to-end音声合成の研究を加速させるオープンソースツールキットESPnet-TTS," 日本音響学会春季研究発表会 スペシャルセッション「end-to-end音声合成とその周辺」, Mar. 2020.
- 戸田 智基, "音声変換技術と音声生成機能拡張への応用," 電子情報通信学会2020年総合大会 ソサイエティ合同企画「情報通信技術と人間相互理解の未来」, Mar. 2020.
研究会
- 彦坂 秀, 小林 和弘, 林 知樹, 関 翔悟, 武田 一哉, 坂野 秀樹, 戸田 智基, "模擬難聴処理を活用した音声波形加工に基づく明瞭度改善," 信学技報, Vol. 119, No. 188, SP2019-13, pp. 25-29, Aug. 2019.
- 安原 和輝, 林 知樹, 戸田 智基, "End-to-End型テキスト音声合成におけるWaveNetボコーダの学習についての調査," 信学技報, Vol. 119, No. 188, SP2019-14, pp. 31-36, Aug. 2019.
- 岡本 拓磨, 戸田 智基, 志賀 芳則, 河井 恒, "音声波形直接生成モデル「ニューラルボコーダ」の比較," 情報処理研報, Vol. 2019-SLP-129, No. 3, pp. 1-6, Oct. 2019.(チュートリアル講演)
- 岡田 慎太郎, 安藤 厚志, 戸田 智基, "発話感情認識における音素事後確率を利用した表現学習とデータ拡張の評価," 信学技報, Vol. 119, No. 321, SP2019-43, pp. 91-96, Dec. 2019.
- 岡本拓磨, 松原 圭亮, 戸田 智基, 志賀 芳則, 河井 恒, "複数話者WaveNetボコーダを用いたニューラル話速変換の試み," 信学技報, Vol. 119, No. 441, SP2019-50, pp. 1-6, Mar. 2020.
- 中谷 輝, Patrick Lumban Tobing, 武田 一哉, 戸田 智基, "CycleVAEを用いたクロスリンガル声質変換," 信学技報, Vol. 119, No. 441, SP2019-88, pp. 219-224, Mar. 2020.
- 関 翔悟, 高田 萌絵, 武田 一哉, 戸田 智基, "変分自己符号化器を用いた空気・体内伝導音の結合音源モデリングに基づく半教師あり自己発声音強調・抑圧," 信学技報, Vol. 119, No. 441, SP2019-89, pp. 225-230, Mar. 2020.
大会講演
- 大竹 徹郎, 関 翔悟, 戸田 智基, "楽曲音源分離のための個別音源マスク推定ネットワークの統合法," 音講論, 1-1-4, pp. 165-166, Sep. 2019.
- 高田 萌絵, 関 翔悟, P.L. Tobing, 戸田 智基, "空気/体内伝導音の対応関係を活用した自己発声音強調/抑圧法," 音講論, 1-1-7, pp. 173-174, Sep. 2019.
- 彦坂 秀, 小林 和弘, 林 知樹, 関 翔悟, 武田 一哉, 坂野 秀樹, 戸田 智基, "模擬難聴処理を活用した補聴器フィルタ設計," 音講論, 1-6-6, pp. 567-568, Sep. 2019.
- 安藤 厚志, 増村 亮, 神山 歩相名, 小橋川 哲, 青野 裕司, 戸田 智基, "コンタクトセンタ顧客満足度推定におけるドメイン適応の検討," 音講論, 2-Q-3, pp. 885-886, Sep. 2019.
- M. Eshghi, K. Tanaka, K. Kobayashi, H. Kameoka, T. Toda, "An investigation of fundamental frequency pattern prediction in electrolaryngeal speech enhancement," 音講論, 2-Q-14, pp. 915-916, Sep. 2019.
- 安原 和輝, 林 知樹, 戸田 智基, "End-to-End型テキスト音声合成におけるWaveNetボコーダの学習に関する調査," 音講論, 1-4-9, pp. 951-952, Sep. 2019.
- 岡本 拓麿, 戸田 智基, 志賀 芳則, 河井 恒, "WaveGlowボコーダを用いたリアルタイムニューラルテキスト音声合成," 音講論, 3-4-3, pp. 985-986, Sep. 2019.
- 宮崎 晃一, 小松 達也, 林 知樹, 渡部 晋治, 戸田 智基, 武田 一哉, "Self-attentionを用いた弱教師あり音響イベント検出," 音講論, 1-1-5, pp. 181-182, Mar. 2020.
- 岡田 慎太郎, 安藤 厚志, 戸田 智基, "発話感情認識における音韻・話者情報の低減," 音講論, 1-4-3, pp. 873-874, Mar. 2020.
- 松原 圭亮, 岡本 拓磨, 高島 遼一, 滝口 哲也, 戸田 智基, 志賀 芳則, 河井 恒, "リアルタイムニューラルボコーダにおける学習データ量の影響の調査," 音講論, 1-2-3, pp. 1045-1048, Mar. 2020.
- 安原 和輝, Yi-Chiao Wu, Patrick Lumban Tobing, 松永 悟行, 大谷 大和, 戸田 智基, "テキスト音声合成におけるポストフィルタとしてのWaveNetボコーダ学習法," 音講論, 1-2-5, pp. 1051-1052, Mar. 2020.
- 林 知樹, 山本 龍一, 井上 勝喜, 吉村 建慶, 武田 一哉, 戸田 智基, 渡部 晋治, "End-to-end音声合成の研究を加速させるオープンソースツールキットESPnet-TTS," 音講論, 1-2-7, pp. 1267-1268, Mar. 2020.(招待講演)
- 岡本 拓磨, 松原 圭亮, 戸田 智基, 志賀 芳則, 河井 恒, "フルコンテキストラベル入力型リアルタイムニューラルテキスト音声合成の比較," 音講論, 1-2-9, pp. 1271-1274, Mar. 2020.
- 戸田 智基, "音声変換技術と音声生成機能拡張への応用," 信学総大, TK-4-1, pp. 34-35, Mar. 2020.(招待講演)
その他発表
- 戸田 智基, "空気・体内伝導音を対象とした音声・音環境情報処理," 2019年度 第1回 住友理工株式会社―名古屋大学 探索型共同研究 テーマ検討会, June 2019.
- 岡田 慎太郎, "音素事後確率を利用したautoencoderに基づく発話感情認識のための特徴量抽出の検討," 第23回東海地区音声関連研究室修士論文中間発表会, 静岡, Aug. 2019.
- 高田 萌絵, "空気/体内伝導マイクロフォンを用いた自己発声音強調・抑圧法に関する研究," 第23回東海地区音声関連研究室修士論文中間発表会, 静岡, Aug. 2019.
- 森川 一穂, "喉頭摘出者のための歌唱支援システムにおける声質変換法の検討," 第23回東海地区音声関連研究室修士論文中間発表会, 静岡, Aug. 2019.【総合二位(受賞者:森川 一穂)】
- 戸田 智基, 高道 慎之介, "音声翻訳のための柔軟な音声合成の進展," 次世代音声言語研究シンポジウム2019, 奈良, Sep. 2019.
- 戸田 智基, "パソコン必携化を活用した授業設計に向けて," 令和元年度第2回名古屋大学情報連携統括本部公開講演会・研究会, 愛知, Oct. 2019.
- T. Toda, "Speech waveform modeling for advanced voice conversion," APSIPA Distinguished Lecture at Carnegie Mellon University, Pittsburgh, USA, Oct. 2019.
- 戸田 智基, "声を変える技術の発展と社会に与える影響," 名古屋大学-NTT技術交流会, Nov. 2019.
- L. Li, T. Toda, K. Morikawa, K. Kobayashi, S. Makino, "Improving singing aid system for laryngectomees with statistical voice conversion and VAE-SPACE," 情報処理学会音楽情報科学研究会,国際会議既発表セッション, Nov. 2019.
- T. Toda, "Creation of cooperative human augmentation techniques in sound media communication," 第2回JST-ANR連携「共生インタラクション」国際シンポジウム2019, 東京, Dec. 2019.
- T. Toda, "Speech waveform modeling for advanced voice conversion," APSIPA Distinguished Lecture in Winter Seminar Series on Human Language Technology, National University of Singapore, Singapore, Dec. 2019.
- Y.-C. Wu, "Quasi-Periodic WaveNet: an autoregressive raw waveform generative model with pitch-dependent dilated convolution neural network," Talk at Seminar, Research Center for Information Technology Innovation, Academia Sinica, Taipei, Taiwan, Jan. 2020.
- 戸田 智基, "周りに内緒で通話できるか," 名古屋大学高等教育院 卓越・先端・次世代シンポジウム, 愛知, Jan. 2020.
- 戸田 智基, "音声コミュニケーションにおける機能拡張," 名古屋大学 情報学シンポジウム2020, 愛知, Jan. 2020.
- 戸田 智基, "ユーザの適応能力を活用する共創型音声生成機能拡張技術の構築," JSTさきがけ「新しい社会システムデザインに向けた情報基盤技術の創出」研究成果報告会, 東京, Jan. 2020.
- 森 健策,戸田 智基, 楫 勇一, "名古屋大学における情報基盤を活用したCOVID-19対応 - オンライン学習の観点から," 国立情報学研究所「大学の情報環境のあり方検討会」4月からの大学等遠隔授業に関する取組状況共有サイバーシンポジウム, オンライン, Mar. 2020.
博士論文
- Patrick Lumban Tobing, "High-quality and flexible voice conversion techniques based on statistical spectral and waveform modeling," 情報科学研究科メディア科学専攻博士論文, Feb. 2020.
修士論文
- 内野 達貴, "嚥下音による嚥下障害診断のための咽頭残留識別に関する研究," 情報学研究科知能システム学専攻修士論文, Feb. 2020.
- 岡田 慎太郎, "発話感情認識のための特徴抽出における冗長情報の低減," 情報学研究科知能システム学専攻修士論文, Feb. 2020.
- 高田 萌絵, "空気・体内伝導マイクロフォンアレイを用いた自己発声音強調/抑圧に関する研究," 情報学研究科知能システム学専攻修士論文, Feb. 2020.
- 森川 一穂, "喉頭摘出者のための歌唱支援における電気音声変換に関する研究," 情報学研究科知能システム学専攻修士論文, Feb. 2020.
卒業論文
- 犬塚 雅也, "環境音の記号表現獲得に向けた教師なし学習法に関する検討," 令和元年度情報工学コース卒業研究報告, Feb. 2020.
- 中島 健斗, "リアルタイム統計的声質変換における聴覚フィードバックに関する検討," 令和元年度情報工学コース卒業研究報告, Feb. 2020.