2017年度に発表された文献の一覧
学術論文誌
- K. Tanaka, T. Toda, S. Nakamura, "A vibration control method of an electrolarynx based on statistical F0 pattern prediction," IEICE Transactions on Information and Systems, Vol. E100-D, No. 9, pp. 2165-2173, Sep. 2017.
- T. Hayashi, S. Watanabe, T. Toda, J. Le Roux, T. Hori, K. Takeda, "Duration-controlled LSTM for polyphonic sound event detection," IEEE Transactions on Audio, Speech and Language Processing, Vol. 25, No. 11, pp. 2059-2070, Nov. 2017.【IEEE Signal Processing Society Japan Young Author Best Paper Award(受賞者:Tomoki Hayashi)】
- P.L. Tobing, K. Kobayashi, T. Toda, "Articulatory controllable speech modification based on statistical inversion and production mappings," IEEE Transactions on Audio, Speech and Language Processing, Vol. 25, No. 12, pp. 2337-2350, Dec. 2017.
- T. Hayashi, M. Nishida, N. Kitaoka, T. Toda, K. Takeda, "Daily activity recognition with large-scaled real-life recording datasets based on deep neural network using multi-modal signals," IEICE Transactions on Fundamentals, Vol. E101-A, No. 1, pp. 199-210, Jan. 2018.
レター
- T. Okamoto, K. Tachibana, T. Toda, Y. Shiga, H. Kawai, "Deep neural network-based power spectrum reconstruction to improve quality of vocoded speech with limited acoustic parameters," Acoustical Science and Technology, Acoustical Letter, Vol. 39, No. 2, pp. 163-166, Mar. 2018.
国際会議
- H. Kawahara, K. Sakakibara, M. Morise, H. Banno, T. Toda, "A modulation property of time-frequency derivatives of filtered phase and its application to aperiodicity and FO estimation," Proc. INTERSPEECH, pp. 424-428, Stockholm, Sweden, Aug. 2017.
- K. Tanaka, H. Kameoka, T. Toda, S. Nakamura, "Physically constrained statistical F0 prediction for electrolaryngeal speech enhancement," Proc. INTERSPEECH, pp. 1069-1073, Stockholm, Sweden, Aug. 2017.
- A. Tamamori, T. Hayashi, K. Takeda, T. Toda, "Speaker-dependent WaveNet vocoder," Proc. INTERSPEECH, pp. 1118-1122, Stockholm, Sweden, Aug. 2017.
- K. Kobayashi, T. Hayashi, A. Tamamori, T. Toda, "Statistical voice conversion with WaveNet-based waveform generation," Proc. INTERSPEECH, pp. 1138-1142, Stockholm, Sweden, Aug. 2017.
- H. Kawahara, K. Sakakibara, H. Banno, M. Morise, T. Toda, T. Irino, "A new cosine series antialiasing function and its application to aliasing-free glottal source models for speech and singing synthesis," Proc. INTERSPEECH, pp. 1358-1362, Stockholm, Sweden, Aug. 2017.
- L. Li, H. Kameoka, T. Toda, S. Makino, "Speech enhancement using non-negative spectrogram models with mel-generalized cepstral regularization," Proc. INTERSPEECH, pp. 1998-2002, Stockholm, Sweden, Aug. 2017.
- S. Seki, T. Toda, K. Takeda, "Stereophonic music separation based on non-negative tensor factorization with cepstrum regularization," Proc. EUSIPCO, pp. 1011-1015, Kos island, Greece, Aug. 2017.
- S. Seki, H. Kameoka, T. Toda, K. Takeda, "Missing component restoration for masked speech signals based on time-domain spectrogram factorization," Proc. MLSP, 6 pages, Tokyo, Japan, Sep. 2017.【Nominated for Best Student Paper Award (Nominee: Shogo Seki)】
- K. Morikawa, T. Toda, "Electrolaryngeal speech modification towards singing aid system for laryngectomees," Proc. APSIPA, 4 pages, Kuala Lumpur, Malaysia, Dec. 2017.
- P.L. Tobing, H. Kameoka, T. Toda, "Deep acoustic-to-articulatory inversion mapping with latent trajectory modeling," Proc. APSIPA, 4 pages, Kuala Lumpur, Malaysia, Dec. 2017.
- A. Tamamori, T. Hayashi, T. Toda, K. Takeda, "Investigation of effectiveness on recurrent neural network for daily activity recognition using multi-modal signals," Proc. APSIPA, 7 pages, Kuala Lumpur, Malaysia, Dec. 2017.
- K. Kubo, K. Kobayashi, T. Toda, G. Neubig, S. Sakti, S. Nakamura, "An Investigation of how to design control parameters for statistical voice timbre control," Proc. APSIPA, 4 pages, Kuala Lumpur, Malaysia, Dec. 2017.
- H. Kawahara, K. Sakakibara, M. Morise, H. Banno, T. Toda, "Accurate estimation of fo and aperiodicity based on periodicity detector residuals and deviations of phase derivatives," Proc. APSIPA, 9 pages, Kuala Lumpur, Malaysia, Dec. 2017.
- T. Okamoto, K. Tachibana, T. Toda, Y. Shiga, H. Kawai, "Subband WaveNet with overlapped single-sideband filterbanks," Proc. IEEE ASRU, pp. 698-704, Okinawa, Japan, Dec. 2017.
- T. Hayashi, A. Tamamori, K. Kobayashi, K. Takeda, T. Toda, "An investigation of multi-speaker training for WaveNet vocoder," Proc. IEEE ASRU, pp. 712-718, Okinawa, Japan, Dec. 2017.
著書・解説
- 戸田 智基, "声質変換," 人工知能学大辞典,共立出版, pp. 780-781, July 2017.
- 戸田 智基, 小林 和弘, "統計的声質変換ソフトウェア入門," システム/制御/情報, システム制御情報学会, Vol. 62, No. 2, pp. 69-75, Feb. 2018.
講習会
- 戸田 智基, Graham Neubig, "系列データモデリングの基礎と最近のトピックス," 日本音響学会第155回技術講習会, 日本音響学会, 早稲田大学, June 2017.
招待講演
- 戸田 智基, "音声の声質を変換する技術とその応用," 2017年度人工知能学会全国大会, オーガナイズドセッション OS-9 質感と感性, May 2017.
- 戸田 智基, "WaveNetが音声合成研究に与える影響," 電子情報通信学会音声研究会, Vol. 117, No. 393, SP2017-80, page 79, Jan. 2018.
研究会
- 関 翔悟, 戸田 智基, 武田 一哉, "ケプストラム距離正則化を用いた半教師ありステレオチャネル楽曲音源分離," 情報処理研報, Vol. 2017-MUS-115, No. 18, pp. 1-6, June 2017.
- 森川 一穂, 戸田 智基, "喉頭摘出者のための歌唱支援を目指した統計的電気音声変換法," 情報処理研報, Vol. 2017-MUS-115, No. 27, pp. 1-6, June 2017.
- 山田 智也, 関 翔悟, 小林 和弘, 戸田 智基, "歌声分離ならびに統計的歌声声質変換に基づく楽曲中の歌声加工," 情報処理研報, Vol. 2017-MUS-115, No. 30, pp. 1-6, June 2017.【音学シンポジウム2017学生奨励賞(受賞者:山田 智也)】
- 林 知樹, 渡部 晋治, 戸田 智基, 堀 貴明, Jonathan Le Roux, 武田 一哉, "イベント継続長を明示的に制御したBLSTM-HSMMハイブリッドモデルによる多重音響イベント検出," 信学技報, Vol. 117, No. 138, EA2017-2, pp. 9-14, July 2017.
- 野田 聖太, 林 知樹, 戸田 智基, 武田 一哉, "DNN適応に基づく非可聴つぶやき認識用話者・環境依存音響モデルの構築," 信学技報, vol. 117, No. 368, SP2017-56, pp. 7-10, Dec. 2017.
- 武山 知弘, 小林 和弘, 戸田 智基, 武田 一哉, "雑音環境下における音声了解度向上に向けた音声波形加工手法の評価," 信学技報, vol. 117, No. 368, SP2017-57, pp. 11-16, Dec. 2017.
- 戸田 智基, "WaveNetが音声合成研究に与える影響," 信学技報, Vol. 117, No. 393, SP2017-80, page 79, Jan. 2018.
- 林 知樹, 小林 和弘, 玉森 聡, 武田 一哉, 戸田 智基, "複数話者WaveNetボコーダに関する調査," 信学技報, Vol. 117, No. 393, SP2017-81, pp. 81-86, Jan. 2018.
- 小林 和弘, 林 知樹, 玉森 聡, 戸田 智基, "WaveNetボコーダを用いた統計的音声変換法," 信学技報, Vol. 117, No. 393, SP2017-82, pp. 87-92, Jan. 2018.
- P.L. Tobing, Y.-C. Wu,T. Hayashi,K. Kobayashi,T. Toda, "Development of NU voice conversion system 2018," 信学技報, Vol. 117, No. 517, SP2017-121, pp. 203-208, Mar. 2018.
- 山田 智也, 関 翔悟, 小林 和弘, 戸田 智基, "統計的手法に基づく楽曲中の歌声加工のための歌声分離法の検討," 信学技報, Vol. 117, No. 517, SP2017-122, pp. 209-214, Mar. 2018.
- M. Eshghi, K. Kobayashi,T. Toda, "A hybrid approach to electrolaryngeal speech enhancement based on log-spectral differential conversion and noise suppression," 信学技報, Vol. 117, No. 517, SP2017-124, pp. 221-226, Mar. 2018.
- Y.-C. Wu, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, "Development of NU non-parallel voice conversion system 2018," 信学技報, Vol. 117, No. 517, SP2017-155, pp. 385-390, Mar. 2018.
大会講演
- 田尻 祐介, 亀岡 弘和, 戸田 智基, "実環境下サイレント音声通話に向けた統計的非可聴つぶやき強調のための外部雑音抑圧法," サイレント音声認識ワークショップ, No. 7, Sep. 2017.
- 野田 聖太, 林 知樹, 戸田 智基, 武田 一哉, "非可聴つぶやき認識のための深層学習に基づく音響モデリング," 平成29年度電気・電子・情報関係学会東海支部連合大会, B2-1, 1 page, Sep. 2017.
- 宮崎 晃一, 林 知樹, 戸田 智基, 武田 一哉, "CTCに基づく音響イベントから擬音語表現への変換," 音講論, 1-10-7, pp. 19-20, Sep. 2017.【第16回日本音響学会学生優秀発表賞(受賞者:宮崎 晃一)】
- 森川 一穂, 戸田 智基, "喉頭摘出者のための歌唱支援を目指した電気音声から歌声への変換法," 音講論, 1-8-17, pp. 211-212, Sep. 2017.
- 岡本 拓麿, 橘 健太郎, 戸田 智基, 志賀 芳則, 河井 恒, "サブバンド処理に基づくWaveNetの高速化," 音講論, 2-Q-18, pp. 277-280, Sep. 2017.
- 林 知樹, 玉森 聡, 小林 和弘, 武田 一哉, 戸田 智基, "WaveNetボコーダ学習における複数話者音声データの利用に関する検討," 音講論, 2-Q-20, pp. 285-286, Sep. 2017.
- 清谷 竣也, 伊藤 瑠哉, 岡本 康佑, 谷川 右京, 大平 茂輝, 出口 大輔, 戸田 智基, "名古屋大学におけるサーバ型紙レポート・LMS連携システムの開発," 大学ICT推進協議会 2017年度年次大会, 8 pages, Dec. 2017.【大学ICT推進協議会2017年度年次大会 優秀論文賞】
- 高田 萌絵, "空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音制御法," 平成29年度電子情報通信学会東海支部卒業研究発表会, A-3-3, 1 page, Mar. 2018.
- P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda, "Development of NU voice conversion system for Voice Conversion Challenge 2018," 音講論, 1-9-4, pp. 215-216, Mar. 2018.
- Y.-C. Wu, P.L. Tobing, T. Hayashi, K. Kobayashi, T. Toda, "Development of NU non-parallel voice conversion system for Voice Conversion Challenge 2018," 音講論, 1-9-5, pp. 217-218, Mar. 2018.
- 田中 宏, 亀岡 弘和, 森川 一穂, "VAE-SPACE: 音声F0パターンの深層生成モデル," 音講論, 2-9-4, pp. 229-230, Mar. 2018.
- 林 知樹, 小林 和弘, 玉森 聡, 武田 一哉, 戸田 智基, "WaveNet ボコーダにおける学習データ量の影響に関する調査," 音講論, 3-8-11, pp. 249-250, Mar. 2018.
- 岡本 拓磨, 橘 健太郎, 戸田 智基, 志賀 芳則, 河井 恒, "サブバンドWaveNetボコーダによる全可聴帯域音声合成の検討," 音講論, 3-8-12, pp. 251-254, Mar. 2018.
- 小林 和弘, 戸田 智基, "統計的音声変換ソフトウェア “sprocket”," 音講論, 1-Q-31, pp. 283-284, Mar. 2018.
- M. Eshghi, K. Kobayashi,T. Toda, "Electrolaryngeal speech enhancement based on vocoder-free statistical voice conversion and noise suppression," 音講論, 2-Q-24, pp. 329-330, Mar. 2018.
その他発表
- 緒方 広明, 稲垣 知宏, 中野 裕司, 竹村 治雄, 柴山 悦哉, 島田 敬士, 戸田 智基, 三石 大, 梶田 将司, 重田 勝介, "大学教育とラーニングアナリティクス基盤," 第16回情報科学技術フォーラム(FIT2017), イベント企画, Sep. 2017.
- J. Yamagishi, J. Lorenzo-Trueba, T. Toda, D. Saito, F. Villavicencio, T. Kinnunen, Z. Ling, "Sneak Preview of the 2nd Voice Conversion Challenge 2018," 情報処理学会音声言語情報処理研究会,デモンストレーション, Feb. 2018.
卒業論文
- 岡田 慎太郎, "空気・体内伝導音声の混合による自己聴取音声の生成" 平成29年度情報工学コース卒業研究報告, Feb. 2018.
- 高田 萌絵, "空気/体内伝導マイクロフォンを用いた雑音環境下における自己発声音制御法" 平成29年度情報工学コース卒業研究報告, Feb. 2018.