発表文献

AIP加速課題

学術論文誌

Reo Yoneyama, Tomoki Toda, "SiFi-GAN: combining source-filter modeling and upsampling-based high-fidelity neural vocoder for fast and pitch-controllable speech synthesis," IEICE Trans. Inf. and Syst., Vol. E109-D, No. 6, pp. 945-956, June 1, 2026. [Open Access]
Wen-Chin Huang, Erica Cooper, Tomoki Toda, "MOS-Bench: benchmarking generalization abilities of subjective speech quality assessment models," IEEE Transactions on Audio, Speech and Language Processing, Vol. 34, pp. 2385-2397, Apr. 20, 2026. [arXiv preprint]
Jinyi Mi, Xiaohan Shi, Ding Ma, Jiajun He, Takuya Fujimura, Tomoki Toda, "Robust speech emotion recognition under human speech noise," Computer Speech and Language, Vol. 100, Article 101987, pp. 1-16, Apr. 1, 2026. [Open Access]
Yuka Hashizume, Tomoki Toda, "Investigation of perceptual music similarity based on individual instrumental parts by large-scale listening test," APSIPA Transactions on Signal and Information Processing, Vol. 15, No. 1, pp. 249-269, Apr. 16, 2026. [Open Access]
Xiaohan Shi, Jiajun He, Xingfeng. Li, Tomoki Toda, "A comprehensive study on the effectiveness of ASR representations for noise-robust speech emotion recognition," IEEE Transactions on Audio, Speech and Language Processing, Vol. 34, pp. 707-722, Jan. 14, 2026. [arXiv preprint]
Takehiro Imamura, Yuka Hashizume, Wen-Chin Huang, Tomoki Toda, "Music similarity representation learning focusing on individual instruments with source separation and human preference," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 4, e305, pp. 1-29, Oct. 28, 2025. [Open Access]
Reo Yoneyama, Atsushi Miyashita, Ryuichi Yamamoto, Tomoki Toda, "Wavehax: aliasing-free neural waveform synthesis based on 2D convolution and harmonic prior for reliable complex spectrogram estimation," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 4454-4470, Oct. 23, 2025. [Open Access]
Bence Mark Halpern, Thomas B. Tienkamp, Teja Rebernik, Rob J.J.H. van Son, Sebastiaan A.H.J. de Visscher, Max J.H. Witjes, Defne Abur, Tomoki Toda, "XPPG-PCA: reference-free automatic speech severity evaluation with principal components," IEEE Journal of Selected Topics in Signal Processing, Vol. 19, No. 5, pp. 783-795, Oct. 3, 2025. [arXiv preprint]
Shaowen Chen, Tomoki Toda, "QHARMA-GAN: quasi-harmonic neural vocoder based on autoregressive moving average model," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 3703-3719, Sep. 10, 2025. [Open Access]
Lester Phillip Violeta, Wen-Chin Huang, Ding Ma, Ryuichi Yamamoto, Kazuhiro Kobayashi, Tomoki Toda, "Resolving domain mismatches in electrolaryngeal speech enhancement with linguistic intermediates," IEEE Journal of Selected Topics in Signal Processing, Vol. 19, No. 5, pp. 827-839, June 30, 2025. [Open Access]
Yeonjong Choi, Chao Xie, Tomoki Toda, "Noise and reverberation-controllable voice conversion," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 2430-2443, June 12, 2025. [Open Access]
Chao Xie, Tomoki Toda, "An investigation of noisy-to-noisy voice conversion performance in various noisy conditions," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e10, pp. 1-30, June 10, 2025. [Open Access]

国際会議

Takehiro Imamura, Yuka Hashizume, Wen-Chin Huang, Tomoki Toda, "Incorporating signal processing-based knowledge for music similarity representation learning based on individual instrument sounds," EUSIPCO, Aug.-Sep. 2026. (Accepted)
Kenichi Ogita, Reo Yoneyama, Wen-Chin Huang, Tomoki Toda, "Evaluating VAE-SiFiGAN under large-scale training and noisy conditions with data selection using F0 extraction error estimation," EUSIPCO, Aug.-Sep. 2026. (Accepted)
Lester Phillip Violeta, Xueyao Zhang, Jiatong Shi, Yusuke Yasuda, Wen-Chin Huang, Zhizheng Wu, Tomoki Toda, "The singing voice conversion challenge 2025: from singer identity conversion to singing style conversion," Proc. IEEE ICASSP, pp. 17707-17711, Barcelona, Spain, May 4, 2026. [arXiv preprint]
Jiachen Wang, Tomoki Toda, "From fixed positions to free-form signals: Virtual Microphone signal estimation for general-purpose spatial audio processing," Proc. IEEE ICASSP, pp. 21011-21015, Barcelona, Spain, May 4, 2026. [Link]
Wen-Chin Huang, Hui Wang, Cheng Liu, Yi-Chiao Wu, Andros Tjandra, Wei-Ning Hsu, Erica Cooper, Yong Qin, Tomoki Toda, "The AudioMOS Challenge 2025," Proc. IEEE ASRU, 8 pages, Challenge paper, Honolulu, USA, Dec. 9, 2025. [arXiv preprint]
Masaaki Matsumoto, Takuya Fujimura, Wen-Chin Huang, Tomoki Toda, "Adjusting bias in anomaly scores via variance minimization for domain-generalized discriminative anomalous sound detection," Proc. DCASE Workshop, pp. 25-29, Barcelona, Spain, Oct. 30, 2025. [Open Access]
Keito Sawada, Wen-Chin Huang, Tomoki Toda, "Hierarchical symbolic music generation with variational autoencoder-based bar-wise feature sequences," Proc. APSIPA ASC, pp. 299-304, Singapore, Oct. 22, 2025. [Open Access]
Kimihiro Hattori, Wen-Chin Huang, Kazuya Takeda, Tomoki Toda, "An evaluation of supervised virtual microphone estimators in reverberant sound fields," Proc. APSIPA ASC, pp. 517-522, Singapore, Oct. 22, 2025. [Open Access]
Masataka Kaneko, Wen-Chin Huang, Tomoki Toda, "Estimating speaker'ss seating position from monaural speech in a simulated vehicle interior sound field," Proc. APSIPA ASC, pp. 625-629, Singapore, Oct. 22, 2025. [Open Access]
Hikari Miyaji, Keito Sawada, Wen-Chin Huang, Tomoki Toda, "Designing a music difficulty measure for controllable automatic piano rearrangement," Proc. APSIPA ASC, pp. 834-839, Singapore, Oct. 22, 2025. [Open Access]
Kiseki Niwa, Kazuhiro Kobayashi, Tomoki Toda, "Investigation of the effectiveness of converted speech auditory feedback in low-latency real-time voice conversion," Proc. APSIPA ASC, pp. 905-910, Singapore, Oct. 22, 2025. [Open Access]
Dohyun Yoon, Tomoki Toda, "Neural semi-fragile watermarking for proactive deepfake speech detection," Proc. APSIPA ASC, pp. 2396-2401, Singapore, Oct. 22, 2025. [Open Access]
Lester Phillip Violeta, Wen-Chin Huang, Tomoki Toda, "Serenade: a singing style conversion framework based on audio infilling," Proc. EUSIPCO, pp. 411-415, Palermo, Italy, Sep. 8, 2025. [Open Access]
Kenichi Ogita, Reo Yoneyama, Wen-Chin Huang, Tomoki Toda, "VAE-SiFiGAN: source-filter HiFi-GAN based on variational autoencoder representations with enhanced pitch controllability," Proc. EUSIPCO, pp. 531-535, Palermo, Italy, Sep. 8, 2025. [Open Access]【Finalists of EUSIPCO Best Student Paper Award（対象者：Kenichi Ogita）】
Yusuke Yasuda, Junichi Yamagishi, Tomoki Toda, "Continual subjective evaluation method of speech by merging sort-based preference tests towards ever-expanding corpus of human ratings," Proc. SSW, pp. 14-20, Leeuwarden, the Netherlands, Aug. 24, 2025. [Open Access]
Xiaohan Shi, Xingfeng Li, Tomoki Toda, "Who, When, and What: leveraging the "Three Ws" concept for emotion recognition in conversation," Proc. INTERSPEECH, pp. 1763-1767, Rotterdam, the Netherlands, Aug. 17, 2025. [Open Access]
Wen-Chin Huang, Erica Cooper, Tomoki Toda, "SHEET: a multi-purpose open-source speech human evaluation estimation toolkit," Proc. INTERSPEECH, pp. 2355-2359, Rotterdam, the Netherlands, Aug. 17, 2025. [Open Access]
Jiajun He, Jinyi Mi, Tomoki Toda, "GIA-MIC: multimodal emotion recognition with gated interactive attention and modality-invariant learning constraints," Proc. INTERSPEECH, pp. 2695-2699, Rotterdam, the Netherlands, Aug. 17, 2025. [Open Access]
Xiaohan Shi, Xingfeng Li, Tomoki Toda, "Speaker-aware multi-task learning for speech emotion recognition," Proc. INTERSPEECH, pp. 4333-4337, Rotterdam, the Netherlands, Aug. 17, 2025. [Open Access]
Xiaohan Shi, Jinyi Mi, Xingfeng Li, Tomoki Toda, "Advancing emotion recognition via ensemble learning: integrating speech, context, and text representations," Proc. INTERSPEECH, pp. 4693-4697, Rotterdam, the Netherlands, Aug. 17, 2025. [Open Access]
Reo Yoneyama, Masaya Kawamura, Ryo Terashima, Ryuichi Yamamoto, Tomoki Toda, "Comparative analysis of fast and high-fidelity neural vocoders for low-latency streaming synthesis in resource-constrained environments," Proc. INTERSPEECH, pp. 4888-4892, Rotterdam, the Netherlands, Aug. 17, 2025. [Open Access]
Cheng-Hung Hu, Yusuke Yasuda, Akifumi Yoshimoto, Tomoki Toda, "Unifying listener scoring scales: comparison learning framework for speech quality assessment and continuous speech emotion recognition," Proc. INTERSPEECH, pp. 5428-5432, Rotterdam, the Netherlands, Aug. 17, 2025. [Open Access]
Ding Ma, Jinyi Mi, Fengji Li, Lester Phillip Violeta, Kazuhiro Kobayashi, Tomoki Toda, "Improving electrolaryngeal speech enhancement via a representation learning method based on integrated text and speech representations," Proc. IEEE EMBC, 6 pages, Copenhagen, Denmark, July 14, 2025. [Link]【3rd Place Award in EMBC 2025 Student Paper Competition（受賞者：Ding Ma）】

招待講演

T. Toda, "Recent advances and future directions in voice conversion," Survey Talk, INTERSPEECH, Rotterdam, the Netherlands, Aug. 20, 2025.
戸田智基, "音声研究の知見がニューラルボコーダの発展にもたらす効果," 音学シンポジウム, 東京, 2025年6月13日.
戸田智基, Xiaohan Shi, "音声表情に着目した音声情報処理の進展," 日本音響学会2026年春季研究発表会, 2-5-1, 東京, 2026年3月18日.

国内研究会・大会講演

松本昌亮, 藤村拓弥, Wen-Chin Huang, 戸田智基, "異常スコア分散最小化に基づくバイアス調整を用いたドメイン汎化型識別的異常音検知," 日本音響学会2026年春季研究発表会, 3-Q-6, 講演論文集, pp. 309-312, 2026年3月19日.
Wen-Chin Huang, Erica Cooper, 戸田智基, "自動音声品質評価モデルにおけるマルチデータセット学習の調査," 日本音響学会2026年春季研究発表会, 2-5-9, 講演論文集, pp. 973-974, 2026年3月18日.
古田京平, Wen-Chin Huang, 安田裕介, 戸田智基, "知識蒸留による因果的な音声潜在特徴抽出と音声変換への適用," 日本音響学会2026年春季研究発表会, 3-5-5, 講演論文集, pp. 1009-1010, 2026年3月19日.
戸田智基, Xiaohan Shi, "音声表情に着目した音声情報処理の進展," 日本音響学会2026年春季研究発表会, 2-5-1, 講演論文集, pp. 1203-1204, 2026年3月18日.
Minseok Kim, Wen-Chin Huang, 戸田智基, "ピアノ楽曲の「ジャズらしさ」の知覚評価データ収集と潜在因子の分析," 日本音響学会2026年春季研究発表会, 1-7-4, 講演論文集, pp. 1219-1220, 2026年3月17日.
荻田健一, 米山怜於, ホワンウェンチン, 戸田智基, "大規模学習条件下および雑音環境下におけるVAE-SiFiGANの性能評価," 信学技報, Vol. 125, No. 371, SP2025-77, pp. 306-311, 2026年3月3日.
今村剛大, 橋爪優果, ホワンウェンチン, 戸田智基, "個別楽器音に着目した楽曲間類似度表現学習におけるテキスト表現による楽器指定," 信学技報, Vol. 125, No. 369, EA2025-92, pp. 114-120, 2026年3月2日
橋爪優果, 渡邉研斗, 中塚貴之, 佃洸摂, Tian Cheng, 中野倫靖, 後藤真孝, 戸田智基, "MixQuery: ユーザ選択ステムの集約に基づく楽器音色指向楽曲検索システム," 情報処理研報, Vol. 2026-MUS-145, No. 21, pp. 1-9, 2026年2月28日.
Takehiro Imamura, Yuka Hashizume, Wen-Chin Huang, Tomoki Toda, "Instrument-wise music similarity representation learning with source separation and human preference," ASA-ASJ Joint Meeting, 5aMU12, Dec. 5, 2025.
Yuka Hashizume, Tomoki Toda, "Investigation of perceptual music similarity based on individual instrumental parts and its correspondence to deep learning features," ASA-ASJ Joint Meeting, 5aMU13, Dec. 5, 2025.
Keito Sawada, Wen-Chin Huang, Tomoki Toda, "Cascaded symbolic music generation with bar-wise feature sequence modeling," ASA-ASJ Joint Meeting, 5aMU14, Dec. 5, 2025.
Reo Yoneyama, Tomoki Toda, "Why is a sinusoidal signal input effective in time-domain neural vocoders?," ASA-ASJ Joint Meeting, 2aSP21, Dec. 2, 2025.
Kenichi Ogita, Reo Yoneyama, Wen-Chin Huang, Tomoki Toda, "Robust fundamental frequency control in source-filter neural vocoding via probabilistic latent representations," ASA-ASJ Joint Meeting, 2pSP11, Dec. 2, 2025.
服部公宏, ホワンウェンチン, 武田一哉, 戸田智基, "多様なシミュレーション音場における教師あり仮想マイクアレイ信号推定の汎化性能評価," 電子情報通信学会音声研究会, 技術研究報告, Vol. 125, No. 74, SP2025-20, pp. 107-112, 2025年6月14日.
Wen-Chin Huang, Lester Phillip Violeta, Tomoki Toda, "JATTS: a comparison-oriented Japanese text-to-speech open-sourced toolkit," 電子情報通信学会音声研究会, 技術研究報告, Vol. 125, No. 74, SP2025-22, pp. 119-124, 2025年6月14日.
宮司光梨, 澤田桂都, ホワンウェンチン, 戸田智基, "制御性の高いピアノ自動編曲に向けた楽曲難易度指標の設計," 情報処理研報, Vol. 2025-MUS-143, No. 8, pp. 1-7, 2025年6月13日.

博士論文

Yuka Hashizume, "Research on part-level music similarity for music retrieval focusing on individual instrumental parts," 情報学研究科知能システム学専攻博士論文, Mar. 2026.
Reo Yoneyama, "Neural vocoder based on generative adversarial networks considering speech production mechanism," 情報学研究科知能システム学専攻博士論文, Mar. 2026.
Lester Phillip Violeta, "Domain adaptation techniques for electrolaryngeal speech recognition and enhancement," 情報学研究科知能システム学専攻博士論文, Mar. 2026.
Chao Xie, "Noisy-to-noisy voice conversion capable of controlling background noise," 情報学研究科知能システム学専攻博士論文, Mar. 2026.
Ding Ma, "Training techniques of sequence-to-sequence voice conversion for electrolaryngeal speech enhancement," 情報学研究科知能システム学専攻博士論文, Mar. 2026.
Shaowen Chen, "Deep speech analysis-modification-synthesis based on quasi-harmonic modeling," 情報学研究科知能システム学専攻博士論文, Dec. 2025.
Shuming Luan, "Generalized sound field interpolation in rotation-robust microphone array signal processing," 情報学研究科知能システム学専攻博士論文, July 31, 2025.

受賞

Ding Ma, "3rd Place Award in EMBC 2025 Student Paper Competition," 2025年7月16日.

CREST研究課題

学術論文誌

Yuka Hashizume, Tomoki Toda, "Investigation of perceptual music similarity based on individual instrumental parts by large-scale listening test," APSIPA Transactions on Signal and Information Processing, Vol. 15, No. 1, pp. 249-269, Apr. 16, 2026. [Open Access]
Naoki Nishio, Kazuhiro Kobayashi, Ding Ma, Sohei Mitani, Michihiko Sone, Tomoki Toda, "A voice conversion system from electrolarynx speech to preoperative patient’s speech for total laryngectomy," OTO Open, Vol. 10, No. 1, Scientific Briefing, 5 pages, Feb. 2026. [Open Access]
Takehiro Imamura, Yuka Hashizume, Wen-Chin Huang, Tomoki Toda, "Music similarity representation learning focusing on individual instruments with source separation and human preference," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 4, e305, pp. 1-29, Oct. 28, 2025. [Open Access]
Reo Yoneyama, Atsushi Miyashita, Ryuichi Yamamoto, Tomoki Toda, "Wavehax: aliasing-free neural waveform synthesis based on 2D convolution and harmonic prior for reliable complex spectrogram estimation," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 4454-4470, Oct. 23, 2025. [Open Access]
西尾直樹, 小林和弘, 戸田智基, "喉頭摘出者における自己音声の再獲得～Save the Voice Project～," 気管食道科学会会報, Vol. 76, No. 5, pp. 255-263, Oct. 10, 2025. [Link]
Yusuke Yasuda, Tomoki Toda, "Automatic design optimization of preference-based subjective evaluation with online learning in crowdsourcing environment," Computer Speech and Language, Vol. 96, Article 101888, pp. 1-16, Sep. 18, 2025. [Open Access]
Shaowen Chen, Tomoki Toda, "QHARMA-GAN: quasi-harmonic neural vocoder based on autoregressive moving average model," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 3703-3719, Sep. 10, 2025.[Open Access]
Ding Ma, Lester Phillip Violeta, Kazuhiro Kobayashi, Tomoki Toda, "Pretraining and fine-tuning techniques for electrolaryngeal speech enhancement based on sequence-to-sequence voice conversion," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 3189-3201, July 24, 2025. [Open Access]
Yuka Hashizume, Li Li, Atsushi Miyashita, Tomoki Toda, "Learning separated representations for instrument-based music similarity," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e16, pp. 1-32, July 15, 2025. [Open Access]
Lester Phillip Violeta, Wen-Chin Huang, Ding Ma, Ryuichi Yamamoto, Kazuhiro Kobayashi, Tomoki Toda, "Resolving domain mismatches in electrolaryngeal speech enhancement with linguistic intermediates," IEEE Journal of Selected Topics in Signal Processing, Vol. 19, No. 5, pp. 827-839, June 30, 2025. [Open Access]
Yeonjong Choi, Chao Xie, Tomoki Toda, "Noise and reverberation-controllable voice conversion," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 2430-2443, June 12, 2025.[Open Access]
Takuya Fujimura, Tomoki Toda, "Analysis and extension of noisy-target training for unsupervised target signal enhancement," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e12, pp. 1-27, June 12, 2025 [Open Access]
Chao Xie, Tomoki Toda, "An investigation of noisy-to-noisy voice conversion performance in various noisy conditions," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e10, pp. 1-30, June 10, 2025.[Open Access]
Ding Ma, Yeonjong Choi, Takuya Fujimura, Fengji Li, Chao Xie, Kazuhiro Kobayashi, Tomoki Toda, "Sequence-to-sequence voice conversion-based techniques for electrolaryngeal speech enhancement in noisy and reverberant conditions," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e8, pp. 1-40, May 22, 2025. [Open Access]
Mohammad Eshghi, Tomoki Toda, "Predicting fundamental frequency patterns in electrolaryngeal speech using automated phoneme extraction," IEEE Access, Vol. 13, pp. 73831-73847, Apr. 28, 2025. [Open Access]
Shuming Luan, Yukoh Wakabayashi, Tomoki Toda, "Generalized sound field interpolation for freely spaced microphone arrays in rotation-robust beamforming," Applied Acoustics, Vol. 236, Article 110706, pp. 1-15. Apr. 3, 2025. [Open Access]
Cheng-Hung Hu, Yusuke Yasuda, Tomoki Toda, "E2EPref: an end-to-end preference-based framework for speech quality assessment to alleviate bias in direct assessment scores," Computer Speech and Language, Vol. 93, Article 101799, pp. 1-17, Mar. 26, 2025. [Open Access]
Fengji Li, Fei Shen, Ding Ma, Jie Zhou, Li Wang, Fan Fan, Tao Liu, Xiaohong Chen, Tomoki Toda, Haijun Niu, "Mandarin speech reconstruction from surface electromyography based on generative adversarial networks," Medicine in Novel Technology and Devices, Vol. 26, Article 100359, pp. 1-7, Mar. 13, 2025. [Open Access]
Shaowen Chen, Tomoki Toda, "Sequence-wise speech waveform modeling via gradient descent optimization of quasi-harmonic parameters," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 319-332, Jan. 3, 2025. [Open Access]
Rui Wang, Takuya Fujimura, Tomoki Toda, "Target speaker extraction under noisy underdetermined conditions using conditional variational autoencoder, global style token, and neural postfilter," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e2, pp. 1-26, Jan. 27, 2025. [Open Access]
Fengji Li, Fei Shen, Ding Ma, Jie Zhou, Shaochuan Zhang, Li Wang, Fan Fan, Tao Liu, Xiaohong Chen, Tomoki Toda, Haijun Niu, "End-to-end Mandarin speech reconstruction based on ultrasound tongue images using deep learning," IEEE Transactions on Neural Systems and Rehabilitation Engineering, Vol. 33, pp. 140-149, Dec. 20, 2024. [Open Access]
Wen-Chin Huang, Yi-Chiao Wu, Tomoki Toda, "Multi-speaker text-to-speech training with speaker anonymized data," IEEE Signal Processing Letters, Vol. 31, pp. 2995-2999, Oct. 17, 2024. [Open Access]
Shuming Luan, Yukoh Wakabayashi, Tomoki Toda, "Unequally spaced sound field interpolation for rotation-robust beamforming," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 32, pp. 3185-3199, June 6, 2024. [Open Access]
Mohammad Eshghi, Tomoki Toda, "An investigation of fundamental frequency pattern prediction for Japanese eelectrolaryngeal speech enhancement based on frame-wise phoneme representations," IEEE Access, Vol. 12, pp. 50137-50153, Apr. 4, 2024. [Open Access]
Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, Nobukatsu Hojo, Shogo Seki, "VoiceGrad: non-parallel any-to-many voice conversion with annealed Langevin dynamics," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 32, pp. 2213-2226, Mar. 20, 2024. [arXiv preprint]
Rui Wang, Li Li, Tomoki Toda, "Dual-channel target speaker extraction based on conditional variational autoencoder and directional information," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 32, pp. 1968-1979, Mar. 14, 2024. [Open Access]
Taishi Nakashima, Yukoh Wakabayashi, Nobutaka Ono, "Self-rotation-robust online independent vector analysis with sound field interpolation on circular microphone array," APSIPA Transactions on Signal and Information Processing, Vol. 13, No. 1, e5, pp. 1-24, Feb. 26, 2024. [Open Access]
Yoshiki Masuyama, Kouei Yamaoka, Takao Kawamura, Nobutaka Ono, "Efficient joint optimization of sampling rate offsets using entire multichannel signal," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 32, pp. 1816-1828, Feb. 23, 2024. [Open Access]
Taiga Kawamura, Natsuki Ueno, Nobutaka Ono, "Flexible and comprehensive framework of element selection based on non-convex sparse optimization," IEEE Access, Vol. 12, pp. 21337-21346, Feb. 5, 2024. [Open Access]
Yoshiki Masuyama, Kouei Yamaoka, Yuma Kinoshita, Taishi Nakashima, Nobutaka Ono, "Causal and relaxed-distortionless response beamforming for online target source extraction," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 32, pp. 310-324, Nov. 1, 2023. [Open Access]【第40回電気通信普及財団賞テレコムシステム技術学生賞（受賞者：Yoshiki Masuyama）】
Kouei Yamaoka, Taishi Nakashima, Yukoh Wakabayashi, Nobutaka Ono, "Minimum-spanning-tree-based time delay estimation robust to outliers," IEEE Access, vol. 11, pp. 121284-121294, Oct. 24, 2023. [Open Access]
Chao Xie, Tomoki Toda, "Noisy-to-noisy voice conversion under variations of noisy condition," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 31, pp. 3871-3882, Sep. 20, 2023. [Open Access]
Reo Yoneyama, Yi-Chiao Wu, Tomoki Toda, "High-fidelity and pitch-controllable neural vocoder based on unified source-filter networks," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 31, pp. 3717-3729, Sep. 11, 2023. [Open Access]
Yukoh Wakabayashi, Kouei Yamaoka, Nobutaka Ono, "Sound field interpolation for rotation-invariant multichannel array signal processing," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 31, pp. 2286-2298, June 1, 2023. [Open Access]
Taishi Nakashima Nobutaka Ono, "Repeated update of demixing vectors in independent low-rank matrix analysis for better separation," APSIPA Transactions on Signal and Information Processing, Vol. 12, No. 3, e20, pp. 1-23, May 24, 2023. [Open Access]
Li Li, Hirokazu Kameoka, Shoji Makino, "FastMVAE2: on improving and accelerating the fast variational autoencoder-based source separation algorithm for determined mixtures," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 31, pp. 96-110, Oct. 14, 2022. [arXiv preprint]
Yi-Chiao Wu, Patrick Lumban Tobing, Kazuki Yasuhara, Noriyuki Matsunaga, Yamato Ohtani, Tomoki Toda, "A cyclical approach to synthetic and natural speech mismatch refinement of neural post-filter for low-cost text-to-speech system," APSIPA Transactions on Signal and Information Processing, Vol. 11, No. 1, e30, pp. 1-32, Sep. 21, 2022. [Open Access]
Wen-Chin Huang, Shu-Wen Yang, Tomoki Hayashi, Tomoki Toda, "A comparative study of self-supervised speech representation based voice conversion," IEEE Journal of Selected Topics in Signal Processing, Vol. 16, No. 6, pp. 1308-1318, July 25, 2022. [arXiv preprint]
春田智穂, 小野順貴, "補聴器応用のためのDNN音声強調の低演算量化の検討," 日本音響学会誌, Vol. 78, No. 5, pp. 227-237, May 1, 2022. [Open Access]
Kouei Yamaoka, Nobutaka Ono, Shoji Makino, "Time-frequency-bin-wise linear combination of beamformers for distortionless signal enhancement," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 29, pp. 3461-3475, Nov. 13, 2021. [Open Access]【第38回電気通信普及財団賞テレコムシステム技術学生賞（受賞者：Kouei Yamaoka）】
Kanato Ishii, Yuma Kinoshita, Yukoh Wakabayashi, Nobutaka Ono, "Real-time pitch visualization with "Blinky" sound-to-light conversion device," Journal of Signal Processing, Vol. 25, No. 6, pp. 213-220, Nov. 1, 2021. [Open Access]
Chihiro Watanabe, Hirokazu Kameoka, "X-DC: explainable deep clustering based on learnable spectrogram templates," Neural Computation, Vol. 33, No. 7, pp. 1853-1885, June 11, 2021. [arXiv preprint]
Yi-Chiao Wu, Tomoki Hayashi, Patrick Lumban Tobing, Kazuhiro Kobayashi, Tomoki Toda, "Quasi-periodic WaveNet: an autoregressive raw waveform generative model with pitch-dependent dilated convolution neural network," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 29, pp. 1134-1148, Feb. 23, 2021. [Open Access]
Yi-Chiao Wu, Tomoki Hayashi, Takuma Okamoto, Hisashi Kawai, Tomoki Toda, "Quasi-periodic parallel WaveGAN: a non-autoregressive raw waveform generative model with pitch-dependent dilated convolution neural network," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 29, pp. 792-806, Jan. 14, 2021. [Open Access]
Wen-Chin Huang, Tomoki Hayashi, Yi-Chiao Wu, Hirokazu Kameoka, Tomoki Toda, "Pretraining techniques for sequence-to-sequence voice conversion," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 29, pp. 745-755, Jan. 5, 2021. [Open Access]【IEEE Signal Processing Society Japan Young Author Best Paper Award（受賞者：Wen-Chin Huang）】
Hirokazu Kameoka, Wen-Chin Huang, Kou Tanaka, Takuhiro Kaneko, Nobukatsu Hojo, Tomoki Toda, "Many-to-many voice transformer network," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 29, pp. 656-670, Dec. 24, 2020. [arXiv preprint]
Li Li, Hirokazu Kameoka, Shota Inoue, Shoji Makino, "FastMVAE: a fast optimization algorithm for the multichannel variational autoencoder method," IEEE Access, Vol. 8, pp. 228740-228753, Dec. 1, 2020. [Open Access]
Li Li, Hirokazu Kameoka, Shoji Makino, "Majorization-minimization algorithm for discriminative non-negative matrix factorization," IEEE Access, Vol. 8, pp. 227399-227408, Dec. 18, 2020. [Open Access]
Patrick Lumban Tobing, Yi-Chiao Wu, Tomoki Hayashi, Kazuhiro Kobayashi, Tomoki Toda, "An evaluation of voice conversion with neural network spectral mapping models and WaveNet vocoder," APSIPA Transactions on Signal and Information Processing, Vol. 9, e26, pp. 1-14, Nov. 25, 2020. [Open Access]
Tomohiko Nakamura, Hirokazu Kameoka, "Harmonic-temporal factor decomposition for unsupervised monaural separation of harmonic sounds," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 29, pp. 68-82, Nov. 16, 2020. [Open Access]
Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, Nobukatsu Hojo, "Nonparallel voice conversion with augmented classifier star generative adversarial networks," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 28, pp. 2982-2995, Nov. 11, 2020. [arXiv preprint]
Hirokazu Kameoka, Kou Tanaka, Damian Kwasny, Takuhiro Kaneko, Nobukatsu Hojo, "ConvS2S-VC: fully convolutional sequence-to-sequence voice conversion," IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 28, pp. 1849-1863, June 10, 2020. [Open Access]
Yi-Chiao Wu, Patrick Lumban Tobing, Tomoki Hayashi, Kazuhiro Kobayashi, Tomoki Toda, "Non-parallel voice conversion system with WaveNet vocoder and collapsed speech suppression," IEEE Access, Vol. 8, pp. 62094-62106, Mar. 30, 2020. [Open Access]
(Patrick Lumban Tobing, Yi-Chiao Wu, Tomoki Hayashi, Kazuhiro Kobayashi, Tomoki Toda, "Voice conversion with CycleRNN-based spectral mapping and finely-tuned WaveNet vocoder," IEEE Access, Vol. 7, pp. 171114-171125, Nov. 26, 2019. [Open Access])
(Shogo Seki, Hirokazu Kameoka, Li Li, Tomoki Toda, Kazuya Takeda, "Underdetermined source separation based on generalized multichannel variational autoencoder," IEEE Access, Vol. 7, pp. 168104-168115, Nov. 19, 2019. [Open Access])

国際会議

Keito Sawada, Wen-Chin Huang, Tomoki Toda, "Hierarchical symbolic music generation with variational autoencoder-based bar-wise feature sequences," Proc. APSIPA ASC, pp. 299-304, Singapore, Oct. 2025.
Kimihiro Hattori, Wen-Chin Huang, Kazuya Takeda, Tomoki Toda, "An evaluation of supervised virtual microphone estimators in reverberant sound fields," Proc. APSIPA ASC, pp. 517-522, Singapore, Oct. 2025.
Kiseki Niwa, Kazuhiro Kobayashi, Tomoki Toda, "Investigation of the effectiveness of converted speech auditory feedback in low-latency real-time voice conversion," Proc. APSIPA ASC, pp. 905-910, Singapore, Oct. 2025.
Lester Phillip Violeta, Wen-Chin Huang, Tomoki Toda, "Serenade: a singing style conversion framework based on audio infilling," Proc. EUSIPCO, pp. 411-415, Palermo, Italy, Sep. 2025.[Open Access]
Ding Ma, Jinyi Mi, Fengji Li, Lester Phillip Violeta, Kazuhiro Kobayashi, Tomoki Toda, "Improving electrolaryngeal speech enhancement via a representation learning method based on integrated text and speech representations," Proc. IEEE EMBC, 6 pages, Copenhagen, Denmark, July 2025.【3rd Place Award in EMBC 2025 Student Paper Competition（受賞者：Ding Ma）】
Yuka Hashizume, Tomoki Toda, "Investigation of perceptual music similarity focusing on each instrumental part," Proc. IEEE ICASSP, 5 pages, Hyderabad, India, Apr. 2025. [arXiv preprint]
Kaito Nishizawa, Ryuichi Yamamoto, Wen-Chin Huang, Tomoki Toda, "Investigating factors related to the naturalness of synthesized unison singing," Proc. IEEE ICASSP, 5 pages, Hyderabad, India, Apr. 2025. [Link]
Yoshiki Masuyama, Natsuki Ueno, Nobutaka Ono, "Mel-spectrogram inversion via alternating direction method of multipliers," Proc. IEEE ICASSP, 5 pages, Hyderabad, India, Apr. 2025. [arXiv preprint]
You Zhang, Yongyi Zang, Jiatong Shi, Ryuichi Yamamoto, Tomoki Toda, Zhiyao Duan, "SVDD 2024: The Inaugural Singing Voice Deepfake Detection Challenge," Proc. IEEE SLT, pp. 792-797, Macau, China, Dec. 2024. [arXiv preprint]
Wen-Chin Huang, Szu-Wei Fu, Erica Cooper, Ryandhimas E. Zezario, Tomoki Toda, Hsin-Min Wang, Junichi Yamagishi, Yu Tsao, "The VoiceMOS Challenge 2024: beyond speech quality prediction," Proc. IEEE SLT, pp. 813-820, Macau, China, Dec. 2024. [arXiv preprint]
Bence Mark Halpern, Tomoki Toda, "Reference-free automatic speech severity evaluation using acoustic unit language modelling," Proc. SpandLDeteriorate Workshop of ACM Multimedia Asia (Workshop on Multi-Biological Sensing Data for Speech and Language Deterioration Prediction), 5 pages, Dec. 2024. [Open Access]【Best Paper Award of SpandLDeteriorate Workshop】
Xiaohan Shi, Yuan Gao, Jiajun He, Jinyi Mi, Xingfeng Li, Tomoki Toda, "A study on multimodal fusion and layer adapter in emotion recognition," Proc. APSIPA ASC, 6 pages, Macau, China, Dec. 2024. [Open Access]
Takehiro Imamura, Yuka Hashizume, Tomoki Toda, "Multi-task learning approaches for music similarity representation learning based on individual instrument sounds," Proc. APSIPA ASC, 6 pages, Macau, China, Dec. 2024. [Open Access]【Selected as the Best Student Paper Candidate for APSIPA ASC 2024】
Jinyi Mi, Sehun Kim, Tomoki Toda, "Improved architecture for high-resolution piano transcription to efficiently capture acoustic characteristics of music signals," Proc. APSIPA ASC, 6 pages, Macau, China, Dec. 2024. [Open Access]
Jinyi Mi, Xiaohan Shi, Ding Ma, Jiajun He, Takuya Fujimura, Tomoki Toda, "Two-stage framework for robust speech emotion recognition using target speaker extraction in human speech noise conditions," Proc. APSIPA ASC, 6 pages, Macau, China, Dec. 2024. [Open Access]
Kyoka Kazama, Taishi Nakashima, Nobutaka Ono, "Measurement of relative transfer function for own voice in head-mounted microphone array," Proc. APSIPA ASC, 5 pages, Macau, China, Dec. 2024. [Open Access]
Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Yuto Kondo, "FastVoiceGrad: one-step diffusion-based voice conversion with adversarial conditional diffusion distillation," Proc. INTERSPEECH, pp. 192-196, Sep. 1, 2024. [Open Access]
Cheng-Hung Hu, Yusuke Yasuda, Tomoki Toda, "Embedding learning for preference-based speech quality assessment," Proc. INTERSPEECH, pp. 2685-2689, Sep. 1, 2024. [Open Access]
Bence Mark Halpern, Thomas Tienkamp, Wen-Chin Huang, Lester Phillip Violeta, Teja Rebernik, Sebastiaan de Visscher, Max Witjes, Martijn Wieling, Defne Abur, Tomoki Toda, "Quantifying the effect of speech pathology on automatic and human speaker verification," Proc. INTERSPEECH, pp. 3015-3019, Sep. 1, 2024. [Open Access]
Xiaohan Shi, Xingfeng LI, Tomoki Toda "Multimodal fusion of music theory-inspired and self-supervised representations for improved emotion recognition," Proc. INTERSPEECH, pp. 3724-3728, Sep. 1, 2024. [Open Access]
Shaowen Chen, Tomoki Toda, "QHM-GAN: neural vocoder based on quasi-harmonic modeling," Proc. INTERSPEECH, pp. 3889-3893, Sep. 1, 2024. [Open Access]
Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko, Yuto Kondo, "PRVAE-VC2: non-parallel voice conversion by distillation of speech representations," Proc. INTERSPEECH, pp. 4363-4367, Sep. 1, 2024. [Open Access]
Yongyi Zang, Jiatong Shi, You Zhang, Ryuichi Yamamoto, Jionghao Han, Yuxun Tang, Shengyuan Xu, Wenxiao Zhao, Jing Guo, Tomoki Toda, Zhiyao Duan, "CtrSVDD: a benchmark dataset and baseline analysis for controlled singing voice deepfake detection," Proc. INTERSPEECH, pp. 4783-4787, Sep. 1, 2024. [Open Access]
Jiachen Wang, Tomoki Toda, "Unsupervised training of neural network-based virtual microphone estimator," Proc. EUSIPCO, pp. 256-260, Aug. 26, 2024. [Open Access]
Yuto Kondo, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, Noboru Harada, "Learning to assess subjective impressions from speech," Proc. EUSIPCO, pp. 381-385, Aug. 26, 2024. [Open Access]
Yui Kuriki, Taishi Nakashima, Nobutaka Ono, "Direct update of back-projected demixing matrices in blind source separation," Proc. EUSIPCO, pp. 922-926, Aug. 26, 2024. [Open Access]
Ding Ma, Yeonjong Choi, Fengji Li, Chao Xie, Kazuhiro Kobayashi, Tomoki Toda, "Robust sequence-to-sequence voice conversion for electrolaryngeal speech enhancement in noisy and reverberant conditions," Proc. IEEE EMBC, 4 pages, July 15, 2024.
Fengji Li, Fei Shen, Ding Ma, Shaochuan Zhang, Jie Zhou, Li Wang, Fan Fan, Tao Liu, Xiaohong Chen, Tomoki Toda, Haijun Niu, "Mandarin speech reconstruction from tongue motion ultrasound images based on generative adversarial networks," Proc. IEEE EMBC, USA, July 15, 2024.
L.P. Violeta, Wen-Chin Huang, Ding Ma, Ryuichi Yamamoto, Kazuhiro Kobayashi, Tomoki Toda, "Electrolaryngeal speech intelligibility enhancement through robust linguistic encoders," Proc. IEEE ICASSP, pp. 10961-10965, Apr. 14, 2024. [Link]
Wen-Chin Huang, Lester Phillip Violeta, Songxiang Liu, Jiatong Shi, Tomoki Toda, "The Singing Voice Conversion Challenge 2023," Proc. IEEE ASRU, 8 pages, Taipei, Taiwan, Dec. 19, 2023. [arXiv preprint]【Selected as Top 3% Papers】
Bence Mark Halpern, Wen-Chin Huang, Lester Phillip Violeta, Rob J.J.H. van Son, Tomoki Toda, "Improving severity preservation of healthy-to-pathological voice conversion with global style tokens," Proc. IEEE ASRU, 7 pages, Taipei, Taiwan, Dec. 19, 2023. [arXiv preprint]
Ryuichi Yamamoto, Reo Yoneyama, Lester Phillip Violeta, Wen-Chin Huang, Tomoki Toda, "A comparative study of voice conversion models with large-scale speech and singing data: the T13 systems for the Singing Voice Conversion Challenge 2023," Proc. IEEE ASRU, 6 pages, Taipei, Taiwan, Dec. 19, 2023. [arXiv preprint]
Erica Cooper, Wen-Chin Huang, Yu Tsao, Hsin-Min Wang, Tomoki Toda, Junichi Yamagishi, "The VoiceMOS Challenge 2023: zero-shot subjective speech quality prediction for multiple domains," Proc. IEEE ASRU, 7 pages, Taipei, Taiwan, Dec. 19, 2023. [arXiv preprint]【Selected as Top 3% Papers】
Sehun Kim, Kazuya Takeda, Tomoki Toda, "Sequence-to-sequence network training methods for automatic guitar transcription with tokenized outputs," Proc. ISMIR, pp. 524-531, Nov. 5, 2023. [Open Access]
Wen-Chin Huang, Tomoki Toda, "Evaluating methods for ground-truth-free foreign accent conversion," Proc. APSIPA ASC, pp. 1136-1141, Oct. 31, 2023. [Open Access]
Kenta Yamada, Yoshiki Masuyama, Kouei Yamaoka, Nobutaka Ono, "Fundamental frequency estimation based on finite-order harmonic constraint differential equation," Proc. APSIPA ASC, pp. 868-872, Nov. 1, 2023. [Open Access]
Chihiro Watanabe, Hirokazu Kameoka, "DisC-VC: disentangled and F0-controllable neural voice conversion," Proc. APSIPA ASC, pp. 1169-1173, Nov. 2, 2023. [Open Access]
Keisuke Takazawa, Hirokazu Kameoka, Masahiro Yukawa, "Multiple sound source tracking based on generative modeling and recursive Bayesian filtering of spatial gradient spectra," Proc. APSIPA ASC, pp. 2035-2039, Nov. 3, 2023. [Open Access]
Yoshiki Masuyama, Xuankai Chnag, Wangyou Zhang, Samuele Cornell, Zhong-Qiu Wang, Nobutaka Ono, Yanmin Qian, Shinji Watanabe, "Exploring the integration of speech separation and recognition with self-supervised learning representation," Proc. IEEE WASPAA, 5 pages, Oct. 23, 2023. [Link]
Atsushi Miyashita, Tomoki Toda, "Differentiable representation of warping based on Lie group theory," Proc. IEEE WASPAA, 5 pages, Oct. 24, 2023. [Link]【IEEE WASPAA 2023 Best Student Paper Award（受賞者：Atsushi Miyashita）】
Rui Wang, Tomoki Toda, "Directional target speaker extraction under noisy underdetermined conditions through conditional variational autoencoder with global style tokens," Proc. IEEE WASPAA, 5 pages, Oct. 25, 2023. [Link]
Yoshiki Masuyama, Natsuki Ueno, Nobutaka Ono, "Signal reconstruction from mel-spectrogram based on bi-level consistency of full-band magnitude and phase," Proc. IEEE WASPAA, 5 pages, Oct. 25, 2023. [Link]
Shuming Luan, Yukoh Wakabayashi, Tomoki Toda, "Sound field interpolation with unsupervised calibration for freely spaced circular microphone array in rotation-robust beamforming," Proc. EUSIPCO, pp. 21-25, Sep. 4, 2023. [Open Access]
Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko, "PRVAE-VC: non-parallel many-to-many voice conversion with perturbation-resistant variational autoencoder," Proc. SSW, pp. 88-93, Aug. 27, 2023. [Open Access]
Yusuke Yasuda, Tomoki Toda, "Analysis of mean opinion scores in subjective evaluation of synthetic speech based on tail probabilities," Proc. INTERSPEECH, pp. 5491-5495, Aug. 20, 2023. [Open Access]
Cheng-Hung Hu, Yusuke Yasuda, Tomoki Toda, "Preference-based training framework for automatic speech quality assessment using deep neural network," Proc. INTERSPEECH, pp. 546-550, Aug. 20, 2023. [Open Access]
Yeonjong Choi, Chao Xie, Tomoki Toda, "Reverberation-controllable voice conversion using reverberation time estimator," Proc. INTERSPEECH, pp. 2103-2107, Aug. 20, 2023. [Open Access]
Kou Tanaka, Takuhiro Kaneko, Hirokazu Kameoka, Shogo Seki, "CFVC: conditional filtering for controllable voice conversion," Proc. INTERSPEECH, pp. 2103-2107, Aug. 22, 2023. [Open Access]
Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Shogo Seki, "iSTFTNet2: faster and more lightweight iSTFT-based neural vocoder using 1D-2D CNN," Proc. INTERSPEECH, pp. 2103-2107, Aug. 23, 2023. [Open Access]
Kazuhiro Kobayashi, Tomoki Hayashi, Tomoki Toda, "Low-latency electrolaryngeal speech enhancement based on FastSpeech2-based voice conversion and self-supervised speech representation," Proc. IEEE ICASSP, 5 pages, June 6, 2023. [Link]
Taishi Nakashima, Rintaro Ikeshita, Nobutaka Ono, Shoko Araki, Tomohiro Nakatani, "Fast online source steering algorithm for tracking single moving source using online independent vector analysis," Proc. IEEE ICASSP, 6 pages, June 6, 2023. [Link]【ICASSP 2023 Top 3% paper recognitions】
Ryuichi Yamamoto, Reo Yoneyama, Tomoki Toda, "NNSVS: a neural network based singing voice synthesis toolkit," Proc. IEEE ICASSP, 5 pages, June 7, 2023. [arXiv preprint]
Reo Yoneyama, Yi-Chiao Wu, Tomoki Toda, "Source-Filter HiFiGAN: fast and pitch controllable high-fidelity neural vocoder", Proc. IEEE ICASSP, 5 pages, June 7, 2023. [arXiv preprint]【IEEE Signal Processing Society Japan Student Conference Paper Award（受賞者：Reo Yoneyama）】
Atsushi Miyashita, Tomoki Toda, "Representation of vocal tract length transformation based on group theory," Proc. IEEE ICASSP, 5 pages, June 8, 2023. [Link]
Yusuke Yasuda, Tomoki Toda, "Text-to-speech synthesis based on latent variable conversion using diffusion probabilistic model and variational autoencoder," Proc. IEEE ICASSP, 5 pages, June 9, 2023. [arXiv preprint]
Takuya Fujimura, Tomoki Toda, "Analysis of Noisy-target Training for DNN-based speech enhancement," Proc. IEEE ICASSP, 5 pages, June 9, 2023. [arXiv preprint]
Taiga Kawamura, Natsuki Ueno, Nobutaka Ono, "Element selection with wide class of optimization criteria using non-convex sparse optimization," Proc. IEEE ICASSP, 5 pages, June 9, 2023. [Link]
Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Shogo Seki, "Wave-U-Net discriminator: fast and lightweight discriminator for generative adversarial network-based speech synthesis," Proc. IEEE ICASSP, 5 pages, June 9, 2023. [arXiv preprint]
Shogo Seki, Hirokazu Kameoka, Kou Tanaka, Takuhiro Kaneko, "JSV-VC: Jointly trained speaker verification and voice conversion models," Proc. IEEE ICASSP, 5 pages, June 9, 2023. [Link]
Yoshiki Masuyama, Xuankai Chang, Samuele Cornell, Shinji Watanabe, Nobutaka Ono, "End-to-end integration of speech recognition, dereverberation, beamforming, and self-supervised learning representation," Proc. IEEE SLT, pp. 260-265, Jan. 9, 2023. [arXiv preprint]【Best Student Paper Award（受賞者：Yoshiki Masuyama）】
Ding Ma, Lester Phillip Violeta, Kazuhiro Kobayashi, Tomoki Toda, "Two-stage training method for Japanese electrolaryngeal speech enhancement based on sequence-to-sequence voice conversion," Proc. IEEE SLT, pp. 949-954, Jan. 9, 2023. [arXiv preprint]
Satoshi Motoyama, Natsuki Ueno, Yuma Kinoshita, Nobutaka Ono, "Compressed sensing of sparse spectrum using distributed sound-to-light conversion device Blinkies," Proc. APSIPA ASC, pp. 12-16, Nov. 7, 2022. [Open Access]
Yuka Hashizume, Li Li, Tomoki Toda, "Music similarity calculation of individual instrumental sounds using metric learning," Proc. APSIPA ASC, pp. 33-38, Nov. 7, 2022. [Open Access]
Jingyi Feng, Tomohiro Yoshikawa, Tomoki Toda, "Interpretable control for emotional text-to-speech system toward development of sympathetic educational-support robots," Proc. APSIPA ASC, pp. 342-346, Nov. 7, 2022. [Open Access]
Rui Wang, Li Li, Tomoki Toda, "Direction-aware target speaker extraction with a dual-channel system based on conditional variational autoencoders under underdetermined conditions," Proc. APSIPA ASC, pp. 347-353, Nov. 7, 2022. [Open Access]
Shuhei Yamaji, Taishi Nakashima, Nobutaka Ono, Li Li, Hirokazu Kameoka, "Encoder re-training with mixture signals on FastMVAE method," Proc. APSIPA ASC, pp. 705-709, Nov. 7, 2022. [Open Access]
Kosuke Nishida, Natsuki Ueno, Yuma Kinoshita, Nobutaka Ono, "Estimation of transfer coefficients and signals of sound-to-light conversion device Blinky under saturation," Proc. APSIPA ASC, pp. 718-723, Nov. 7, 2022. [Open Access]
Taishi Nakashima, Nobutaka Ono, "Inverse-free online independent vector analysis with flexible iterative source steering," Proc. APSIPA ASC, pp. 750-754, Nov. 7, 2022. [Open Access]
Yui Kuriki, Taishi Nakashima, Kouei Yamaoka, Natsuki Ueno, Yukoh Wakabayashi, Nobutaka Ono, Ryo Sato, "Efficient low-latency convolution with uniform filter partition and its evaluation on real-time blind source separation," Proc. APSIPA ASC, pp. 766-770, Nov. 7, 2022. [Open Access]
Kenta Yamada, Yoshiki Masuyama, Yukoh Wakabayashi, Nobutaka Ono, "Simultaneous frequency estimation for three or more sinusoids based on sinusoidal constraint differential equation," Proc. APSIPA ASC, pp. 976-979, Nov. 7, 2022. [Open Access]
Kohei Suzuki, Shoki Sakamoto, Tadahiro Taniguchi, Hirokazu Kameoka, "Speak like a dog: human to non-human creature voice conversion," Proc. APSIPA ASC, pp. 1385-1390, Nov. 7, 2022. [Open Access]
Shaowen Chen, Tomoki Toda, "Sequence-wise optimization for quasi-harmonic speech waveform modeling," Proc. APSIPA ASC, pp. 1658-1663, Nov. 7, 2022. [Open Access]
Chao Xie, Tomoki Toda, "Noisy-to-noisy voice conversion with pre-training strategy," Proc. ICA, ABS-0801, 5 pages, Oct. 2022 (Invited in structured session "A15-06: Voice conversion").
Hirokazu Kameoka, Takuhiro Kaneko, Shogo Seki, Kou Tanaka, "CAUSE: Crossmodal action unit sequence estimation from speech with application to facial animation synthesis," Proc. INTERSPEECH, pp. 506-510, Sep. 18, 2022. [Open Access]
Yoshiki Masuyama, Kouei Yamaoka, Nobutaka Ono, "Joint optimization of sampling rate offsets based on entire signal relationship among distributed microphones," Proc. INTERSPEECH, pp. 704-708, Sep. 18, 2022. [Open Access]
Reo Yoneyama, Yi-Chiao Wu, Tomoki Toda, "Unified source-filter GAN with harmonic-plus-noise source excitation generation," Proc. INTERSPEECH, pp. 848-852, Sep. 18, 2022. [Open Access]
Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Shogo Seki, "MISRNet: Lightweight neural vocoder using multi-input single shared residual blocks," Proc. INTERSPEECH, pp. 1631-1635, Sep. 18, 2022. [Open Access]
Wen-Chin Huang, Erica Cooper, Yu Tsao, Hsin-Min Wang, Tomoki Toda, Junichi Yamagishi, "The VoiceMOS Challenge 2022," Proc. INTERSPEECH, pp. 4536-4540, Sep. 18, 2022. [Open Access]
Yeonjong Choi, Chao Xie, Tomoki Toda, "An evaluation of three-stage voice conversion framework for noisy and reverberant conditions," Proc. INTERSPEECH, pp. 4910-4914, Sep. 18, 2022. [Open Access]
Natsuki Ueno, Hirokazu Kameoka, "Multiple sound source localization based on stochastic modeling of spatial gradient spectra," Proc. EUSIPCO, pp. 31-35, Aug. 29, 2022. [Open Access]
Sehun Kim, Tomoki Hayashi, Tomoki Toda, "Note-level automatic guitar transcription using attention mechanism," Proc. EUSIPCO, pp. 229-233, Aug. 29, 2022. [Open Access]
Shuming Luan, Yukoh Wakabayashi, Tomoki Toda, "Modified sound field interpolation method for rotation-robust beamforming with unequally spaced circular microphone array," Proc. EUSIPCO, pp. 344-348, Aug. 29, 2022. [Open Access]
Shogo Seki, Hirokazu Kameoka, Li Li, "Investigation and comparison of optimization methods for variational autoencoder-based underdetermined multichannel source separation," Proc. IEEE ICASSP, pp. 511-515, May 23, 2022. [Link]
Li Li, Hirokazu Kameoka, Shogo Seki, "HBP: An efficient block permutation solver using Hungarian algorithm and spectrogram inpainting for multichannel audio source separation," Proc. IEEE ICASSP, pp. 516-520, May 23, 2022. [Link]
Hirokazu Kameoka, Shogo Seki, Li Li, Chihiro Watanabe, "AttentionPIT: Soft permutation invariant training for audio source separation with attention mechanism," Proc. IEEE ICASSP, pp. 706-710, May 23, 2022. [Link]
Wen-Chin Huang, Erica Cooper, Junichi Yamagishi, Tomoki Toda, "LDNet: unified listener dependent modeling in MOS prediction for synthetic speech," Proc. IEEE ICASSP, pp. 896-900, May 23, 2022. [arXiv preprint]
Natsuki Ueno, Nobutaka Ono, "Instantaneous linear dimensionality reduction of multichannel time-series signal for array signal processing," Proc. IEEE ICASSP, pp. 931-935, May 23, 2022. [Link]
Takuhiro Kaneko, Kou Tanaka, Hirokazu Kameoka, Shogo Seki, "iSTFTNet: Fast and lightweight mel-spectrogram vocoder incorporating inverse short-time Fourier transform," Proc. IEEE ICASSP, pp. 6207-6211, May 23, 2022. [arXiv preprint]
Wen-Chin Huang, Shu-Wen Yang, Tomoki Hayashi, Hung-Yi Lee, Shinji Watanabe, Tomoki Toda, "S3PRL-VC: open-source voice conversion framework with self-supervised speech representations," Proc. IEEE ICASSP, pp. 6552-6556, May 23, 2022. [arXiv preprint]
Wen-Chin Huang, Bence Mark Halpern, Lester Phillip Violeta, Odette Scharenborg, Tomoki Toda, "Towards identity preserving normal to dysarthric voice conversion," Proc. IEEE ICASSP, pp. 6672-6676, May 23, 2022. [arXiv preprint]
Chao Xie, Yi-Chiao Wu, Patrick Lumban Tobing, Wen-Chin Huang, Tomoki Toda, "Direct noisy speech modeling for noisy-to-noisy voice conversion," Proc. IEEE ICASSP, pp. 6787-6791, May 23, 2022. [arXiv preprint]
Tomoki Hayashi, Kazuhiro Kobayashi, Tomoki Toda, "An investigation of streaming non-autoregressive sequence-to-sequence voice conversion," Proc. IEEE ICASSP, pp. 6802-6806, May 23, 2022. [Link]
Erica Cooper, Wen-Chin Huang, Tomoki Toda, Junichi Yamagishi, "Generalization ability of MOS prediction networks," Proc. IEEE ICASSP, pp. 8442-8446, May 23, 2022. [arXiv preprint]
Koudai Mogi, Taishi Nakashima, Kouei Yamaoka, Yukoh Wakabayashi, Nobutaka Ono, "Source selection using multiple directions of arrival estimation based on blind source separation," Proc. NCSP, pp. 253-256, Mar. 2022.【NCSP'22 Best Student Paper Award（受賞者：Koudai Mogi）】
Wen-Chin Huang, Shu-Wen Yang, Tomoki Hayashi, Hung-Yi Lee, Shinji Watanabe, Tomoki Toda, "S3PRL-VC: open-source voice conversion framework with self-supervised speech representations," Proc. AAAI-22 Workshop, W35: Self-Supervised Learning for Audio and Speech Processing, 5 pages, Feb. 2022. [Open Access]
Zhaopeng Qian, Haijun Niu, Li Wang, Kazuhiro Kobayashi, Shaochuan Zhang, Tomoki Toda, "Mandarin electro-laryngeal speech enhancement based on statistical voice conversion and manual tone control," Proc. APSIPA ASC, pp. 546-552, Dec. 14, 2021. [Open Access]
Yoshiki Masuyama, Kouei Yamaoka, Yuma Kinoshita, Nobutaka Ono, "Causal distortionless response beamforming by alternating direction method of multipliers," Proc. APSIPA ASC, pp. 585-590, Dec. 14, 2021. [Open Access]
Chao Xie, Yi-Chiao Wu, Patrick Lumban Tobing, Wen-Chin Huang, Tomoki Toda, "Noisy-to-noisy voice conversion framework with denoising model," Proc. APSIPA ASC, pp. 814-820, Dec. 14, 2021. [Open Access]
Ding Ma, Wen-Chin Huang, Tomoki Toda, "Investigation of text-to-speech-based synthetic parallel data for sequence-to-sequence non-parallel voice conversion," Proc. APSIPA ASC, pp. 870-877, Dec. 14, 2021. [Open Access]【APSIPA ASC 2021 The Best Paper Award】
Guansan Lian, Yukoh Wakabayashi, Taishi Nakashima, Nobutaka Ono, "Self-rotation angle estimation of circular microphone array based on sound field interpolation," Proc. APSIPA ASC, pp. 1016-1020, Dec. 14, 2021. [Open Access]
Yuma Kinoshita, Nobutaka Ono, "Analysis on roles of DNNs in end-to-end acoustic scene analysis framework with distributed sound-to-light conversion devices," Proc. APSIPA ASC, pp. 1167-1172, Dec. 14, 2021. [Open Access]【APSIPA ASC 2021 The Best Paper Award】
Chiho Haruta, Nobutaka Ono, Yuma Kinoshita, "Framewise finite impulse response filtering based on time-frequency mask for low-latency speech enhancement," Proc. APSIPA ASC, pp. 1215-1220, Dec. 14, 2021. [Open Access]
Yi-Syuan Liou, Wen-Chin Huang, Ming-Chi Yen, Shu-Wei Tsai, Yu-Huai Peng, Tomoki Toda, Yu Tsao, Hsin-Min Wang, "Time alignment using lip images for frame-based electrolaryngeal voice conversion," Proc. APSIPA ASC, pp. 1234-1238, Dec. 14, 2021. [Open Access]
Wen-Chin Huang, Tomoki Hayashi, X. Li, Shinji Watanabe, Tomoki Toda, "On prosody modeling for ASR+TTS based voice conversion," Proc. IEEE ASRU, pp. 642-649, Dec. 13, 2021. [arXiv preprint]
Ming-Chi Yen, Wen-Chin Huang, Kazuhiro Kobayashi, Yu-Huai Peng, Shu-Wei Tsai, Yu Tsao, Tomoki Toda, Jyh-Shing Roger Jang, Hsin-Min Wang, "Mandarin electrolaryngeal speech voice conversion with sequence-to-sequence modeling," Proc. IEEE ASRU, pp. 650-657, Dec. 13, 2021. [Link]
Shogo Seki, Haruka Taga, Tomoki Toda, "Singing fundamental frequency contour generation using generalized command response model and score-conditional variational autoencoder," Proc. IEEE MLSP, 6 pages, Oct. 25, 2021. [Link]
Wen-Chin Huang, Kazuhiro Kobayashi, Yu-Huai Peng, Ching-Feng Liu, Yu Tsao, Hsin-Min Wang, Tomoki Toda, "A preliminary study of a two-stage paradigm for preserving speaker identity in dysarthric voice conversion," Proc. INTERSPEECH, pp. 1329-1333, Aug. 30, 2021. [Open Access]
Shoki Sakamoto, Akira Taniguchi, Tadahiro Taniguchi, Hirokazu Kameoka, "StarGAN-VC+ASR: StarGAN-based non-parallel voice conversion regularized by automatic speech recognition," Proc. INTERSPEECH, pp. 1359-1363, Aug. 30, 2021. [Open Access]
Reo Yoneyama, Yi-Chiao Wu, Tomoki Toda, "Unified source-filter GAN: unified source-filter network based on factorization of quasi-periodic parallel WaveGAN," Proc. INTERSPEECH, pp. 2187-2191, Aug. 30, 2021. [Open Access]
Patrick Lumban Tobing, Tomoki Toda, "High-fidelity and low-latency universal neural vocoder based on multiband WaveRNN with data-driven linear prediction for discrete waveform modeling," Proc. INTERSPEECH, pp. 2217-2221, Aug. 30, 2021. [Open Access]
Yi-Chiao Wu, Cheng-Hung Hu, Hung-Shin Lee, Yu-Huai Peng, Wen-Chin Huang, Yu Tsao, Hsin-Min Wang, Tomoki Toda, "Relational data selection for data augmentation of speaker-dependent multi-band MelGAN vocoder," Proc. INTERSPEECH, pp. 3630-3634, Aug. 30, 2021. [Open Access]
Patrick Lumban Tobing, Tomoki Toda, "Low-latency real-time non-parallel voice conversion based on cyclic variational autoencoder and multiband WaveRNN with data-driven linear prediction," Proc. SSW, pp. 142-147, Aug. 26, 2021. [Open Access]
Yuma Kinoshita, Nobutaka Ono, "End-to-end training for acoustic scene analysis with distributed sound-to-light conversion devices," Proc. EUSIPCO, pp. 1010-1014, Aug. 23, 2021. [Open Access]
Chiho Haruta, Nobutaka Ono, "A low-computational DNN-based speech enhancement for hearing aids based on element selection," Proc. EUSIPCO, pp. 1025-1029, Aug. 23, 2021. [Open Access]
Shota Inoue, Hirokazu Kameoka, Li Li, Shoji Makino, "SepNet: a deep separation matrix prediction network for multichannel audio source separation," Proc. IEEE ICASSP, pp. 191-195, June 6, 2021. [Link]
Yukoh Wakabayashi, Kouei Yamaoka, Nobutaka Ono, "Rotation-robust beamforming based on sound field interpolation with regularly circular microphone array," Proc. IEEE ICASSP, pp. 771-775, June 6, 2021. [Link]
Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Nobukatsu Hojo, "MaskCycleGAN-VC: learning non-parallel voice conversion with filling in frames," Proc. IEEE ICASSP, pp. 5904-5908, June 6, 2021. [arXiv preprint]
Kazuhiro Kobayashi, Wen-Chin Huang, Yi-Chiao Wu, Patrick Lumban Tobing, Tomoki Hayashi, Tomoki Toda, "Crank: an open-source software for nonparallel voice conversion based on vector-quantized variational autoencoder," Proc. IEEE ICASSP, pp. 5934-5938, June 6, 2021. [arXiv preprint]
Wen-Chin Huang, Yi-Chiao Wu, Tomoki Hayashi, Tomoki Toda, "Any-to-one sequence-to-sequence voice conversion using self-supervised discrete speech representations," Proc. IEEE ICASSP, pp. 5944-5948, June 6, 2021. [arXiv preprint]
Tomoki Hayashi, Wen-Chin Huang, Kazuhiro Kobayashi, Tomoki Toda, "Non-autoregressive sequence-to-sequence voice conversion," Proc. IEEE ICASSP, pp. 7068-7072, June 6, 2021. [arXiv preprint]
Kanato Ishii, Yuma Kinoshita, Yukoh Wakabayashi, Nobutaka Ono, "Real-time pitch visualization using sound-light conversion device Blinky," Proc. NCSP, pp. 101-104, Mar. 1, 2021.
Naoya Murashima, Hirokazu Kameoka, Li Li, Shogo Seki, Shoji Makino, "Single-channel muti-speaker separation via discriminative training of variational autoencoder spectrogram model," Proc. NCSP, pp. 149-152, Mar. 1, 2021.【NCSP'21 Student Paper Award（受賞者：Naoya Murashima）】
Taishi Nakashima, Robin Scheibler, Yukoh Wakabayashi, Nobutaka Ono, "Faster independent low-rank matrix analysis with pairwise updates of demixing vectors," Proc. EUSIPCO, pp. 301-305, Jan. 18, 2021. [Open Access]
Kazuhiro Kobayashi, Tomoki Toda, "Implementation of low-latency electrolaryngeal speech enhancement based on multi-task CLDNN," Proc. EUSIPCO, pp. 396-400, Jan. 18, 2021. [Open Access]
Moe Takada, Shogo Seki, Patrick Lumban Tobing, Tomoki Toda, "Semi-supervised enhancement and suppression of self-produced speech using correspondence between air- and body-conducted signals," Proc. EUSIPCO, pp. 456-460, Jan. 18, 2021. [Open Access]
Daiki Horiike, Robin Scheibler, Yuma Kinoshita, Yukoh Wakabayashi, Nobutaka Ono, "Energy-based multiple source localization with Blinkies," Proc. APSIPA ASC, pp. 443-448, Dec. 7, 2020. [Open Access]
Hikaru Nakatani, Patrick Lumban Tobing, Kazuya Takeda, Tomoki Toda, "Cross-lingual voice conversion with cyclic variational auto-encoder and a WaveNet vocoder," Proc. APSIPA ASC, pp. 520-526, Dec. 7, 2020. [Open Access]
Mohammad Eshghi, Kazuhiro Kobayashi, Kou Tanaka, Hirokazu Kameoka, Tomoki Toda, "Phoneme embeddings on predicting fundamental frequency pattern for electrolaryngeal speech," Proc. APSIPA ASC, pp. 572-577, Dec. 7, 2020. [Open Access]
Taishi Nakashima, Robin Scheibler, Yukoh Wakabayashi, Nobutaka Ono, "Performance evaluation of independent low-rank matrix analysis for short signals," Proc. Forum Acusticum, pp. 837-840, Dec. 7, 2020. [Open Access]
Zhao Yi, Wen-Chin Huang, Xiaohai Tian, Junichi Yamagishi, Rohan Kumar Das, Tomi Kinnunen, Zhenhua Ling, Tomoki Toda, "Voice Conversion Challenge 2020: Intra-lingual semi-parallel and cross-lingual voice conversion," Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020, pp. 80-98, Oct. 30, 2020. [Open Access]
Rohan Kumar Das, Tomi Kinnunen, Wen-Chin Huang, Zhenhua Ling, Junichi Yamagishi, Zhao Yi, Xiaohai Tian, Tomoki Toda, "Predictions of subjective ratings and spoofing assessments of Voice Conversion Challenge 2020 submissions," Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020, pp. 99-120, Oct. 30, 2020. [Open Access]
Patrick Lumban Tobing, Yi-Chiao Wu, Tomoki Toda, "Baseline system of Voice Conversion Challenge 2020 with cyclic variational autoencoder and parallel WaveGAN," Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020, pp. 155-159, Oct. 30, 2020. [Open Access]
Wen-Chin Huang, Tomoki Hayashi, Shinji Watanabe, Tomoki Toda, "The sequence-to-sequence baseline for the Voice Conversion Challenge 2020: cascading ASR and TTS," Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020, pp. 160-164, Oct. 30, 2020. [Open Access]
Wen-Chin Huang, Patrick Lumban Tobing, Yi-Chiao Wu, Kazuhiro Kobayashi, Tomoki Toda, "The NU voice conversion system for the Voice Conversion Challenge 2020: on the effectiveness of sequence-to-sequence models and autoregressive neural vocoders," Proc. Joint workshop for the Blizzard Challenge and Voice Conversion Challenge 2020, pp. 165-169, Oct. 30, 2020. [Open Access]
Takuhiro Kaneko, Hirokazu Kameoka, Kou Tanaka, Nobukatsu Hojo, "CycleGAN-VC3: examining and improving CycleGAN-VCs for mel-spectrogram conversion," Proc. INTERSPEECH, pp. 2017-2021, Oct. 25, 2020. [Open Access]
Yi-Chiao Wu, Tomoki Hayashi, Takuma Okamoto, Hisashi Kawai, Tomoki Toda, "Quasi-periodic parallel WaveGAN vocoder: a non-autoregressive pitch-dependent dilated convolution model for parametric speech generation," Proc. INTERSPEECH, pp. 3535-3539, Full virtual, Oct. 25, 2020. [Open Access]
Yi-Chiao Wu, Patrick Lumban Tobing, Kazuki Yasuhara, Noriyuki Matsunaga, Yamato Ohtani, Tomoki Toda, "A cyclical post-filtering approach to mismatch refinement of neural vocoder for text-to-speech systems," Proc. INTERSPEECH, pp. 3540-3544, Full virtual, Oct. 25, 2020. [Open Access]
Shogo Seki, Moe Takada, Tomoki Toda, "Semi-supervised self-produced speech enhancement and suppression based on joint source modeling of air- and body-conducted signals using variational autoencoder," Proc. INTERSPEECH, pp. 4039-4043, Oct. 25, 2020. [Open Access]
Shu Hikosaka, Shogo Seki, Tomoki Hayashi, Kazuhiro Kobayashi, Kazuya Takeda, Hideki Banno, Tomoki Toda, "Intelligibility enhancement based on speech waveform modification using hearing impairment simulator," Proc. INTERSPEECH, pp. 4059-4063, Oct. 25, 2020. [Open Access]
Wen-Chin Huang, Tomoki Hayashi, Yi-Chiao Wu, Hirokazu Kameoka, Tomoki Toda, "Voice transformer network: sequence-to-sequence voice conversion using transformer with text-to-speech pretraining," Proc. INTERSPEECH, pp. 4676-4680, Full virtual, Oct. 25, 2020. [Open Access]
Patrick Lumban Tobing, Tomoki Hayashi, Yi-Chiao Wu, Kazuhiro Kobayashi, Tomoki Toda, "Cyclic spectral modeling for unsupervised unit discovery into voice conversion with excitation and waveform modeling," Proc. INTERSPEECH, pp. 4861-4865, Oct. 25, 2020. [Open Access]
Li Li, Hirokazu Kameoka, Shoji Makino, "Determined audio source separation with multichannel star generative adversarial network," Proc. IEEE MLSP, 6 pages, Sep. 21, 2020. [Link]
Robin Scheibler, Nobutaka Ono, "Fast and stable blind source separation with rank-1 updates," Proc. IEEE ICASSP, pp. 236-240, May 4. 2020. [Link]
Robin Scheibler, Nobutaka Ono, "Fast independent vector extraction by iterative SINR maximization," Proc. IEEE ICASSP, pp. 601-605, May 4. 2020. [arXiv preprint]
Patrick Lumban Tobing, Yi-Chiao Wu, Tomoki Hayashi, Kazuhiro Kobayashi, Tomoki Toda, "Efficient shallow WaveNet vocoder using multiple samples output based on Laplacian distribution and linear prediction," IEEE ICASSP, pp. 7204-7208, May 4. 2020. [Link]

解説

クーパーエリカ, ホワンウェンチン, ツァオユ, ワンシンミン, 戸田智基, 山岸順一, "合成音声の客観評価とVoiceMOSチャレンジ," 日本音響学会誌, Vol. 80, No. 7, pp. 381-392, 2024年7月1日. [Open Access]
安田裕介, 戸田智基, "音声のMOS評価法の限界と大規模比較評価の新しい可能性," 日本音響学会誌, Vol. 80, No. 7, pp. 393-400, 2024年7月1日. [Open Access]
Erica Cooper, Wen-Chin Huang, Yu Tsao, Hsin-Min Wang, Tomoki Toda, Junichi Yamagishi, "A review on subjective and objective evaluation of synthetic speech," Acoustical Science and Technology, Vol. 45, No. 4, pp. 161-183, July 1, 2024. [Open Access]

招待講演

戸田智基, "音声変換の基礎と研究動向," 名古屋工業大学国際音声言語生成技術研究所特別講演会, 2024年12月9日.
Wen-Chin Huang, "深層学習に基づく音声変換の進展と展望," 情報処理学会音声言語情報処理研究発表会／電子情報通信学会音声研究会, オンライン, 2024年10月22日.
Tomoki Toda, "Voice conversion techniques to separately control static and dynamic speech characteristics," Frontier Forum on Intelligent Speech Analysis and Generation, University of Science and Technology of China, Hefei, China, July 5, 2024.
Tomoki Toda, "Challenges in leveraging large models for augmented speech production," RASDAP 2024, TCSDAP, Suzhou, China, Apr. 21, 2024 (Online).
戸田智基, "音声生成に関する情報処理技術の研究事例," 第76回人工知能セミナー「音声AIを支える基盤技術の最前線」, 人工知能研究センター, 2024年3月22日.
小林和弘, "音声変換の実応用に向けて," 電気・電子・情報関係学会東海支部連合大会, 【OS7】音響工学への深層学習の応用, J5-1, 愛知, 2023年8月29日.
戸田智基, "音声情報処理の最先端から見える未来," 第64回日本神経学会学術大会シンポジウム「脳神経内科領域でのAIの未来：基礎研究から臨床応用まで」, S-15-2, 千葉, 2023年6月1日.
戸田智基, "深層生成モデルに基づく音声合成技術", 第21回情報科学技術フォーラム（FIT2022）, イベント企画「深層生成モデル」, 神奈川, 2022年9月13日.
李莉, "信号の独立性に基づく多チャンネル音源分離," 電気・電子・情報関係学会東海支部連合大会, 【OS2】音響学の次世代を担う若手研究者による異分野融合セッション, J6-1, オンライン, 2022年8月30日.
亀岡弘和, "コミュニケーション機能拡張のための機械学習基盤とクロスモーダル信号生成," 情報処理学会音学シンポジウム, オンライン, 2022年6月18日.
Wen-Chin Huang, Erica Cooper, Yu Tsao, Hsin-Min Wang, Tomoki Toda, Junichi Yamagishi, "The VoiceMOS Challenge 2022", 情報処理学会音声言語情報処理研究発表会／電子情報通信学会音声研究会, オンライン, 2022年3月23日.
戸田智基, "共創型音メディア機能拡張に向けた取り組み," 電気・電子・情報関係学会東海支部連合大会, 企画セッション「音メディア情報処理と共創型機能拡張への展開」, オンライン, 2021年9月8日.
戸田智基, "発声機能拡張のためのインタラクティブ音声変換," 電気・電子・情報関係学会東海支部連合大会, 企画セッション「音メディア情報処理と共創型機能拡張への展開」, オンライン, 2021年9月8日.
小野順貴, "聴覚機能拡張のための低遅延リアルタイム音源分離とブリンキー," 電気・電子・情報関係学会東海支部連合大会, 企画セッション「音メディア情報処理と共創型機能拡張への展開」, オンライン, 2021年9月8日.
亀岡弘和, "コミュニケーション機能拡張のための機械学習基盤とクロスモーダル処理," 電気・電子・情報関係学会東海支部連合大会, 企画セッション「音メディア情報処理と共創型機能拡張への展開」, オンライン, 2021年9月8日.
春田智穂, "要素選択を用いた次元削減によるDNN音声強調の低演算量化の検討," Tokyo BISH Bash #05, オンライン, 2021年6月23日.
Tomoki Toda, "Interactive voice conversion for augmented speech production", SNL, Online, July 2, 2021.
戸田智基, "CREST「共生インタラクション」共創型音メディア機能拡張プロジェクト," 情報処理学会音声言語情報処理研究会, オンライン, 2021年2月18日.
Tomoki Toda, "Recent progress on voice conversion: what is next?", IEEE SLT, Online, Jan. 21, 2021.
Tomoki Toda, "Recent trend of voice conversion research and its possible future direction", Keynote, ROCLING (the 32nd Annual Conference on Computational Linguistics and Speech Processing in Taiwan), Taipei, Taiwan, Sep. 24, 2020.
戸田智基, "音声変換技術と音声生成機能拡張への応用," 電子情報通信学会2020年総合大会ソサイエティ合同企画「情報通信技術と人間相互理解の未来」, 2020年3月18日.（大会中止）
亀岡弘和, 金子卓弘, 田中宏, 北条伸克, "画像変換／系列変換アプローチを用いた音声変換," 第21回音声言語シンポジウム(SP/SLP 2研究会連立開催研究会), 東京, 2019年12月6日.
Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, Nobukatsu Hojo, "Voice conversion with image-to-image translation and sequence-to-sequence learning approaches," SANE 2019 - Speech and Audio in the Northeast, New York, U.S.A., Oct. 24, 2019.

国内研究会・大会講演

服部公宏, ホワンウェンチン, 武田一哉, 戸田智基, "多様なシミュレーション音場における教師あり仮想マイクアレイ信号推定の汎化性能評価," 電子情報通信学会音声研究会, 技術研究報告, Vol. 125, No. 74, SP2025-20, pp. 107-112, 2025年6月14日.
橋本圭織，河村隆生, 小野順貴, 西澤佳飛, 戸田智基, "倍音の振幅操作に基づく母音の無限音階化の検討," 日本音響学会2025年春季研究発表会, 1-R-43, 講演論文集, pp. 733-734, 2025年3月17日.
米山怜於, 宮下敦志, 山本龍一, 戸田智基, "Wavehax：調波信号モデルと2次元畳み込みを用いた複素スペクトログラム推定に基づくエイリアシングフリーニューラルボコーダ," 日本音響学会2025年春季研究発表会, 1-2-9, 講演論文集, pp. 909-912, 2025年3月17日.
Wen-Chin Huang, Erica Cooper, 戸田智基, "MOS-Bench: 音声品質評価モデルの汎化能力に着目したベンチマーク," 日本音響学会2025年春季研究発表会, 3-2-1, 講演論文集, pp. 959-960, 2025年3月19日.
荻田健一, 米山怜於, Wen-Chin Huang, 戸田智基, "VAE-SiFiGAN: 変分自己符号化表現に基づくSiFiGAN," 日本音響学会2025年春季研究発表会, 1-R-30, 講演論文集, pp. 1073-1074, 2025年3月17日.
尹道鉉, 安田裕介, 戸田智基, "聴取実験に基づく深層音声電子透かし最適化基準の設計," 日本音響学会2025年春季研究発表会, 3-P-6, 講演論文集, pp. 1093-1094, 2025年3月19日.
西澤佳飛, 山本龍一, Wen-Chin Huang, 戸田智基, "歌声合成を用いた斉唱の自然性に関する要因調査," 日本音響学会2025年春季研究発表会, 3-P-31, 講演論文集, 1171-1172, 2025年3月19日.
澤田桂都, Wen-Chin Huang, 戸田智基, "小節特徴量を活用した楽曲の大局的構造を反映した自動作曲," 日本音響学会2025年春季研究発表会, 1-5-3, 講演論文集, pp. 1201-1202, 2025年3月17日.
今村剛大, 橋爪優果, ホワンウェンチン, 戸田智基, "個別楽器音に基づく知覚的楽曲間類似度表現学習," 情報処理学会音楽情報科学研究発表会, 研究報告, 2025-MUS-142, No. 7, pp. 1-9, 2025年3月6日
澤田桂都, Wen-Chin Huang, 戸田智基, "大局的構造生成のための小節特徴量系列モデリングに基づく階層的自動作曲," 情報処理学会音楽情報科学研究発表会, 研究報告, Vol. 2025-MUS-142, No. 49, pp. 1-7, 2025年3月8日.【第142回音楽情報科学研究会学生奨励賞 Best Research 部門（受賞者：澤田桂都）】
小磯心，中嶋大志，小野順貴, "プロジェクションバックされた分離ベクトルを用いた正則化に基づく音源分離の検討," 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 124, No. 389, EA2024-143, pp. 397-402, 2025年3月4日.
風間香伽，中嶋大志，小野順貴, "相対伝達関数に基づく自己音声選択を用いた頭部装着型マイクロホンアレイによるリアルタイムブラインド音源分離," 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 124, No. 389, EA2024-144, pp. 403-408, 2025年3月4日.
増子凱斗，中嶋大志，小野順貴, "オンライン補助関数型独立ベクトル分析への乗法更新則の導入とそれに基づく音源毎忘却係数制御の検討," 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 124, No. 389, EA2024-145, pp. 409-414, 2025年3月4日.
風間香伽，中嶋大志，小野順貴, "頭部装着マイクロフォンアレイにおける自己音声の相対伝達関数計測," 日本音響学会2024年秋季研究発表会, 1-R-7, 講演論文集, pp. 211-212, 2024年9月4日.
Wen-Chin Huang, Yi-Chiao Wu, 戸田智基, "話者匿名化したデータを用いる多話者テキスト音声合成," 日本音響学会2024年秋季研究発表会, 1-6-4, pp. 1071-1074, 講演論文集, 2024年9月4日
小林和弘, 荻田健一, 丹羽希碩, Lester Violeta，Wen-Chin Huang, 戸田智基, "模擬電気喉頭音声コーパス," 日本音響学会2024年秋季研究発表会, 2-Q-28, 講演論文集, pp. 1221-1222, 2024年9月5日.
宮下敦志, 戸田智基, "ワーピングを用いた電気式人工喉頭音声変換システムに適した発話例生成," 日本音響学会2024年秋季研究発表会, 2-Q-35, 講演論文集, pp. 1241-1242, 2024年9月5日.【第29回日本音響学会学生優秀発表賞（受賞者：宮下敦志）】
橋爪優果, 戸田智基, "各楽器パートに焦点を当てた知覚的楽曲間類似度の調査," 日本音響学会2024年秋季研究発表会, 2-1-18, 講演論文集, pp. 1369-1370, 2024年9月5日.
安田裕介, 戸田智基, "合成音声の大規模主観比較評価からの絶対品質推定," 日本音響学会2024年秋季研究発表会, 3-6-5, 講演論文集, pp. 1137-1140, 2024年9月6日.
今村剛大, 橋爪優果, 戸田智基, "個別楽器音に基づく楽曲間類似度表現学習における音源分離の活用法," 情報処理学会音楽情報科学研究発表会, 研究報告, Vol. 2024-MUS-140, No. 54, pp. 1-7, 2024年6月15日.
橋爪優果, 宮下敦志, 李莉, 戸田智基, "多視点楽曲検索に向けた楽曲分離表現学習," 2024年度人工知能学会全国大会, 1O4-OS-29a-01, 論文集, pp. 1-4, 2024年5月28日.【第38回人工知能学会全国大会優秀賞オーガナイズドセッション口頭発表部門（受賞者：橋爪優果）】
増子凱斗, 中嶋大志, 河村隆生, 小野順貴, "オンライン補助関数型独立ベクトル分析の忘却係数の動的制御による移動音源分離," 日本音響学会2024年春季研究発表会, 1-4-5, 講演論文集, pp. 79-82, 2024年3月6日.【第28回日本音響学会学生優秀発表賞（受賞者：増子凱斗）】
HUANG Wen-Chin, 小林和弘, 戸田智基, "AAS-VC：非自己回帰型系列音声変換における時間対応付け学習の頑健性," 日本音響学会2024年春季研究発表会, 1-2-11, 講演論文集, pp. 789-792, 2024年3月6日.
岡森一樹, 武田一哉, 戸田智基, "トランペット演奏を対象としたオンセット検出に基づくテンポ変化推定," 日本音響学会2024年春季研究発表会, 1-5-3, 講演論文集, pp. 1067-1068, 2024年3月6日.
尹道鉉, 戸田智基, "深層情報埋め込み・検出に基づくプロアクティブ型ディープフェイク音声検知," 日本音響学会2024年春季研究発表会, 2-P-9, 講演論文集, pp. 969-970, 2024年3月7日.【第28回日本音響学会学生優秀発表賞（受賞者：尹道鉉）】
丹羽希碩, 小林和弘, 戸田智基, "リアルタイム音声変換における聴覚フィードバックの影響に関する調査," 日本音響学会2024年春季研究発表会, 2-P-21, 講演論文集, pp. 1009-1010, 2024年3月7日.
安田裕介，戸田智基, "クラウドソーシングを用いた大規模比較評価のための評価ペアの組み合わせと評価数のオンライン最適化," 日本音響学会2024年春季研究発表会, 2-P-39, 講演論文集, pp. 1057-1060, 2024年3月7日.
今村瑛月, 河村隆生, 山田健太, 植野夏樹, 小野順貴, "スマートフォン上での音光変換を用いた音響情報のデジタル伝送," 日本音響学会2024年春季研究発表会, 3-Q-39, 講演論文集, pp. 293-296, 2024年3月8日.
栗城結衣，中嶋大志，小野順貴, "プロジェクションバックされた分離行列の直接更新," 信学技報, 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 123, No. 401, EA2023-66, pp. 31-36, 2024年2月29日.
河村泰雅，植野夏樹，小野順貴, "非凸スパース最適化を用いた識別性基準の要素選択," 電子情報通信学会信号処理研究会, 技術研究報告, Vol. 123, No. 402, SIP2023-130, pp. 133-138, 2024年2月29日.
山田健太, 升山義紀, 山岡洸瑛, 植野夏樹, 小野順貴, "微分方程式に基づく有限次数調波信号の多重ピッチ推定," 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 123, No. 401, EA2023-115, pp. 315-320, 2024年3月1日.
近藤祐斗, 亀岡弘和, 田中宏, 金子卓弘, "下位N位スコア平均に基づくMOS予測モデル学習," 電子情報通信学会音声研究会, 技術研究報告, Vol. 123, No. 403, SP2023-76, pp. 196-201, 2024年3月1日.
Ding Ma, Lester Phillip Violeta, Kazuhiro Kobayashi, Tomoki Toda, "Sequence-to-sequence voice conversion for electrolaryngeal speech enhancement with multi-stage pretraining and fine-tuning techniques," 電子情報通信学会音声研究会, 技術研究報告, Vol. 123, No. 212, SP2023-32, pp. 27-32, 2023年10月14日.
Lester Phillip Violeta, Wen-Chin Huang, Ding Ma, Ryuichi. Yamamoto, Kazuhiro Kobayashi, Tomoki Toda, "Electrolaryngeal speech enhancement through strong linguistic encoding methods," 電子情報通信学会音声研究会, 技術研究報告, Vol. 123, No. 212, SP2023-33, pp. 33-38, 2023年10月14日.
金子卓弘, 亀岡弘和, 田中宏, 関翔悟, "iSTFTNet2：1D-2D CNNを用いたiSTFTNetニューラルボコーダの高速化と軽量化," 日本音響学会2023年秋季研究発表会, 1-9-8, 講演論文集, pp. 1049-1050, 2023年9月26日.
山本龍一, 米山怜於, 戸田智基, "NNSVS: ニューラルネットワークに基づく歌声合成のためのオープンソースソフトウェア," 日本音響学会2023年秋季研究発表会, 1-9-19, 講演論文集, pp. 1057-1060, 2023年9月26日.
田中宏，金子卓弘，亀岡弘和，関翔悟, "CFVC: 制御可能な音声変換のための条件付きフィルタリング," 日本音響学会2023年秋季研究発表会, 2-9-2, 講演論文集, pp. 1079-1080, 2023年9月27日.
近藤祐斗, 亀岡弘和, 田中宏, 金子卓弘, 原田登, "音声特徴表現語に基づく音声の主観評価予測," 日本音響学会2023年秋季研究発表会, 3-Q-28, 講演論文集, pp. 1383-1386, 2023年9月28日.
橋爪優果, 李莉, 宮下敦志, 戸田智基, "個別楽器音に基づいた楽曲間類似度のための分離表現学習," 情報処理学会音楽情報科学研究発表会, 研究報告, Vol. 2023-MUS-137, No. 9, pp. 1-7, 2023年6月23日.
風間香伽, 木下裕磨, 植野夏樹, 小野順貴, "深層学習を用いたアカペラ歌声分離における歌声合成による教師データ拡張の検討," 電子情報通信学会音声研究会, 技術研究報告, Vol. 123, No. 88, SP2023-4, pp. 14-19, 2023年6月23日.
金世訓, 武田一哉, 戸田智基, "トークン表現を用いたギター自動採譜における系列変換ネットワークの学習法," 情報処理学会音楽情報科学研究発表会, 研究報告, Vol. 2023-MUS-137, No. 43, pp. 1-7, 2023年6月24日.
菅原大基, 中嶋大志, 植野夏樹, 小野順貴, "時間周波数マスクの膨張処理と位相差拘束位相復元による両耳性ピッチの改善の検討," 電子情報通信学会音声研究会, 技術研究報告, Vol. 123, No. 88, SP2023-16, pp. 79-82, 2023年6月24日.
藤村拓弥, 戸田智基, "大規模雑音混入音声データを利用したDNN音声強調学習の効果," 日本音響学会2023年春季研究発表会, 1-1P-2, 講演論文集, pp. 209-210, 2023年3月15日.
渡邊千紘, 亀岡弘和, "F0パターンと声質情報を解きほぐす深層音声変換モデルの学習法," 日本音響学会2023年春季研究発表会, 1-3-11, 講演論文集, pp. 693-694, 2023年3月15日.
田中宏, 亀岡弘和, 金子卓弘, 関翔悟, "ストリーミング処理にむけたSequence-to-sequence音声変換モデルの知識蒸留," 日本音響学会2023年春季研究発表会, 1-3-14, 講演論文集, pp. 703-704, 2023年3月15日.
安田裕介, 戸田智基, "合成音声の主観評価結果の統計的解析," 日本音響学会2023年春季研究発表会, 1-3Q-11, 講演論文集, pp. 841-844, 2023年3月15日.
金子卓弘, 亀岡弘和, 田中宏, 関翔悟, "Wave-U-Net Discriminator：敵対的生成ネットワークに基づく音声合成のための高速で軽量な識別器," 日本音響学会2023年春季研究発表会, 2-3-1, 講演論文集, pp. 709-710, 2023年3月16日.
金子卓弘, 亀岡弘和, 田中宏, 関翔悟, "MISRNet：多入力単共有残差ブロックを用いた軽量なニューラルボコーダ," 日本音響学会2023年春季研究発表会, 2-3-2, 講演論文集, pp. 711-712, 2023年3月16日.
米山怜於, Y.-C. Wu, 戸田智基, "SiFi-GAN：音源フィルタ構造に基づくHiFi-GAN," 日本音響学会2023年春季研究発表会, 2-3-5, 講演論文集, pp. 721-722, 2023年3月16日.
中嶋大志, 池下林太郎, 小野順貴, 荒木章子, 中谷智広, "独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化," 日本音響学会2023年春季研究発表会, 3-1-6, 講演論文集, pp. 185-188, 2023年3月17日.
山岡洸瑛，植野夏樹，小野順貴, "多チャネル時間差推定における性能限界の導出," 日本音響学会2023年春季研究発表会, 3-1-12, 講演論文集, pp. 201-204, 2023年3月17日.
宮下敦志, 戸田智基, "リー群論に基づく一般化ワーピング," 電子情報通信学会音声研究会, 技術研究報告, Vol. 122, No. 389, SP2022-55, pp. 89-94, 2023年2月28日.
藤村拓弥, 戸田智基, "DNN音声強調におけるNoisy-target Trainingの分析と実応用に向けた調査," 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 122, No. 387, EA2022-112, pp. 221-226, 2023年3月1日.
河村泰雅，植野夏樹，小野順貴, "スパース最適化を用いた要素選択による次元削減," 信号処理シンポジウム, pp. 118-123, 2022年12月13日.
本山智司，植野夏樹，木下裕磨，小野順貴, "音光変換デバイス「ブリンキー」を用いた圧縮センシングに基づくスパースなスペクトルの推定," 信号処理シンポジウム, pp. 314-319, 2022年12月15日.
升山義紀, 山岡洸瑛, 木下裕磨, 小野順貴, "因果的MPDRビームフォーマのオンライン化およびタップ長の影響評価," 日本音響学会2022年秋季研究発表会, 1-2-1, 講演論文集, pp. 155-156, 9月14日, 2022.
中嶋大志, 若林佑幸, 小野順貴, "音場補間を用いた円状マイクロホンアレイの回転に頑健なブラインド音源分離," 日本音響学会2022年秋季研究発表会, 1-Q-23, 講演論文集, pp. 331-332, 9月14日, 2022.
李莉, 関翔悟, 亀岡弘和, "再帰ニューラルネットワーク型音源モデルに基づく高速多チャンネル変分自己符号化器法," 日本音響学会2022年秋季研究発表会, 1-Q-24, 講演論文集, pp. 333-334, 9月14日, 2022.
山地修平，中嶋大志，小野順貴，李莉，亀岡弘和, "混合信号による符号化器再学習を用いたFastMVAE法に基づく音源分離," 日本音響学会2022年秋季研究発表会, 1-Q-30, 講演論文集, pp. 355-358, 9月14日, 2022.
連冠三, 山岡洸瑛, 若林佑幸, 小野順貴, "補助関数法に基づく円状マイクロホンアレイの自己回転角度推定," 日本音響学会2022年秋季研究発表会, 1-R-29, 講演論文集, pp. 459-460, 9月14日, 2022.
Shaowen Chen, Tomoki Toda, "Sequence-wise parameter extraction of quasi-hamonic model for speech waveform generation," 日本音響学会2022年秋季研究発表会, 1-8-7, 講演論文集, pp. 1129-1130, 9月14日, 2022.
近藤祐斗, 李莉, 関翔悟, 亀岡弘和, "FastMVAE法におけるブロックパーミュテーションを軽減する音源モデル学習," 日本音響学会2022年秋季研究発表会, 2-2-2, 講演論文集, pp. 179-182, 9月15日, 2022.
Rui Wang, Li Li, Tomoki Toda, "Direction-aware target speaker extraction with conditional variational autoencoders and its sensitivity to direction-of-arrival error," 日本音響学会2022年秋季研究発表会, 2-2-6, 講演論文集, pp. 195-196, 9月15日, 2022.【第25回日本音響学会学生優秀発表賞（受賞者：Rui Wang）】
藤村拓弥, 戸田智基, "DNN音声強調におけるNoisy-target Trainingの挙動分析," 日本音響学会2022年秋季研究発表会, 2-2-7, 講演論文集, pp. 197-198, 9月15日, 2022.
Yeonjong Choi, Chao Xie, Tomoki Toda, "Three-stage voice conversion framework for noisy and reverberant speech," 日本音響学会2022年秋季研究発表会, 2-8-7, 講演論文集, pp. 1159-1160, 9月15日, 2022.
Ding Ma, Lester Phillip Violeta, Kazuhiro Kobayashi, Tomoki Toda, "Sequence-to-sequence voice conversion training using synthetic parallel data for electrolaryngeal speech enhancement," 日本音響学会2022年秋季研究発表会, 2-8-8, 講演論文集, pp. 1161-1162, 9月15日, 2022.
安田裕介, 戸田智基, "拡散確率モデルとアライメントモデルを用いた潜在特徴系列変換に基づくテキスト音声合成," 日本音響学会2022年秋季研究発表会, 2-Q-37, 講演論文集, pp. 1269-1272, 9月15日, 2022.
山岡洸瑛, 中嶋大志, 小野順貴, "最小全域木を用いた複数時間差の同時推定," 日本音響学会2022年秋季研究発表会, 3-2-10, 講演論文集, pp. 259-262, 9月16日, 2022.
Jingyi Feng, Tomohiro Yoshikawa, Tomoki Toda, "Interpretable emotional control for text-to-speech system toward development of sympathetic educational-support robots," 日本音響学会2022年秋季研究発表会, 3-8-3, 講演論文集, pp. 1189-1190, 9月16日, 2022.
宮下敦志, 戸田智基, "群論を用いた解析的声道長正規化処理と音声認識への応用," 日本音響学会2022年秋季研究発表会, 3-Q-12, 講演論文集, pp. 1339-1340, 9月16日, 2022.
Chao Xie, Tomoki Toda, "Robustness of noisy-to-noisy voice conversion against variations of noisy condition," 日本音響学会2022年秋季研究発表会, 3-Q-40, 講演論文集, pp. 1417-1418, 9月16日, 2022.
橋爪優果, 李莉, 戸田智基, "各楽器音源に着目した楽曲間類似度学習の評価," 日本音響学会2022年秋季研究発表会, 3-1-5, 講演論文集, pp. 1517-1518, 9月16日, 2022.
Sehun Kim, Tomoki Hayashi, Tomoki Toda, "Note-level automatic guitar transcription using attention mechanism and multi-task learning," 日本音響学会2022年秋季研究発表会, 3-1-7, 講演論文集, pp. 1521-1522, 9月16日, 2022.
植野夏樹, 小野順貴, "アレー信号処理のための瞬時線形次元削減," 電子情報通信学会信号処理研究会, 技術研究報告, Vol. 122, No. 165, SIP2022-65, pp. 81-85, 2022年8月26日.
宮下敦志, 戸田智基, "群論を用いた声道長変換の表現と解析的正規化処理," 電子情報通信学会音声研究会, 技術研究報告, Vol. 122, No. 81, SP2022-11, pp. 41-46, 6月17日, 2022.【音声研究会学生ポスター賞（受賞者：宮下敦志）】
橋爪優果, 李莉, 戸田智基, "各楽器音に着目した楽曲間類似度学習," 情報処理学会音楽情報科学研究発表会, 研究報告, Vol. 2022-MUS-134, No. 46, pp. 1-6, 6月18日, 2022.
小野順貴, "ブラインド音源分離における分離行列の一般化ランク1更新," 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 122, No. 20, EA2022-06, pp. 26-29, 5月13日, 2022.
中嶋大志, 小野順貴, "Iterative source steering を用いたオンライン補助関数型独立ベクトル分析に基づくブラインド音源分離," 日本音響学会2022年春季研究発表会, 1-1-9, 講演論文集, pp. 185-188, 3月9日, 2022. 【第24回日本音響学会学生優秀発表賞（受賞者：中嶋大志）】
本山智司, 石井奏人, 植野夏樹, 木下裕磨, 小野順貴, "音光変換デバイス「ブリンキー」を用いた振幅スペクトルの圧縮センシング," 日本音響学会2022年春季研究発表会, 1-1P-5, 講演論文集, pp. 317-318, 3月9日, 2022.
西田光佑, 石井奏人, 植野夏樹, 木下裕磨, 小野順貴, "音光変換デバイス「ブリンキー」の光信号飽和時における伝達係数と信号の推定," 日本音響学会2022年春季研究発表会, 1-1P-6, 講演論文集, pp. 319-320, 3月9日, 2022.
米山怜於, 呉宜樵, 戸田智基, "敵対的学習による統合的ソースフィルタネットワークの改良," 日本音響学会2022年春季研究発表会, 1-3-10, 講演論文集, pp. 907-908, 3月9日, 2022.
橋爪優果, 李莉, 戸田智基, "各楽器音源に着目した距離学習に基づく楽曲間類似度計算," 日本音響学会2022年春季研究発表会, 2-9-12, 講演論文集, pp. 1207-1208, 3月10日, 2022.
升山義紀, 山岡洸瑛, 小野順貴, "補助関数法による複数の非同期録音信号のブラインド同期," 日本音響学会2022年春季研究発表会, 3-1-6, 講演論文集, pp. 277-280, 3月11日, 2022.
山田健太, 升山義紀, 若林佑幸, 小野順貴, "微分方程式に基づく複数の正弦波の周波数同時推定," 日本音響学会2022年春季研究発表会, 3-1-7, 講演論文集, pp. 281-282, 3月11日, 2022.
栗城結衣, 中嶋大志, 山岡洸瑛, 若林佑幸, 植野夏樹, 小野順貴, "ブロック処理と重畳加算の二重化による畳み込み演算の低遅延化," 日本音響学会2022年春季研究発表会, 3-1-8, 講演論文集, pp. 283-284, 3月11日, 2022.
山岡洸瑛, 中嶋大志, 若林佑幸, 小野順貴, "補助関数法を用いた複数時間差のオンライン推定," 日本音響学会2022年春季研究発表会, 3-1-9, 講演論文集, pp. 285-286, 3月11日, 2022.
金子卓弘, 田中宏, 亀岡弘和, 関翔悟, "iSTFTNet：逆短時間フーリエ変換を用いた高速で軽量なメルスペクトログラムボコーダ," 日本音響学会2022年春季研究発表会, 3-3-4, 講演論文集, pp. 977-978, 3月11日, 2022.
Rui Wang, Li Li, Tomoki Toda, "Target speaker extraction based on conditional variational autoencoder and directional information in underdetermined condition", 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 121, No. 383, EA2021-76, pp. 76-81, 3月1日, 2022.
佐治拓樹, 小林和弘, 石黒祥生, 戸田智基, 大谷健登, 西野隆則, 武田一哉, "声質の可視化を用いた所望音声検索システムの提案," 情報処理学会音楽情報科学研究発表会, 研究報告, Vol. 2022-MUS-133, No. 6, pp. 1-5, 1月25日, 2022.
李莉, 亀岡弘和, 牧野昭二, "ChimeraACVAE による高速多チャンネル変分自己符号化器法," 日本音響学会2021年秋季研究発表会, 1-1-6, 講演論文集, pp. 129-132, 9月7日, 2021.【第51回日本音響学会粟屋潔学術奨励賞（受賞者：李莉）】
李莉, 亀岡弘和, 関翔悟, "ハンガリー法と欠損帯域補完に基づく周波数領域ブロックパーミュテーション解決法," 日本音響学会2021年秋季研究発表会, 1-1-7, 講演論文集, pp. 133-136, 9月7日, 2021.
升山義紀, 山岡洸瑛, 木下裕磨, 小野順貴, "因果的MPDRビームフォーマの近接分離最適化による設計," 日本音響学会2021年秋季研究発表会, 1-1-9, 講演論文集, pp. 139-142, 9月7日, 2021.
茂木倖大, 中嶋大志, 若林佑幸, 小野順貴, "ブラインド音源分離に基づく複数音源方向推定を用いた分離音源選択の検討," 日本音響学会2021年秋季研究発表会, 1-1-13, 講演論文集, pp. 153-154, 9月7日, 2021.
山岡洸瑛, 小野順貴, "時間周波数線形結合ビームフォーマの空間フィルタ数に対する音源強調性能の評価," 日本音響学会2021年秋季研究発表会, 2-1-3, 講演論文集, pp. 207-208, 9月8日, 2021.
春田智穂, 小野順貴, "要素選択による低演算量化を用いたDNNマスク推定に基づく音声強調処理," 日本音響学会2021年秋季研究発表会, 2-1-4, 講演論文集, pp. 209-210, 9月8日, 2021.
若林佑幸, 山岡洸瑛, 小野順貴, "円状マイクロホンアレイを利用した音場補間によるステアリングベクトル補間への応用," 日本音響学会2021年秋季研究発表会, 2-1P-6, 講演論文集, pp. 293-294, 9月8日, 2021.
山地修平, 中嶋大志, 若林佑幸, 小野順貴, "ハンガリー法を用いたパーミュテーション解法に基づくブラインド音源分離," 日本音響学会2021年秋季研究発表会, 2-1P-10, 講演論文集, pp. 305-306, 9月8日, 2021.
米山怜於, Yi-Chiao Wu, 戸田智基, "敵対的学習による統合型ソースフィルタネットワーク," 日本音響学会2021年秋季研究発表会, 2-3-2, 講演論文集, pp. 905-906, 9月8日, 2021.【第23回日本音響学会学生優秀発表賞（受賞者：米山怜於）】
大川舜平, 石黒祥生, 大谷健登, 西野隆典, 小林和弘, 戸田智基, 武田一哉, "電気式人工喉頭を用いた歌唱システムにおける自然な身体動作を利用した歌唱表現付与の提案," 情報処理学会シンポジウムインタラクション2021, pp. 261-266, 3月11日, 2021.
木下裕磨，小野順貴, "音光変換デバイス「ブリンキー」の信号伝搬過程を考慮したEnd-to-End音響シーン分析," 日本音響学会2021年春季研究発表会, 1-1-23, 講演論文集, pp. 191-192, 3月10日, 2021.
金子卓弘, 亀岡弘和, 田中宏, 北条伸克, "MaskCycleGAN-VC: フレーム補間との同時学習による高品質ノンパラレル声質変換," 日本音響学会2021年春季研究発表会, 1-2-2, 講演論文集, pp. 779-782, 3月10日, 2021.
中谷輝, Patrick Lumban Tobing, 武田一哉　戸田智基, "CycleVAEを用いた声質変換におけるWaveNetボコーダのファインチューニング法の調査," 日本音響学会2021年春季研究発表会, 1-2-4, 講演論文集, pp. 787-790, 3月10日, 2021.
大竹徹郎, 関翔悟, 戸田智基, "マルチタスク学習を用いたU-Netに基づく楽曲音源分離に関する調査," 日本音響学会2021年春季研究発表会, 1-9-6, 講演論文集, pp. 1121-1122, 3月10日, 2021.
関翔悟, 多賀遥香, 武田一哉, 戸田智基, "音高情報条件つき変分自己符号化器を用いたF0歌唱パターン生成," 日本音響学会2021年春季研究発表会, 1-2Q-6, 講演論文集, pp. 1017-1018, 3月10日, 2021.
村島允也, 亀岡弘和, 李莉, 関翔悟, 牧野昭二, "識別的変分自己符号化器学習による特定話者モノラル音声分離," 日本音響学会2021年春季研究発表会, 2-1-1, 講演論文集, pp. 205-208, 3月11日, 2021.
井上翔太, 亀岡弘和, 李莉, 牧野昭二, "SepNet: 高速多チャンネル音源分離のための分離行列予測ネットワーク," 日本音響学会2021年春季研究発表会, 2-1-5, 講演論文集, pp. 221-224, 3月11日, 2021.
春田智穂，小野順貴, "要素選択による次元削減を用いたDNN音声強調処理の低演算量化," 日本音響学会2021年春季研究発表会, 2-1-7, 講演論文集, pp. 229-232, 3月11日, 2021.【第22回日本音響学会学生優秀発表賞（受賞者：春田智穂）】
若林佑幸，小野順貴, "音場補間を用いた円状マイクロホンアレイの回転に頑健なビームフォーミング," 日本音響学会2021年春季研究発表会, 2-1-8, 講演論文集, pp. 233-234, 3月11日, 2021.
安原和輝, Yi-Chiao Wu, Patrick Lumban Tobing, 松永悟行, 大谷大和, 戸田智基, "テキスト音声合成のためのポストフィルタ用WaveNetボコーダの学習条件に関する評価," 日本音響学会2021年春季研究発表会, 2-2-11, 講演論文集, pp. 865-866, 3月11日, 2021.
山岡洸瑛，小野順貴, "補助関数法に基づく複数のチャネル間時間差の同時推定," 日本音響学会2021年春季研究発表会, 2-1Q-2, 講演論文集, pp. 371-374, 3月11日, 2021.
佐藤直哉，若林佑幸，木下裕磨，小野順貴, "直交検波を用いた音光変換デバイス「ブリンキー」のLED位置推定," 日本音響学会2021年春季研究発表会, 2-1Q-6, 講演論文集, pp. 381-382, 3月11日, 2021.
岩本基裕，木下裕磨，若林佑幸，小野順貴, "音光変換デバイス「ブリンキー」を用いた音響信号処理のための信号伝搬シミュレータ," 日本音響学会2021年春季研究発表会, 2-1Q-7, 講演論文集, pp. 383-384, 3月11日, 2021.
連冠三，中嶋大志，若林佑幸，小野順貴, "音場補間に基づく円状マイクロフォンアレイの自己回転角度推定," 日本音響学会2021年春季研究発表会, 2-1Q-12, 講演論文集, pp. 397-398, 3月11日, 2021.
米山怜於, Yi-Chiao Wu, 戸田智基, "統合型ソースフィルタネットワークによるニューラルボコーダ," 電子情報通信学会音声研究会, 技術研究報告, Vol. 120, No. 399, SP2020-34, pp. 57-62, 3月3日, 2021.
畔栁伊吹, 林知樹, 武田一哉, 戸田智基, "特徴量空間のクラス重心を考慮した二値分類モデルによる異常音検知," 電子情報通信学会応用音響研究会技術研究報告, Vol. 120, No. 397, EA2020-79, pp. 114-121, 3月4日, 2021.
山岡洸瑛，小野順貴, "連続値マスクを用いた複数MVDRビームフォーマの組み合わせによる劣決定音声強調," 日本音響学会2020年秋季研究発表会, 1-1-5, 講演論文集, pp. 123-126, 9月9日, 2020.
中谷輝, Patrick Lumban Tobing, 武田一哉, 戸田智基, "CycleVAEとWaveNetボコーダを用いたクロスリンガル声質変換," 日本音響学会2020年秋季研究発表会, 1-2-12, 講演論文集, pp. 719-720, 9月9日, 2020.
多賀遥香, 関翔悟, 李莉, 武田一哉, 戸田智基, "一般化指令応答モデルを用いた変分自己符号化器に基づく歌唱F0パターンの生成," 日本音響学会2020年秋季研究発表会, 1-2-16, 講演論文集, pp. 731-732, 9月9日, 2020.
若林佑幸, 小野順貴, "回転移動に頑健なアレイ信号処理のための音場の補間に関する一検討," 日本音響学会2020年秋季研究発表会, 2-1-9, 講演論文集, pp. 187-188, 9月10日, 2020.
彦坂秀, 関翔悟, 武田一哉, 戸田智基, "微分可能全域通過フィルタを用いたダイナミックレンジ圧縮," 日本音響学会2020念秋季研究発表会, 2-2-7, 講演論文集, pp. 775-776, 9月10日, 2020.
木下裕磨, 小野順貴, "深層自己符号化器に基づく音響特徴量の離散符号化," 日本音響学会2020念秋季研究発表会, 3-U2-7, 講演論文集, pp. 321-322, 9月11日, 2020.
渡邊千紘, 亀岡弘和, "スペクトログラムテンプレートの学習に基づく解釈可能な深層クラスタリング法," 2020年度人工知能学会全国大会（第34会）, 2Q1-GS-10-01, 論文集, Vol. JSAI2020, pp. 1-4, 6月10日, 2020.
戸田智基, "音声変換技術と音声生成機能拡張への応用," 電子情報通信学会2020年総合大会, TK-4-1, 講演論文集, pp. 34-35, 3月18日, 2020.
Robin Scheibler, Nobutaka Ono, "FIVE: fast independent vector extraction via auxiliary function optimization with globally optimal updates," 日本音響学会2020年春季研究発表会, 1-1-18, 講演論文集, pp. 205-206, 3月16日, 2020.
小野順貴, シャイブラーロビン, "分離行列のランク1更新によるブラインド音源分離," 日本音響学会2020年春季研究発表会, 1-1-19, 講演論文集, pp. 207-208, 3月16日, 2020.
安原和輝, Yi-Chiao Wu, Patrick Lumban Tobing, 松永悟行, 大谷大和, 戸田智基, "テキスト音声合成におけるポストフィルタとしてのWaveNetボコーダ学習法," 日本音響学会2020年春季研究発表会, 1-2-5, 講演論文集, pp. 1051-1052, 3月16日, 2020.
山岡洸瑛, シャイブラーロビン, 小野順貴, 若林佑幸, "補助関数法を用いた相互相関の最大化によるサンプリング周波数ミスマッチ推定," 日本音響学会2020年春季研究発表会, 2-1-14, 講演論文集, pp. 249-252, 3月17日, 2020.
中嶋大志, シャイブラーロビン, 若林佑幸, 小野順貴, "分離ベクトル同時更新による独立低ランク行列分析の収束性と性能向上の検討," 日本音響学会2020年春季研究発表会, 3-1-15, 講演論文集, pp. 309-312, 3月18日, 2020.
小野順貴, "機械学習における乗算を用いない次元削減," 電子情報通信学会信号処理研究会, 技術研究報告, Vol. 119, No. 440, SIP2019-106, pp. 21-26, 3月2日, 2020.【令和2年度電子情報通信学会信号処理研究会賞（受賞者：小野順貴）】
中谷輝, Patrick Lumban Tobing, 武田一哉, 戸田智基, "CycleVAEを用いたクロスリンガル声質変換," 電子情報通信学会音声研究会, 技術研究報告, Vol. 119, No. 441, SP2019-88, pp. 219-224, 3月3日, 2020.
関翔悟, 高田萌絵, 武田一哉, 戸田智基, "変分自己符号化器を用いた空気・体内伝導音の結合音源モデリングに基づく半教師あり自己発声音強調・抑圧," 電子情報通信学会音声研究会, 技術研究報告, Vol. 119, No. 441, SP2019-89, pp. 225-230, 3月3日, 2020.
李莉, 亀岡弘和, 井上翔太, 牧野昭二, "多チャンネル変分自己符号化器法による任意話者の音源分離," 電子情報通信学会応用音響研究会, 技術研究報告, Vol. 119, No. 334, EA2019-77, pp. 79-84, 12月5日, 2019.

その他発表

Tomoki Toda, Nobutaka Ono, Hirokazu Kameoka, "Augmented speech production and hearing systems," JST CREST「人間と情報環境の共生インタラクション基盤技術の創出と展開」領域, 最終成果報告国際シンポジウム, ポスター発表, 東京, 2024年9月24日.
戸田智基, "音メディアコミュニケーションにおける共創型機能拡張技術の創出," JST CREST「人間と情報環境の共生インタラクション基盤技術の創出と展開」領域, 2024年度終了課題成果発表シンポジウム, 口頭発表, 東京, Sep. 2023年9月9日.
戸田智基, 小野順貴, 亀岡弘和, "物理的制約を超えた発声・聴覚機能の獲得," JST CREST「人間と情報環境の共生インタラクション基盤技術の創出と展開」領域, 2024年度終了課題成果発表シンポジウム, ポスター発表, 東京, 2023年9月9日.
Wen-Chin Huang, "Pre-training Approaches for Voice Conversion to Address Data Scarcity and Their Applications to Ground-Truth-Free Tasks," 2023年度研究会推薦博士論文速報, 情報処理学会・学会誌「情報処理」, 2024年8月15日.
Reo Yoneyama, Yi-Chiao Wu, Tomoki Toda, "High-fidelity and pitch-controllable neural vocoder based on unified source-filter networks," IEEE ICASSP, SPS journal paper presentation, Seoul, Korea, Apr. 14, 2024.
Erica Cooper, Wen-Chin Huang, "Feedback from the VoiceMOS Challenge 2023," VoiceMOS mini workshop, Tokyo, Nov. 20, 2023.
Yusuke Yasuda, "Dynamic optimization for large-scale preference-based subjective evaluation using crowdsourcing," VoiceMOS mini workshop, Tokyo, Nov. 20, 2023.
Erica Cooper, Wen-Chin Huang, "From human ears to deep neural networks: automatic evaluation of synthetic speech and audio data," Joint Workshop VoicePersonae and ASVspoof, Tokyo, Nov. 21, 2023.
戸田智基, "音メディアコミュニケーションにおける共創型機能拡張技術の創出," JST CREST「人間と情報環境の共生インタラクション基盤技術の創出と展開」領域, 中間報告シンポジウム－共生インタラクション研究が創る新しい未来社会デザイン－, 東京, 2023年8月10日.
Wen-Chin Huang, Shu-Wen Yang, Tomoki Hayashi, Tomoki Toda, "A comparative study of self-supervised speech representation based voice conversion," IEEE ICASSP, SPS journal paper presentation, Rhodes island, Greece, June 9, 2023.
渡邊千紘, 亀岡弘和, "話者共通スペクトログラムテンプレートの畳み込み機構をもつ説明可能な深層音声分離法", 情報論的学習理論ワークショップ（IBIS2020）, オンライン, 2020年11月26日.
戸田智基, "音声コミュニケーションにおける機能拡張," 名古屋大学情報学シンポジウム2020, 愛知, 2020年1月27日.
戸田智基, "周りに内緒で通話できるか," 名古屋大学高等教育院卓越・先端・次世代シンポジウム, 愛知, 2020年1月14日.
Tomoki Toda, "Creation of cooperative human augmentation techniques in sound media communication," 第2回JST-ANR連携「共生インタラクション」国際シンポジウム2019, 東京, 2019年12月2日.

博士論文

Rui Wang, "Deep source modeling for direction-aware dual-channel target speaker extraction in noisy underdetermined conditions," 名古屋大学情報学研究科知能システム学専攻博士論文, Mar. 25, 2025.
Wen-Chin Huang, "Pre-training approaches for voice conversion to address data scarcity and their applications to ground-truth-free tasks," 名古屋大学情報学研究科知能システム学専攻博士論文, Mar. 25, 2024.
Kouei Yamaoka, "High-resolution multichannel signal enhancement and time delay estimation by optimization with reduction to determined systems," 東京都立大学システムデザイン研究科博士学位論文, Mar. 25, 2024.
Taishi Nakashima, "Fast online blind source separation adapting to source and microphone movements," 東京都立大学システムデザイン研究科博士学位論文, Mar. 25, 2024.
升山義紀, "複数表現間の一貫性を考慮した包括的最適化による音響信号処理とその効率化の研究," 東京都立大学システムデザイン研究科博士学位論文, Mar. 25, 2024.
Yi-Chiao Wu, "Incorporating prior knowledge on speech production mechanism into neural speech waveform generation," 名古屋大学情報学研究科知能システム学専攻博士論文, Mar. 25, 2021.
Patrick Lumban Tobing, "High-quality and flexible voice conversion techniques based on statistical spectral and waveform modeling," 名古屋大学情報科学研究科メディア科学専攻博士論文, Mar. 25, 2020.
Shogo Seki, "A study on utilization of prior knowledge for underdetermined source separation and its application," 名古屋大学情報学研究科知能システム学専攻博士論文, Mar. 25, 2020.

受賞

升山義紀, "第40回電気通信普及財団賞テレコムシステム技術学生賞," 2025年3月28日
宮下敦志, "第29回日本音響学会学生優秀発表賞," 2025年03月18日
澤田桂都, "第142回音楽情報科学研究会学生奨励賞 Best Research 部門," 2025年03月8日
Bence Mark Halpern, Tomoki Toda, "SpandLDeteriorate Workshop of ACM MM Asia 2024 Best Paper Award,", Dec. 3, 2024.
橋爪優果, "第38回人工知能学会全国大会優秀賞（オーガナイズドセッション口頭発表部門）," 2024年7月24日
尹道鉉, "第28回日本音響学会学生優秀発表賞," 2024年09月5日
増子凱斗, "第28回日本音響学会学生優秀発表賞," 2024年09月5日
米山怜於, "IEEE SPS Japan Student Conference Paper Award," 2024年1月18日
Atsushi Miyashita, "IEEE WASPAA 2023 Best Student Paper Award,", Oct. 24, 2023.
安田裕介, "第2回日本音響学会音声合成研究奨励賞吉田賞," 2023年9月27日
戸田智基, "第35回中小企業優秀新技術・新製品賞産学官連携特別賞," 2023年4月13日
山岡洸瑛, "第38回電気通信普及財団賞テレコムシステム技術学生賞," 2023年3月19日
Rui Wang, "第25回日本音響学会学生優秀発表賞," 2023年3月16日
Yoshiki Masuyama, "IEEE SLT 2022 Best Student Paper Award," Jan. 12, 2023.
Wen-Chin Huang, "IEEE SPS Japan Young Author Best Paper Award," 2022年12月27日
中嶋大志, "第24回日本音響学会学生優秀発表賞," 2022年9月15日
宮下敦志, "音声研究会学生ポスター賞," 2022年6月18日
李莉, "第51回日本音響学会粟屋潔学術奨励賞," 2022年3月10日
米山怜於, "第23回日本音響学会学生優秀発表賞," 2022年3月10日
Koudai Mogi, "NCSP'22 Student Paper Award," Mar. 1, 2022.
Ding Ma, Wen-Chin Huang, Tomoki Toda, "APSIPA ASC 2021 The Best Paper Award," Dec. 17, 2021.
Yuma Kinoshita, Nobutaka Ono, "APSIPA ASC 2021 The Best Paper Award," Dec. 17, 2021.
春田智穂, "第22回日本音響学会学生優秀発表賞," 2021年9月8日
小野順貴, "令和2年度電子情報通信学会信号処理研究会賞," 2021年8月23日
Naoya Murashima, "NCSP'21 Student Paper Award," Mar. 2, 2021.
亀岡弘和, "東北大学電気通信研究所令和2年度（第10回）RIEC Award 本賞," 2021年2月28日
田中宏, "2019年度音声研究会研究奨励賞," 2020年12月29日
李莉, "IEEE SPS Japan Student Conference Paper Award," 2020年12月17日
田中宏, "日本音響学会粟屋潔学術奨励賞," 2020年3月16日