戸田研究室のホームページへようこそ！

戸田研究室では，様々な音信号を対象とした音メディア情報処理に関する研究を行っています。音声コミュニケーション支援，学習支援，創作支援，見守り支援，障害者支援などを対象として，
（１）音声情報処理（音声の分析／認識／変換／合成，話者の認識，対話の制御など）
（２）音楽情報処理（楽音の分離／変換／合成，歌声の分析／変換，楽譜追跡など）
（３）音環境情報処理（音イベントの検出／識別，音源強調，音環境理解など）
を軸に，人の身体機能や認知機能を拡張して，物理的制約を超えて不可能を可能とするような基盤技術および応用技術の研究に取り組んでいます。

国際的に競争力のある研究を実施して，国内外の研究者と盛んに交流することで，一人一人が持つ可能性を最大限に広げて頂きたいと考えています。物事を深く理解することを楽しみ，長所（個性）を伸ばしていけるような研究室を目指しています。

戸田研究室を希望する方へ

　※研究生について

大学院情報学研究科の研究生出願に関する案内はこちらです．戸田研究室では，現在，特別研究学生の受け入れのみ可能となります．学部研究生および大学院研究生に関しては，受け入れておりませんのでご注意下さい．

大型研究プロジェクト

　AIP加速課題「国際チャレンジ活動を通した発声技能拡張基盤の構築」

最近のニュース

2025年7月7日
JST AIP加速課題の研究課題「国際チャレンジ活動を通した発声技能拡張基盤の構築」（代表：戸田教授）に関して，オンラインサイトビジットが行われました．
- 発表：戸田智基（Prof.）
- 参加：安田裕介（NII，共同研究者）
1年間のプロジェクトとなりますので，どんどん進めていければと思います．

2025年7月5日
先日の音学シンポジウムにおける招待講演スライドを公開しました．
- 米山怜於, "ニューラルボコーダ概説：生成モデルと実用性の観点から," 音学シンポジウム, 招待講演, June 2025.【講演スライド】
- 戸田智基, "音声研究の知見がニューラルボコーダの発展にもたらす効果," 音学シンポジウム, 招待講演, June 2025.【講演スライド】

2025年7月1日
音環境情報処理に関する国際チャレンジ DCASE 2025 の異常音検知タスク（Task 2）に参加しました．結果は，36チーム中4位（121システム中7位）となりました．大変お疲れさまでした！
- 開発者：藤村拓弥（D2学生），畔栁伊吹（武田研D3学生）
- DCASE 2025 Task 2 の結果【こちら】
- システムの詳細：T. Fujimura, I. Kuroyanagi, T. Toda, "The NU systems for DCASE 2025 Challenge Task 2," Technical report, DCASE Task 2, 5 pages, July 2025.【こちら】

2025年6月26～27日
JST CREST「信頼されるAIシステム」の領域会議（東京）に参加しました．
- 参加：戸田智基（Prof）

2025年6月20日
Shuming Luanくんの博士論文公聴会がオンラインで開催されました．
- Shuming Luan, "Generalized sound field interpolation in rotation-robust microphone array signal processing," 情報学研究科知能システム学専攻博士論文（主査：戸田智基）
集大成となるとても素晴らしい発表でした！審査委員の方々をはじめとして，ご参加頂いた方々，ありがとうございました！

2025年6月21日
学術論文誌 IEEE Transactions on Audio, Speech and Language Processing に以下の論文2編が掲載されました．
- J. He, T. Toda, "PMF-CEC: phoneme-augmented multimodal fusion for context-aware ASR error correction with error-specific selective decoding," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 2402-2417, June 2025.【論文はこちら】
- Y. Choi, C. Xie, T. Toda, "Noise and reverberation-controllable voice conversion," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 2430-2443, June 2025.【論文はこちら】

2025年6月20日
学術論文誌 APSIPA Transactions on Signal and Information Processing に以下の論文3編が掲載されました．
- C. Xie, T. Toda, "An investigation of noisy-to-noisy voice conversion performance in various noisy conditions," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e10, pp. 1-30, June 2025.【論文はこちら】
- T. Fujimura, T. Toda, "Analysis and extension of noisy-target training for unsupervised target signal enhancement," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e12, pp. 1-27, June 2025.【論文はこちら】
- I. Kuroyanagi, T. Fujimura, K. Takeda, T. Toda, "Improving anomalous sound detection through pseudo-anomalous set selection and pseudo-label utilization under unlabeled conditions," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e13, pp. 1-28, June 2025.【論文はこちら】

2025年6月19日
静岡大学大学院総合科学技術研究科情報学専攻の講義「情報資源総論」にて，「音声合成技術の基礎と最近の進展」について講義をしました．
- 講師：戸田智基（Prof.）
- 題目：Fundamentals of speech synthesis and its recent progress

2025年6月13～14日
音学シンポジウム2025（早大，東京）にて，2件の招待講演と4件の研究発表を行いました．
- 招待講演：米山怜於（D3），戸田智基（教授）
- 発表：宮司光梨（M1），服部公宏（武田研M2），Wen-Chin Huang（助教）

2025年5月29日
FMラジオ番組「中電シーティーアイ Welcome Generatoin」の取材を受けました．FM AICHIで7月31日（木）20:30～21:00に放送予定となります。
- 出演者：藤村拓弥（D2），橋爪優果（D3），戸田智基（Prof）

2025年5月28日
応用音響研究会（オンライン）のオーガナイズドセッション「音声・音響信号処理における最新動向～ICASSP2025の視点を通じて～」にて，D2学生の藤村拓弥くんとD3学生の橋爪優果さんが各々サーベイ発表を行いました．
- 藤村拓弥, "ICASSP2025における異常音検知の動向," 応用音響研究会, May 2025.【講演スライド】
- 橋爪優果, "ICASSP2025における音楽情報処理の動向," 応用音響研究会, May 2025.【講演スライド】

2025年5月22日
学術論文誌 APSIPA Transactions on Signal and Information Processing に以下の論文が掲載されました．
- D. Ma, Y. Choi, T. Fujimura, F. Li, C. Xie, K. Kobayashi, T. Toda, "Sequence-to-sequence voice conversion-based techniques for electrolaryngeal speech enhancement in noisy and reverberant conditions," APSIPA Transactions on Signal and Information Processing, Vol. 14, No. 1, e8, pp. 1-40, May 2025.【論文はこちら】

2025年5月15日
Mila/Concordia University の Conversational AI Reading Group にて，Wen-Chin Huang助教が招待講演を行いました．
- Wen-Chin Huang, "Automatic quality assessment for speech and beyond" 【講演スライド】

2025年5月14日
学術論文誌 IEEE Transactions on Audio, Speech and Language Processing に以下の論文が掲載されました．
- Y. Ohtani, T. Okamoto, T. Toda, H. Kawai, "Fast neural vocoder with fundamental frequency control using finite impulse response filters," IEEE Transactions on Audio, Speech and Language Processing, Vol. 33, pp. 1893-1906, Apr. 2025.【論文はこちら】

2025年5月4日
学術論文誌 IEEE Access に以下の論文が掲載されました．
- M. Eshghi, T. Toda, "Predicting fundamental frequency patterns in electrolaryngeal speech using automated phoneme extraction," IEEE Access, Vol. 13, pp. 73831-73847, Apr. 2025.【論文はこちら】