戸田研究室では、音声・歌声・楽音・行動音・環境音など,様々な音信号を対象とした音メディア情報処理として,音声情報処理,音楽情報処理,音環境情報処理の研究を行っています.信号処理,機械学習,強化学習を適用することで,各情報処理における基盤技術の構築や,コミュニケーション支援,学習支援,創作支援,見守り支援,障碍者支援,機能拡張などを対象とした応用技術の構築に取り組んでいます.

以下,いくつかの研究例を紹介します.より詳細な情報が知りたい場合は,こちらのページに記載の論文などをご参照下さい.
音声情報処理
- 音声分析
- 音声変換
音声変換は,入力された音声波形に対して,何を話しているかという情報を保持したまま,他の所望の情報(例えば,誰が話しているのか,どこで話しているのか,どのように話しているのかなど)を自在に変換するように,加工処理を施す技術です.
|
![]() |
---|
- 音声合成
- 音声強調
- 音声認識
音声認識は,入力された音声波形に対して,話している内容を推定し,テキストに書き起こす技術です.
|
![]() |
---|
- 音声表情認識
音声表情認識は,入力された音声波形に対して,話し手の内部状態に応じて変化する音声の表情(例えば,感情など)を推定する技術です.
|
![]() |
---|
- 音声言語処理
音声言語処理は,書き言葉ではなく,話し言葉の特徴に着目したテキスト処理を行う技術です.
|
![]() |
---|
- 音声品質推定
- 発声障碍者支援
発声障碍者支援は,発声機能に障害を抱えた方々の音声コミュニケーションを支援する技術です.病的音声の自然性改善やテキスト書き起こしなど,様々な応用技術の構築に取り組んでいます.
|
![]() |
---|
- 発声・聴覚機能拡張
音楽情報処理
- 楽曲音源分離
楽曲音源分離は,多種多様な楽曲音源(各種楽器音や歌声など)を含む楽曲信号を,各楽曲音源へと分離する処理を施す技術です.
|
![]() |
---|
- 自動採譜
自動採譜は,入力された楽器演奏音に対して,音符情報を推定し,楽譜に書き起こす技術です.
|
![]() |
---|
- 楽曲分析
楽曲分析は,入力された楽曲を分析し,楽曲の類似度を求めるなど,様々な情報を抽出する技術です.
|
![]() |
---|
- 楽曲加工
- 歌声声質変換
歌声声質変換は,入力された歌声波形に対して,歌詞情報を保持したまま,声質情報(例えば,誰が歌っているのか,どのように歌っているのか,どのように聞こえる歌声なのかなど)を自在に変換するように,加工処理を施す技術です.
|
![]() |
---|
- 歌唱機能拡張
音環境情報処理
- 音源分離
音源分離は,複数の音源が混ざり合った音響信号に対して,音源信号の独立性などを活用して,混ざり合う前の個々の音源へと分離する技術です.
|
![]() |
---|
- 多重音響イベント検出
- 音響イベント記号表現獲得
- 異常音検知
異常音検知は,機械の動作音などを対象として,正常音のみが事前に収録できるという状況の下で,未知の異常音を検知する技術です.
|
![]() |
---|
- 空気/体内伝導音信号処理
- 行動認識