戸田研究室では、音声・歌声・楽音・行動音・環境音など,様々な音信号を対象とした音メディア情報処理として,音声情報処理,音楽情報処理,音環境情報処理の研究を行っています.信号処理,機械学習,強化学習を適用することで,各情報処理における基盤技術の構築や,コミュニケーション支援,学習支援,創作支援,見守り支援,障碍者支援,機能拡張などを対象とした応用技術の構築に取り組んでいます.
以下,いくつかの研究例を紹介します.より詳細な情報が知りたい場合は,こちらのページに記載の論文などをご参照下さい.
音声情報処理
- 音声信号処理
- 音声波形モデリング
|
音声波形モデリングは,音声波形をモデル化することで,音声波形の生成処理を実現する技術であり,音声変換・合成を実現する上で基礎となる技術です.
|
|
|---|
- 音声変換
|
音声変換は,入力された音声波形に対して,何を話しているかという情報を保持したまま,他の所望の情報(例えば,誰が,どこで,どのように話しているのかなど)を自在に変換するように,加工処理を施す技術です.
|
![]() |
|---|
- 音声合成
|
音声合成は,入力されたテキストおよびその他補助情報に応じて,所望の特徴を持つ音声波形を合成する技術です.
|
![]() |
|---|
- 音声強調
- 音声認識
|
音声認識は,入力された音声波形に対して,話している内容を推定し,テキストに書き起こす技術です.
|
|
|---|
- 音声表情処理
|
音声表情処理は,話し手の内部状態に応じて変化する音声の表情(例えば,感情など)を,音声から推定したり,合成音声に対して付与したりする技術です.
|
![]() |
|---|
- 音声言語処理
|
音声言語処理は,書き言葉ではなく,話し言葉の特徴に着目したテキスト処理を行う技術です.
|
|
|---|
- 音声品質推定
- 発声障碍者支援
- 発声・聴覚機能拡張
音楽情報処理
- 楽曲音源分離
|
楽曲音源分離は,多種多様な楽曲音源(各種楽器音や歌声など)を含む楽曲信号を,各楽曲音源へと分離する処理を施す技術です.
|
|
|---|
- 自動採譜
|
自動採譜は,入力された楽器演奏音に対して,音符情報を推定し,楽譜に書き起こす技術です.
|
|
|---|
- 自動作曲
- 楽曲分析
- 楽曲加工
- 歌声変換
- 歌唱機能拡張
音環境情報処理
- 多重音響イベント検出
- 音響イベント記号表現獲得
- 異常音検知
|
異常音検知は,機械の動作音などを対象として,正常音のみが事前に収録できるという状況の下で,未知の異常音を検知する技術です.
|
|
|---|
- 音源分離
|
音源分離は,複数の音源が混ざり合った音響信号に対して,音源信号の独立性などを活用して,混ざり合う前の個々の音源へと分離する技術です.
|
|
|---|
- 目的音抽出
- 空気/体内伝導音信号処理
その他
- 動画シーン検索
- 行動認識

























