戸田研究室のホームページへようこそ!

戸田研究室では,様々な音信号を対象とした音メディア情報処理に関する研究を行っています。音声コミュニケーション支援,学習支援,創作支援,見守り支援,障害者支援などを対象として,
(1)音声情報処理(音声の分析/認識/変換/合成,話者の認識,対話の制御など)
(2)音楽情報処理(楽音の分離/変換/合成,歌声の分析/変換,楽譜追跡など)
(3)音環境情報処理(音イベントの検出/識別,音源強調,音環境理解など)
を軸に,人の身体機能や認知機能を拡張して,物理的制約を超えて不可能を可能とするような基盤技術および応用技術の研究に取り組んでいます。

国際的に競争力のある研究を実施して,国内外の研究者と盛んに交流することで,一人一人が持つ可能性を最大限に広げて頂きたいと考えています。物事を深く理解することを楽しみ,長所(個性)を伸ばしていけるような研究室を目指しています。


最近のニュース

  • 2020年8月3日
    新エネルギー・産業技術総合開発機構(NEDO)「人と共に進化する次世代人工知能に関する技術開発事業」において,産業技術総合研究所の提案研究課題「実世界に埋め込まれる人間中心の人工知能技術の研究開発」が採択されました.その中の,研究開発項目〔3〕「容易に構築・導入できるAIの開発」に対する「③-(1)-C 音響信号処理モデルの汎用化・適応化とアプリケーション構築容易化のための基盤技術の開発」に関しまして,産業技術総合研究所人工知能研究センター知的メディア処理研究チーム,早稲田大学,静岡大学,名古屋大学(担当:戸田教授)にて共同で実施していきます.

    • 人と共に進化する次世代人工知能に関する技術開発事業(NEDO)【こちら

  • 2020年8月1日
    第24回東海地区音声関連研究室修士論文中間発表会(オンライン開催)に参加しました.

    • 発表:大竹徹郎(M2),安原和輝(M2),山下望(M2),Wen-Chin Huang(M2)
    • 参加:犬塚雅也(M1),耿浩彭(M1),吉岡大貴(M1),婦木紡(B4),米山怜於(B4)
    • 運営:小林和弘(Postdoc),戸田智基(Prof)

    皆さん,すばらしい発表でした. 音班のメンバー3名が受賞しました.おめでとうございます!

    • 総合2位:多賀 遥香(武田研M2)
      「一般化指令応答モデルを用いた変分自己符号化器に基づく歌唱F0パターンの生成」
    • 総合3位:中谷 輝(武田研M2)
      「CycleVAEとWaveNetボコーダを用いたクロスリンガル声質変換」
    • オンラインプレゼンテーション賞:山下 望(M2)
      「深層学習を用いたドラムパターン譜面の音楽的特徴の抽出」


  • 2020年8月1日
    第24回東海地区音声関連研究室修士論文中間発表会をオンラインにて開催しました.初めてのオンライン開催となりましたが,参加者190名,発表43件と,例年同様多くの方々にご参加頂けました.色々と不具合などもあったかと思いますが,発表者の方々をはじめとする皆様の多大なるご協力のおかげで,無事に発表会を終えることができました.ありがとうございました!

    • 運営メンバー
         - 大谷健登(武田研助教):連絡&とりまとめ
         - 小林和弘(Postdoc):Web関連
         - 林知樹(武田研Postdoc):投票&表彰
         - 筒井和詩(武田研助教):当日サポート
         - 藤井慶輔(武田研助教):オンライン会議システム
         - 戸田智基(Prof.):世話人

  • 2020年7月31日
    先日,ポスドクの小林和弘くんがノンパラレル音声変換ソフトウェア「crank」を公開しました.循環型学習および敵対的生成学習を導入したVQ-VAEベースの手法となります.また,M2学生のWen-Chin Huangくんが,系列ベースの音声変換法に関するESPnetを用いたレシピを公開しました.テキスト音声合成を用いた事前学習を活用して系列変換ネットワークを学習する手法となります.


  • 2020年7月21日
    科研費基盤(S)「次世代音声翻訳の研究」(分担:戸田教授)に関する研究打ち合わせに遠隔参加しました.

    • 発表:戸田智基(Prof.)


  • 2020年7月1日
    音環境情報処理に関する国際チャレンジ DCASE 2020 の音響イベント検出タスク(Task 4)にて,LINE株式会社,株式会社HDL,ジョンズ・ホプキンス大学と共同で構築した音響イベント検出システムが,参加21チーム中,第1位の性能を達成しました!おめでとうございます!

    • 開発者:宮崎 亮一(武田研D3学生),林 知樹(武田研ポスドク/HDL)
    • DCASE 2020 Task 4 の結果はこちら
    • システムの詳細はこちら


  • 2020年6月19日
    静岡大学大学院総合科学技術研究科情報学専攻の講義「情報資源総論」にて、「音声合成技術の基礎と最近の進展」についてオンライン講義を実施しました。

    • 講師:戸田 智基(Prof.)
    • 題目:Fundamentals of speech synthesis and its recent progress

  • 2020年6月15~19日
    オンライン教育支援オープンソースに関する国際会議Open Apereo 2020(オンライン開催)にて,1件の発表を行いました.

    • 発表:戸田 智基(Prof.)


  • 2020年5月28日
    JST CREST「共生インタラクション」の研究課題「音メディア共創型機能拡張」(代表:戸田教授)に関して,サイトビジットがオンラインで行われました.チーム全体の研究紹介に加え,各研究グループ(名大G:戸田教授,都立大G:小野順貴教授,NTT G:亀岡弘和博士)から個別の研究課題に対する進捗報告を行うとともに,総括およびアドバイザーの方々と非常に有意義な議論を行うことができました.

    • 発表:戸田智基(Prof.)
    • 参加:小林和弘(ポスドク)

  • 2020年5月28日
    非常勤研究員として今年度から戸田研に加わって頂いた若林先生(東京都立大学)に,ご自身の研究に関するトークをオンラインで行って頂きました.とても面白い研究内容を聞かせて頂きました。

    • 発表:若林佑幸(ポスドク)

  • 2020年5月25~26日
    JST CREST「共生インタラクション」の領域会議(オンライン)に参加しました.第1期チームと第2期のチームの研究成果を聞くことができて,大いに刺激を受けることができました.

    • 参加:戸田智基(Prof.)

  • 2020年5月4~8日
    音響・音声・信号処理に関する国際会議ICASSP2019(バーチャル開催)にて,4編の論文発表を行いました.

    • 発表:Patrick Lumban Tobing(Postdoc)
    • 座長:戸田 智基(Prof.)

    6月8日まで論文およびプレゼンテーション動画が公開されています.

    • K. Miyazaki, T. Komatsu, T. Hayashi, S. Watanabe, T. Toda, K. Takeda, "Weakly-supervised sound event detection with self-attention,"【論文はこちら】【動画はこちら
    • T. Okamoto, T. Toda, Y. Shiga, H. Kawai, "Transformer-based text-to-speech with weighted forced attention,"【論文はこちら】【動画はこちら
    • P.L. Tobing, Y.-C. Wu, T. Hayashi, K. Kobayashi, T. Toda, "Efficient shallow WaveNet vocoder using multiple samples output based on Laplacian distribution and linear prediction,"【論文はこちら】【動画はこちら
    • T. Hayashi, R. Yamamoto, K. Inoue, T. Yoshimura, S. Watanabe, T. Toda, K. Takeda, Y. Zhang, X. Tan, "ESPNET-TTS: Uunified, reproducible, and integratable open source end-to-end text-to-speech toolkit,"【論文はこちら】【動画はこちら

  • 2020年5月2日
    この2ヶ月間,オンライン授業支援対応に追われており,遅くなってしまいましたが,「研究室の歩み」を更新しました.

    戸田研究室も5年目に入ります.より一層,盛り上げていきたいと思います.

過去のニュース

  • 2015年9月からのニュースはこちら

戸田研に興味がある皆様へ

R1年度B3学生向け研究室紹介資料です.

* 配布資料
* 説明スライド(学内のみアクセス可)

研究室の歩み

各年度のまとめはこちらです.
各種データはこちらです.


講義

戸田担当分の講義資料です.

信号処理
 工学部III系専門科目
情報科学入門(情報理論)
 理系教養科目
系列データモデリング
 研究室輪講

研究室の一週間

武田研究室と合同で,ゼミ・輪講・研究ミーティングなどを実施しています.

月曜
 Dゼミ
火曜
 B4ゼミ
水曜
 輪講
木曜
 学生ゼミ
 音班研究ミーティング
金曜

ソフトウェア

開発したソフトウェアを公開しています.

VCC2020 baseline: CycleVAE w/ PWG vocoder
 VCC2020ベースラインCycleVAE版
 開発者:Patrick Lumban Tobing,
     Yi-Chiao Wu
VCC2020 baseline: Cascase ASR + TTS
 VCC2020ベースラインESPnet版
 開発者:Wen-Chin Huang
INTERSPEECH19 Tutorial
 INTERSPEECH2019 Tutorial 演習
 開発者:林 知樹,小林 和弘
Quasi-Periodic WaveNet Pytorch implementation
 QPNetボコーダ
 開発者:Yi-Chiao Wu
PytorchWaveNetVocoder
 WaveNetボコーダ
 開発者:林 知樹
sprocket
 統計的声質変換
 開発者:小林 和弘

デモ動画による研究紹介

研究している技術を紹介しています.

名大戸田研チャンネル

各表紙画像をクリックするとデモ動画を視聴できます.

2020年3月:JSTさきがけデモ


2018年8月:JSTフェア2018


2017年11月:研究室紹介デモ

最近の研究発表

発表スライドをいくつか公開しています.

名大戸田研発表スライド

各表紙画像をクリックするとスライドが閲覧できます.

2019年9月:チュートリアル
INTERSPEECH2019

2019年3月:研究発表
日本音響学会春季研究発表会
学生優秀発表賞(岡田 慎太郎)


2018年7月:講義と演習
SPCC2018



2018年1月:招待講演
電子情報通信学会音声研究会 オーガナイズドセッション


2017年9月:研究発表
IEEE MLSP2017
Nominated For Best Student Paper Award (Shogo Seki)


2017年9月:研究発表
日本音響学会秋季研究発表会
学生優秀発表賞(宮崎 晃一)


2017年5月:招待講演
人工知能学会全国大会 オーガナイズドセッション OS-9 質感と感性