レギュラーセッション

エンタメから社会課題、チームで乗り越えた音声AIの研究開発と実用化

講演形式
レギュラーセッション
講演時間
08月25日(水) 16:10 〜 17:10
講演ルーム
第6会場
資料公開
予定あり
受講スキル

AIに関連した研究開発やその実用化に興味のある方

音声信号処理およびディープラーニングに関する基本的知識があることが望ましい

得られる知見

音声合成および音声変換に関する知見

PCやスマートフォン上の単独アプリ、またクラウド上のサービスとしてAIを実装する方法

セッションの内容

音声認識や音声合成といった技術は古くからありますが、ディープラーニングの登場と進化に伴い、その可能性は大きく開きつつあります。しかしこうした技術の進展が、具体的にどのように人の役に立ったり、人を楽しませることができるのか、国際学会の研究成果を眺めるだけでは、なかなかイメージしにくいという方が多いのではないでしょうか?

そこで本セッションでは、DeNAの音声AIチームに所属する3名が、納品または公開実績のある開発事例を「エンタメ」と「社会課題」からそれぞれピックアップし、技術の進化を皆様の耳でもちろん「日本語」で体感していただくとともに、要素技術に関する解説はもちろん、台本作成やアノテーションといった実用化のためには避けられないプロセスをわかりやすくお伝えします。

竹村 伸太郎

株式会社ディー・エヌ・エー

システム本部データ統括部AI基盤部

講演者詳細を開く >

<講演者プロフィール>

奈良先端科学技術大学院大学(NAIST)卒。 大手ゲーム会社などを経て、2020年DeNA中途入社。 2児の父。
現職では、「七声ニーナ」のような一般向けWebサービスの開発・運用から、事業ごとにプラットフォームが異なるネイティブアプリへの組み込みなど、AI技術の実用化を幅広い技術領域で担当しております。お気軽にご相談ください。

過去の講演
ゲームメーカー目線で Azure を活用した開発インフラのクラウドシフトとアプリ設計事例紹介, de:code 2019
ディープラーニングによる画像処理を実機側で高速に動かし、活用する技術, CEDEC 2019
分析業務をブーストするBIツール活用術, CEDEC 2017
アプリマーケット情報を活用して、ログに頼れない分析に立ち向かおう, CEDEC 2015
データ活用で生産性UP!統計分析を伴うツール開発の舞台裏, CEDEC 2011

<受講者へのメッセージ>

受講までに「VOICE AVATAR 七声ニーナ」を是非ご体験ください!当日は、わかりやすく実装ノウハウをお伝えできたらと思います。
閉じる

滝口 啓介

株式会社ディー・エヌ・エー

システム本部データ統括部AI研究開発部第二グループ

講演者詳細を開く >

<講演者プロフィール>

2020年4月 DeNA 入社
研究開発チームで、深層学習を用いた音声合成・音声変換に関する研究開発を行う。

<受講者へのメッセージ>

講演では、DeNAの音声変換や音声合成に関する取り組みについてご紹介できればと思います。
「VOICE AVATAR 七声ニーナ」では、現在DeNAで開発中の音声変換システムを体験することができるので、是非一度お試しください!
閉じる

豆谷 浩輝

株式会社ディー・エヌ・エー

システム本部データ統括部AI研究開発第二グループ

講演者詳細を開く >

<講演者プロフィール>

【略歴】
2020年 Universitat Pompeu Fabra, Sound and Music Computing - MSc修了
2020年 株式会社ディ・エヌ・エー入社
【主な論文】
Investigating context features hidden in End-to-End TTS (2019, ICASSP)
【その他】
YouTubeチャンネル Joytanで音声合成を活用した言語学習サービスを公開中

<受講者へのメッセージ>

日本語音声合成を構築する方法について発表します。理論的背景から泥臭い作業まで幅広くカバーし、研究開発の全体像をご紹介します。
閉じる

共同研究・開発者

 森 紘一郎, 株式会社ディー・エヌ・エー