第1章 音声認識の応用技術
第1節 ロボット聴覚のためのオープンソースソフトウェアHARK とPyHARK 〈中臺 一博/糸山 克寿〉
1. はじめに
2. ロボット聴覚オープンソースソフトウェアHARK
3. HARKの課題とPython化
4. PyHARKアーキテクチャ
5. PyHARKを用いた実装例
6. PyHARKの性能
7. おわりに
第2節 叫び声から危機を検知するための音声コーパス構築 〈福森 隆寛〉
1. はじめに
2. 叫び声コーパスRISCの構築
3. RISCを用いた評価実験
4. おわりに
第3節 聴覚障がい者向け音声認識システムの開発 〈周藤 唯〉
1. Honda CAシステム
2. 従来の音声認識技術の課題
3. 語彙拡張を実現する音声認識モデル
4. 性能評価
5. まとめと今後の展望
第4節 世界最高水準の高精度音声認識AI「shirushi」の開発 〈松田 裕之/渡辺 光太朗〉
1. はじめに
2. 音声認識の課題と昨今の技術発展
3. Whisper実用化のための取り組み
4. 大規模言語モデル(LLM)との組み合わせによるさらなる性能向上
5. 今後の展望
第5節 音声認識AIを搭載したティーチングレスロボットシステムの開発 〈白土 浩司/三井 祥幹〉
1. 概 要
2. ティーチングレスロボットシステム
3. 音声認識AI 技術の特徴
4. まとめ
第2章 音声合成の応用技術
第1節 生成AI時代の音声合成プロダクト「FutureVoice Crayon」
〈鳥居 崇/中川 達也/高橋 敏〉
1. はじめに
2. 会社紹介
3. FutureVoice Crayon のプロダクト構成と技術動向
4. FutureVoice Crayon の導入事例
5. 今後の適用業界の拡大
6. 今後の課題
第2節 落語を演じる音声合成 〈加藤 集平〉
1. はじめに
2. 情報伝達を超えた音声合成としての落語を演じる音声合成
3. 落 語
4. リサーチ・クエスチョンと技術的課題
5. 落語を演じる音声合成を作る
6. 落語の音声合成は前座・二ツ目・真打ならどの水準に相当するのか
7. おわりに
第3節 日本放送協会における音声合成の研究開発と実用化 〈栗原 清〉
1. はじめに
2. 研究開発
3. NHKにおける音声合成の実用化
4. おわりに
第3章 音声によるコミュニケーション技術
第1節 音声による感情認識の開発 〈小坂 哲夫〉
1. はじめに
2. 感情音声コーパス
3. 言語特徴と音響特徴を併用した音声感情認識
4. まとめと今後の展望
第2節 共感的な傾聴対話ロボットの開発 〈井上 昂治〉
1. はじめに
2. 傾聴対話システム
3. 高齢者との対話実験
4. 同調笑いの生成
5. おわりに
第3節 聞き手の反応によって発話タイミングを変える音声ガイダンス 〈森 大毅〉
1. はじめに
2. 聞き手反応の実時間検出
3. 聞き手アウェアな音声ガイドシステムの開発
4. 音声ガイドシステムとのインタラクション実験
5. 考 察
6. おわりに
第4節 ろう・難聴者や盲ろう者のコミュニケーションを支援する音声処理 〈小林 彰夫〉
1. はじめに
2. 音声認識を用いた字幕による情報保障
3. ろう・難聴者を対象とした音声認識
4. 盲ろう者のための音声点訳
5. ろう・難聴者の聞き取り支援
6. おわりに
第5節 音声認識AI を搭載したコミュニケーションロボットの開発 〈松田 健〉
1. はじめに
2. 音声認識技術とは
3. 音声認識技術の実装上の課題
4. おわりに
|