タイトル | NHK Laboratories Note: Number 464 |
その他のタイトル | Speech recognition engine for real-time broadcast news captioning リアルタイムニュース放送字幕化のための音声認識エンジン |
著者(日) | 今井 亨; 小林 彰夫; 佐藤 庄衛; 田中 英輝; 安藤 彰男 |
著者(英) | Imai, Toru; Kobayashi, Akio; Sato, Shoei; Tanaka, Hideki; Ando, Akio |
著者所属(日) | 日本放送協会放送技術研究所 ヒューマンサイエンス; 日本放送協会放送技術研究所 ヒューマンサイエンス; 日本放送協会放送技術研究所 ヒューマンサイエンス; 日本放送協会放送技術研究所 ヒューマンサイエンス; 日本放送協会放送技術研究所 ヒューマンサイエンス |
著者所属(英) | NHK Science and Technical Research Laboratories Human Science Research Division; NHK Science and Technical Research Laboratories Human Science Research Division; NHK Science and Technical Research Laboratories Human Science Research Division; NHK Science and Technical Research Laboratories Human Science Research Division; NHK Science and Technical Research Laboratories Human Science Research Division |
発行日 | 2000-05 |
発行機関など | NHK Science and Technical Research Laboratories 日本放送協会放送技術研究所 |
刊行物名 | NHK Laboratories Note NHK放送技術研究所 Laboratories Note |
号 | 464 |
開始ページ | 1冊 |
刊行年月日 | 2000-05 |
言語 | eng |
抄録 | This paper describes a speech recognition engine that progressively outputs the latest available results of words used for real-time closed captioning of Japanese broadcast news. The search engine which is called a progressive two-pass decoder practically eliminates the disadvantage of conventional multiple-pass decoders that delay a decision until the end of a sentence. During the first pass of the search the proposed decoder periodically executes the second pass up to that time and detects a part of the final result of words. This method is not theoretically optimal but makes a quick decision with a negligible increase in word errors. In a recognition experiment on Japanese broadcast news, the decoder worked with an average decision delay of 554 ms for each word and degraded word accuracy only by 0.22 percents. 本論文では、日本語ニュース放送の特定者向けリアルタイム字幕化に用いる単語を利用可能な最新の選択結果として逐次出力する音声認識エンジンについて記述した。2パス逐次復号器と呼ぶ検索エンジンは、文章が終わるまで決定が遅れるという従来型の多重パス復号器の短所が実際上排除される。検索の第1パスの間に、提案復号器は周期的にその時までに第2パスを実行し、単語の最終選択結果の一部を検出する。この方法は、理論的に最善ではないが単語の誤りの増加は無視できる程度で迅速な決定をする。日本語ニュース放送での認識実験では、本復号器は各々の単語に対して554msの平均決定遅れ時間で作動し、不適切語精度はわずかに0.22%であった。 |
キーワード | speech recognition engine; real time broadcast news captioning; progressive output; search engine; progressive two pass decoder; multiple pass decoder; decision delay; word error; phonetic sound; homonym; ideogram; 音声認識エンジン; リアルタイムニュース放送字幕化; 逐次出力; 検索エンジン; 2パス逐次復号器; 多重パス復号器; 決定遅れ; 単語誤差; 音声音; 同音異義語; 表意文字 |
資料種別 | Technical Report |
ISSN | 0027-657X |
SHI-NO | AA0002181000 |
URI | https://repository.exst.jaxa.jp/dspace/handle/a-is/43138 |