JAXA Repository / AIREX 未来へ続く、宙(そら)への英知

このアイテムに関連するファイルはありません。

タイトルNHK Laboratories Note: Number 464
その他のタイトルSpeech recognition engine for real-time broadcast news captioning
リアルタイムニュース放送字幕化のための音声認識エンジン
著者(日)今井 亨; 小林 彰夫; 佐藤 庄衛; 田中 英輝; 安藤 彰男
著者(英)Imai, Toru; Kobayashi, Akio; Sato, Shoei; Tanaka, Hideki; Ando, Akio
著者所属(日)日本放送協会放送技術研究所 ヒューマンサイエンス; 日本放送協会放送技術研究所 ヒューマンサイエンス; 日本放送協会放送技術研究所 ヒューマンサイエンス; 日本放送協会放送技術研究所 ヒューマンサイエンス; 日本放送協会放送技術研究所 ヒューマンサイエンス
著者所属(英)NHK Science and Technical Research Laboratories Human Science Research Division; NHK Science and Technical Research Laboratories Human Science Research Division; NHK Science and Technical Research Laboratories Human Science Research Division; NHK Science and Technical Research Laboratories Human Science Research Division; NHK Science and Technical Research Laboratories Human Science Research Division
発行日2000-05
発行機関などNHK Science and Technical Research Laboratories
日本放送協会放送技術研究所
刊行物名NHK Laboratories Note
NHK放送技術研究所 Laboratories Note
464
開始ページ1冊
刊行年月日2000-05
言語eng
抄録This paper describes a speech recognition engine that progressively outputs the latest available results of words used for real-time closed captioning of Japanese broadcast news. The search engine which is called a progressive two-pass decoder practically eliminates the disadvantage of conventional multiple-pass decoders that delay a decision until the end of a sentence. During the first pass of the search the proposed decoder periodically executes the second pass up to that time and detects a part of the final result of words. This method is not theoretically optimal but makes a quick decision with a negligible increase in word errors. In a recognition experiment on Japanese broadcast news, the decoder worked with an average decision delay of 554 ms for each word and degraded word accuracy only by 0.22 percents.
本論文では、日本語ニュース放送の特定者向けリアルタイム字幕化に用いる単語を利用可能な最新の選択結果として逐次出力する音声認識エンジンについて記述した。2パス逐次復号器と呼ぶ検索エンジンは、文章が終わるまで決定が遅れるという従来型の多重パス復号器の短所が実際上排除される。検索の第1パスの間に、提案復号器は周期的にその時までに第2パスを実行し、単語の最終選択結果の一部を検出する。この方法は、理論的に最善ではないが単語の誤りの増加は無視できる程度で迅速な決定をする。日本語ニュース放送での認識実験では、本復号器は各々の単語に対して554msの平均決定遅れ時間で作動し、不適切語精度はわずかに0.22%であった。
キーワードspeech recognition engine; real time broadcast news captioning; progressive output; search engine; progressive two pass decoder; multiple pass decoder; decision delay; word error; phonetic sound; homonym; ideogram; 音声認識エンジン; リアルタイムニュース放送字幕化; 逐次出力; 検索エンジン; 2パス逐次復号器; 多重パス復号器; 決定遅れ; 単語誤差; 音声音; 同音異義語; 表意文字
資料種別Technical Report
ISSN0027-657X
SHI-NOAA0002181000
URIhttps://repository.exst.jaxa.jp/dspace/handle/a-is/43138


このリポジトリに保管されているアイテムは、他に指定されている場合を除き、著作権により保護されています。