特許
J-GLOBAL ID:200903069860302700

書き起こしテキスト自動生成装置、音声認識装置および記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 谷 義一 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-350336
公開番号(公開出願番号):特開2001-166790
出願日: 1999年12月09日
公開日(公表日): 2001年06月22日
要約:
【要約】【課題】 区切り記号付音素表記テキストデータを自動生成する。【解決手段】 漢字かな混じり書き起こしテキストデータ101を形態素解析して、漢字かな混じり書き起こしテキストデータの文字列を形態素毎に分割する。分割されたテキストデータの文字列がパターンマッチング部107において読み辞書102に基づき読み(音素表記)に変換される。1つの文字列について複数の読みが存在する場合には、音素表記書き起こしテキストデータに合致する音素表記が複数の読みの中から決定される。分割されたテキストデータで、読みが決定された音素表記テキストデータの中の分割位置に挿入記号が挿入される。
請求項(抜粋):
漢字かな混じり書き起こしテキストデータおよび該漢字かな混じりテキストデータに対応する音素表記を記載した音素表記書き起こしテキストデータを入力する入力手段と、当該入力された漢字かな混じりテキストデータを所定の認識単位毎に分割する第1の情報処理手段と、文字列およびその読みが記載されており、1つの文字列について複数の読みが許容される読み辞書を記憶した記憶手段と、前記第1の情報処理手段により分割されたテキストデータの分割位置と合致させたまま、前記読み辞書に基づき、前記分割された漢字かな混じりテキストデータ中の文字列を読みに変換し、同一の文字列について複数の読みが存在する場合には、当該複数の読みの中の最適候補を前記入力手段から入力された音素表記書き起こしテキストデータに基づき決定し、当該読みに変換された文字列の前記分割位置に区切り記号を挿入して区切り記号挿入済み音素表記テキストデータを生成する第2の情報処理手段とを具えたことを特徴とする書き起こしテキスト自動生成装置。
IPC (2件):
G10L 15/18 ,  G10L 15/12
FI (2件):
G10L 3/00 537 Z ,  G10L 3/00 533 Z
Fターム (1件):
5D015GG03

前のページに戻る