Pat
J-GLOBAL ID:200903069860302700
書き起こしテキスト自動生成装置、音声認識装置および記録媒体
Inventor:
,
,
,
,
,
Applicant, Patent owner:
Agent (1):
谷 義一 (外2名)
Gazette classification:公開公報
Application number (International application number):1999350336
Publication number (International publication number):2001166790
Application date: Dec. 09, 1999
Publication date: Jun. 22, 2001
Summary:
【要約】【課題】 区切り記号付音素表記テキストデータを自動生成する。【解決手段】 漢字かな混じり書き起こしテキストデータ101を形態素解析して、漢字かな混じり書き起こしテキストデータの文字列を形態素毎に分割する。分割されたテキストデータの文字列がパターンマッチング部107において読み辞書102に基づき読み(音素表記)に変換される。1つの文字列について複数の読みが存在する場合には、音素表記書き起こしテキストデータに合致する音素表記が複数の読みの中から決定される。分割されたテキストデータで、読みが決定された音素表記テキストデータの中の分割位置に挿入記号が挿入される。
Claim (excerpt):
漢字かな混じり書き起こしテキストデータおよび該漢字かな混じりテキストデータに対応する音素表記を記載した音素表記書き起こしテキストデータを入力する入力手段と、当該入力された漢字かな混じりテキストデータを所定の認識単位毎に分割する第1の情報処理手段と、文字列およびその読みが記載されており、1つの文字列について複数の読みが許容される読み辞書を記憶した記憶手段と、前記第1の情報処理手段により分割されたテキストデータの分割位置と合致させたまま、前記読み辞書に基づき、前記分割された漢字かな混じりテキストデータ中の文字列を読みに変換し、同一の文字列について複数の読みが存在する場合には、当該複数の読みの中の最適候補を前記入力手段から入力された音素表記書き起こしテキストデータに基づき決定し、当該読みに変換された文字列の前記分割位置に区切り記号を挿入して区切り記号挿入済み音素表記テキストデータを生成する第2の情報処理手段とを具えたことを特徴とする書き起こしテキスト自動生成装置。
IPC (2):
FI (2):
G10L 3/00 537 Z
, G10L 3/00 533 Z
F-Term (1):
Return to Previous Page