特許
J-GLOBAL ID:200903015984807395

クラス同定モデル生成方法、装置、およびプログラム、クラス同定方法、装置、およびプログラム

発明者:
出願人/特許権者:
代理人 (2件): 金田 暢之 ,  伊藤 克博
公報種別:公開公報
出願番号(国際出願番号):特願2002-355284
公開番号(公開出願番号):特開2004-184951
出願日: 2002年12月06日
公開日(公表日): 2004年07月02日
要約:
【課題】音声認識の語彙に含まれていない未知語の固有名詞を認識する場合等に、どの種類の固有表現かを同定する。【解決手段】形態素対応付け部3によって、音声メディアが変換された形態素の並びと、固有表現クラス付き形態素の並びは両者の全体の類似度が最も大きくなるように対応付けられ、前者の形態素の並びに、後者の形態素が有する固有表現クラスが付与される。言語モデル学習部4は、固有表現クラス付き形態素の並びから統計的に言語モデルを学習する。単語グラフ作成部5は、個数だけ尤もらしい順に出力される形態素の並びに対して、形態素をノードとし各形態素の開始位置および終了位置における可能な接続をリンクとする単語グラフを作成する。固有表現付与部6は、単語グラフに対して、言語モデルに基づいて、単語グラフの先頭位置から終端位置までの確率が最大となるように、固有表現付き形態素を選択し、固有表現付き形態素の並びを出力する。【選択図】 図1
請求項(抜粋):
電子テキスト以外のメディアから内容を認識して電子テキストに変換する際に、単語表記と読みの情報が格納されている認識語彙データベースに基づいて、形態素の候補の並びを、指定した個数だけ尤もらしい順に出力するメディア変換ステップと、 電子テキスト以外のメディアに含まれる内容に対応する固有表現タグ付きテキストを解析して、単語情報が格納されている形態素辞書に基づいて形態素に分割し、固有表現タグに対応する固有表現クラスを固有表現タグに含まれるすべての形態素に付与し、固有表現クラス付き形態素の並びを出力するタグ付きテキスト解析ステップと、 認識候補の形態素の並びと前記固有表現クラス付き形態素の並びの両者を両者の形態素が有する情報に基づいて類似度が最大となるように対応付けて、前者の形態素に後者の形態素の有する固有表現クラスを付与する形態素対応付けステップと、 固有表現クラス付き形態素の並びから、統計的に言語モデルを学習する言語モデル学習ステップとを有するクラス同定モデル生成方法。
IPC (2件):
G10L15/06 ,  G10L15/18
FI (2件):
G10L3/00 521F ,  G10L3/00 537G
Fターム (3件):
5D015BB01 ,  5D015GG01 ,  5D015KK02
引用特許:
出願人引用 (8件)
全件表示
審査官引用 (5件)
全件表示
引用文献:
出願人引用 (2件) 審査官引用 (2件)
  • An Algorithm that Learns What's in a Name
  • An Algorithm that Learns What's in a Name

前のページに戻る