特許
J-GLOBAL ID:200903078810546594

係り受け解析装置及びそのプログラム

発明者:
出願人/特許権者:
代理人 (1件): 吉田 精孝
公報種別:公開公報
出願番号(国際出願番号):特願2006-308798
公開番号(公開出願番号):特開2008-123403
出願日: 2006年11月15日
公開日(公表日): 2008年05月29日
要約:
【課題】係り元・係り先の2文節のみならず他の文節の情報も利用して、係り先がない文節または自身に係る文節を含めて解析すること。【解決手段】単語情報付き文節列の各文節の特徴を表す素性列を生成し(s1)、その各文節に対する、着目文節が後方N文節のどの文節にどのタイプで係るか又は後方N文節には係らないことを表すラベルを、着目文節のラベルの尤もらしさを着目文節及び後方N文節の素性と着目文節の直前の文節のラベルとから算出する条件付き確率場に基づく系列ラベリングにより決定し(s2)、各ラベルから後方N文節内に係り先がある文節を判定し、素性列から削除するとともに該削除文節に関するラベルを係り受け情報に変換し(s3)、素性列の文節数が1以下になるまで前記系列ラベリング及び文節削除を繰り返し(s4)、残された文節に関するラベルを係り受け情報に変換することにより係り受け情報付きの文節列を復元する(s5)。【選択図】図6
請求項(抜粋):
入力された日本語文の単語情報付きの文節列に対し、文節毎にその係り先文節と係り受けタイプを特定する方法であって、 文節列記憶手段と、素性列記憶手段と、削除文節記憶手段とを備えたコンピュータを用いて、 当該コンピュータが、 入力された日本語文の単語情報付き文節列を記憶する文節列記憶手段から一の文節を構成する各単語の単語情報を読み出し、該各単語の単語情報に基づいて当該一の文節の特徴を表す素性を決定して素性列記憶手段に記憶し、これを各文節について行って文節毎の素性をまとめた素性列を生成する素性列生成工程と、 素性列記憶手段から素性列を読み出し、該素性列中の各文節に対する、着目文節が後続する一定の範囲内のどの文節にどのタイプで係るかを表すラベル又は着目文節が後続する一定の範囲内の文節には係らないことを表すラベルを、前記着目文節のラベルの尤もらしさを当該着目文節及び後続する一定の範囲内の文節の素性と当該着目文節の直前の文節のラベルとを用いて算出する条件付き確率場に基づく系列ラベリングにより決定し、素性列記憶手段の各文節に対応させて記憶する系列ラベリング工程と、 素性列記憶手段から各文節に対応するラベルを読み出し、当該各ラベルから前記後続する一定の範囲内に係り先がある文節を判定し、これを素性列記憶手段から削除するとともに、該削除した文節に関するラベルを係り先文節と係り受けタイプに変換して削除文節記憶手段に記憶する文節削除工程と、 素性列記憶手段に記憶されている文節数が1以下になるまで前記系列ラベリング工程及び文節削除工程を繰り返し実行させる終了判定工程と、 素性列記憶手段から残された文節に関するラベルを読み出し、これを係り先文節と係り受けタイプに変換するとともに、削除文節記憶手段から削除された文節に関する係り先文節と係り受けタイプを読み出し、係り先文節と係り受けタイプからなる係り受け情報付きの文節列を復元する文節列復元工程とを実行する ことを特徴とする係り受け解析方法。
IPC (1件):
G06F 17/27
FI (1件):
G06F17/27 L
Fターム (2件):
5B091AA15 ,  5B091CA05
引用特許:
出願人引用 (1件)

前のページに戻る