特許
J-GLOBAL ID:200903096058443231

複合名詞解析方法

発明者:
出願人/特許権者:
代理人 (1件): 小川 勝男
公報種別:公開公報
出願番号(国際出願番号):特願平8-042460
公開番号(公開出願番号):特開平9-237277
出願日: 1996年02月29日
公開日(公表日): 1997年09月09日
要約:
【要約】【課題】自然言語処理において,複合名詞の構造解析は応用上も重要な位置を占めるは知られていなかった。本発明の目的は,実際に文書中の他の箇所に出現する手掛かりを収集し,それを組み合わせることにより,未知語を含む複合名詞に対しても,構造推定を可能とする方法を提供することを目的とする。【解決手段】複合語を形態素解析して得られる単語それぞれに対し,核単語と共起する単語をパターンマッチャ601〜607を用いて検索し,共起例をデータ記憶領域に記憶し,未知語が発見された場合,未知語記憶領域に記憶する(1006,1007)。発見された未知語それぞれについて,再び共起パターンを検索し,結果を共起データ記憶領域に追加する(1008,1009)。共起データベースから係り受け尤度記憶領域のデータを構成し(1010),未知語が発見された場合,形態素解析結果を修正(1011)した後,修正された単語群の間の係り受け関係を係り受け尤度記憶領域のデータを用いて推定する(1012)。
請求項(抜粋):
文書中に出現する,長さ2以下の名詞,名詞接頭辞,名詞接尾辞等の,以下単に単語とよぶ要素の列であるところの複合名詞に対し,該複合名詞を構成する単語間の係り受け関係,係り受け関係が存在する場合には,その種類を推定することである複合名詞解析方法において,複合名詞を構成する各単語が,該文書を含む一つ又は複数の文書集合中に出現する箇所を探索し,該単語と,該単語の各出現位置の近傍に存在する単語の間に,指定された関係があるか否かを判定し,指定された関係を満たす場合,用例データベースと呼ぶ記憶領域に該単語と,近傍単語を,それらの間の関係とともに記録し,該複合名詞中に複数の可能な係り受け関係が存在する場合,上記記録された情報を用いて,最も尤もらしい関係を決定することを特徴とする複合名詞解析方法。
FI (2件):
G06F 15/38 E ,  G06F 15/38 L

前のページに戻る