特許
J-GLOBAL ID:200903067707392242

位置情報の自動抽出装置および自動抽出方法と記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 金田 暢之
公報種別:公開公報
出願番号(国際出願番号):特願平11-053137
公開番号(公開出願番号):特開2000-250931
出願日: 1999年03月01日
公開日(公表日): 2000年09月14日
要約:
【要約】【課題】 文章中に含まれている住所表現または地域名表現の位置情報を高い確率で自動抽出する。【解決手段】 入力された文章を形態素に分解し(ステップ101)、各形態素と地域名表現と比較する(ステップ102)。各形態素を含む表現が、正式な住所表現であるかを判定する例外判定処理を行ない(ステップ103)、正式な住所表現の場合、形態素と日本全国の住所表現との比較を順次行ない住所表現を抽出する(ステップ104)。例外判定処理において正式な住所表現ではない場合に、各形態素と予め登録された例外住所表現との一致検索を行ない例外住所表現を抽出し、それらに「県」、「市」、郡名を追加して正式な住所表現に変換する(ステップ108〜110)。抽出された位置情報から6語以内に位置情報補足語がある場合にはそれを含めて位置情報として出力する(ステップ106)。
請求項(抜粋):
入力された文章に含まれている位置情報を抽出するための位置情報の自動抽出方法であって、入力された文章を1または複数の文字列単位で区切ることにより複数の形態素に分解する処理と、前記各形態素のうちの1つの形態素を検索対象形態素とし、該検索対象形態素が、予め登録された地域名表現の文字列と一致するかどうかを判定する処理と、前記検索対象形態素を含む表現が、正式な住所表現であるかとうかを判定する例外判定処理と、前記例外判定処理において前記検索対象形態素を含む表現が正式な住所表現であると判定された場合に、前記検索対象形態素と予め登録された日本全国の住所表現の文字列との一致検索を順次行なうことにより前記文章から住所表現を抽出する住所抽出処理と、前記例外判定処理において前記検索対象形態素を含む表現が正式な住所表現ではないと判定された場合に、前記検索対象形態素と予め登録された例外住所表現の文字列との一致検索を行うことにより例外住所表現を抽出し、抽出された該例外住所表現に省略された「県」または「市」の文字列若しくは省略された郡名を追加して正式な住所表現に変換する例外住所抽出処理と、抽出された地域名表現および住所表現の末尾から一定数以内の各形態素に、予め登録された位置情報補足語と同一の文字列が存在するかどうか検索し、存在する場合には地域名表現または住所表現から該位置情報補足語までを位置情報とする位置情報補足語抽出処理とから構成される位置情報の自動抽出方法。
IPC (2件):
G06F 17/30 ,  G06F 17/27
FI (4件):
G06F 15/401 310 A ,  G06F 15/20 550 Z ,  G06F 15/40 370 A ,  G06F 15/413 310 B
Fターム (8件):
5B009QA12 ,  5B075ND03 ,  5B075NK02 ,  5B075NK32 ,  5B075NK49 ,  5B075NR06 ,  5B075QM02 ,  5B075UU06

前のページに戻る