特許
J-GLOBAL ID:200903075111335287
情報処理システム及び情報処理方法、並びにコンピュータ・プログラム
発明者:
,
出願人/特許権者:
代理人 (3件):
澤田 俊夫
, 宮田 正昭
, 山田 英治
公報種別:公開公報
出願番号(国際出願番号):特願2004-124919
公開番号(公開出願番号):特開2005-309706
出願日: 2004年04月21日
公開日(公表日): 2005年11月04日
要約:
【課題】 人々の総意に基づく一般的なシソーラスだけではなく、特定の人物や組織の関心や興味、経験に基づく個人のシソーラスを安価に自動構築する。【解決手段】 語の共起関係を求める際に、異なる幅の共起ウィンドウの混在を許容する。すなわち、文脈の個数を多くすると同時に、共起ウィンドウの幅に応じて共起度を変動させることで、共起の概念をより精緻に捉え、少量のコーパスから満足のいく個人シソーラスを構築する。したがって、従来方式では共起度が常に自然数で表されるのに対し、本発明では共起度は少数値を取りえる。この枠組みは、これまでの共起関係の捉え方の拡張概念に相当するものと考えることができる。【選択図】 図2
請求項(抜粋):
文書集合に含まれる語を抽出し、個々の語について関連語のリストを持つシソーラスを構築する情報処理システムであって、
文書集合から語を抽出する語抽出手段と、
文書集合から複数の種類の文脈を抽出する文脈抽出手段と、
前記語抽出手段により抽出された各語について、前記文脈抽出手段により抽出された文脈毎に重みを算出する重み算出手段と、
語の各文脈に対する重みを基に、同じ傾向を示す語が高い類似度を示すように語間の類似度を算出する類似度算出手段と、
算出された語間の類似度に基づいて、個々の語について類似度の高い語を関連語として収集する関連語収集手段と、
を具備することを特徴とする情報処理システム。
IPC (1件):
FI (1件):
Fターム (8件):
5B091AA15
, 5B091AB17
, 5B091CA02
, 5B091CA05
, 5B091CA14
, 5B091CC05
, 5B091CC16
, 5B091EA24
引用特許:
出願人引用 (1件)
審査官引用 (6件)
全件表示
前のページに戻る