Pat
J-GLOBAL ID:201103099586588370

専門的記述と非専門的記述間の語彙変換方法・プログラム・システム

Inventor:
Applicant, Patent owner:
Agent (1): 特許業務法人アイ・ピー・エス
Gazette classification:特許公報
Application number (International application number):2004127122
Publication number (International publication number):2005309853
Patent number:4634736
Application date: Apr. 22, 2004
Publication date: Nov. 04, 2005
Claim (excerpt):
【請求項1】 用語リストに基づき検索された共通の話題を有する第1の文書と第2の文書から、前記第1の文書の着目する語彙に対応する前記第2の文書の語彙、又は、前記第2の文書の着目する語彙に対応する前記第1の文書の語彙を検出する装置であって、 (a)第1の文書から、第1の語彙リストに記載されている各語彙の発生頻度を基に、第1の語彙行列を作成する手段と、 (b)第2の文書から、第2の語彙リストに記載されている各語彙の発生頻度を基に、第2の語彙行列を作成する手段と、 (c)前記第1の語彙行列及び前記第2の語彙行列の積から語彙変換行列を求める手段と、 (d)前記語彙変換行列の着目する行の中から値の大きい語彙を所定数選択し、前記第2の文書の着目する語彙に対応する前記第1の文書の語彙とする手段と、 (e)前記語彙変換行列の着目する列の中から値の大きい語彙を所定数選択し、前記第1の文書の着目する語彙に対応する前記第2の文書の語彙とする手段と を有し、 前記第1の語彙行列は、sを前記用語リストの数、及び、nを第1の文書から選択された語彙数としたとき、s行n列の行列Pで表され、前記行列Pの構成要素は、前記第1の文書のk番目の文書に現れるi番目の語彙の頻度をExp(k,i) 、前記語彙の全体の頻度をEtf(i)、k番目の文書に生じる語の総数をEwf(k)としたとき、 前記第2の語彙行列は、sを前記用語リストの数、及び、mを第2の文書から選択された語彙数としたとき、s行m列の行列Qで表され、前記行列Qの構成要素は、前記第2の文書のk番目の文書に現れるr番目の語彙の頻度をNaive(k,r)、前記語彙の全体の頻度をNtf(r)、k番目の文書に生じる語彙の総数をNwf(k)としたとき、 で与えられる 装置。
IPC (2):
G06F 17/30 ( 200 6.01) ,  G06F 17/28 ( 200 6.01)
FI (4):
G06F 17/30 210 D ,  G06F 17/30 170 A ,  G06F 17/30 340 B ,  G06F 17/28 X
Patent cited by the Patent:
Cited by applicant (1)
  • 文献検索システム
    Gazette classification:公開公報   Application number:特願平5-084153   Applicant:新日本製鐵株式会社
Cited by examiner (1)
  • 文献検索システム
    Gazette classification:公開公報   Application number:特願平5-084153   Applicant:新日本製鐵株式会社
Article cited by the Patent:
Return to Previous Page