Pat
J-GLOBAL ID:201303010454832900
文章更新量評価プログラム
Inventor:
,
,
Applicant, Patent owner:
Agent (4):
牛木 護
, 清水 栄松
, 外山 邦昭
, 吉田 正義
Gazette classification:特許公報
Application number (International application number):2006140850
Publication number (International publication number):2007310746
Patent number:4872079
Application date: May. 19, 2006
Publication date: Nov. 29, 2007
Claim (excerpt):
【請求項1】 コンピュータに、比較する更新前後のテキストから任意の閾値以上の長さを有する共通部分文字列を抽出する抽出ステップと、当該共通部分文字列の抽出数から1を減算して編集点数を求めるステップと、前記共通部分文字列を抽出元の前記各テキストにおける出現順を保持した状態で並べて分割列をそれぞれ作成するステップと、各分割列を対比して一の分割列を他の分割列と一致させるために必要な前記共通部分文字列間の最小置換回数を計算して文脈編集距離を求めるステップと、前記テキストから当該共通部分文字列を取り除いた残余の文字列の合計長さが当該テキストの全長に対して占める割合を計算して新規創作率を求めるステップと、前記各テキストから当該共通部分文字列を取り除いた残余の文字列をそれぞれ集めて非共通部分文字列集合を作成するステップと、数式1で表される
(Γ1,Γ2は前記各非共通部分文字列集合から作成されるNグラム集合、|Γ1∩Γ2|はNグラム集合Γ1及びΓ2に共通して現れる共通要素数、|Γ1|はNグラム集合Γ1に含まれるNグラムの総数)
前記各非共通部分文字列集合間における前記閾値未満の長さによるNグラムの不一致率である新規創作分新規度DOを求める新規度評価ステップとを実行させ、
各ステップにより求められた編集点数と文脈編集距離と新規創作率と新規創作分新規度とを用いて、
評価式:a・EP+b・CED+NCP・DO・L
(EPは編集点数,CEDは文脈編集距離,NCPは新規創作率,DOは新規創作分新規度,Lは更新後のテキストの全長,a及びbは任意の係数)
により文章更新量を算出するステップを実行させるための文章更新量評価プログラム。
IPC (3):
G06F 17/24 ( 200 6.01)
, G06F 17/21 ( 200 6.01)
, G06F 17/30 ( 200 6.01)
FI (4):
G06F 17/24 554 N
, G06F 17/21 550 A
, G06F 17/30 220 Z
, G06F 17/30 240 A
Patent cited by the Patent:
Cited by examiner (2)
-
翻訳支援装置
Gazette classification:公開公報
Application number:特願平7-194134
Applicant:沖電気工業株式会社
-
類似度算出システムおよび類似度算出プログラム、並びに類似度算出方法
Gazette classification:公開公報
Application number:特願2003-327756
Applicant:セイコーエプソン株式会社
Return to Previous Page