特許
J-GLOBAL ID:200903060305121825

辞書生成装置、辞書生成方法および辞書生成プログラム

発明者:
出願人/特許権者:
代理人 (5件): 曾我 道照 ,  曾我 道治 ,  古川 秀利 ,  鈴木 憲七 ,  梶並 順
公報種別:公開公報
出願番号(国際出願番号):特願2004-059073
公開番号(公開出願番号):特開2005-250762
出願日: 2004年03月03日
公開日(公表日): 2005年09月15日
要約:
【課題】従来の類義語辞書生成は、自動処理のため、単語分割誤り、統計処理計算の歪みなどで不要な類義関係を抽出や取りこぼしがあり、また修正作業用手段がないため、修正が困難で、かつ部品表や製品名データベース等既存知識を類義語辞書に反映することができなかった。【解決手段】学習用の文書を入力する入力手段と、入力した文書中のテキストを単語に分割する単語分割手段と、文書中の所定の範囲において同時に出現する単語の頻度統計を収集する共起頻度表生成手段と、辞書の関連性をカスタマイズするためのシソーラス情報を仮想的な頻度表に変換するシソーラス頻度表変換手段と、上記共起頻度表と仮想頻度表を統合する頻度表統合手段と、頻度表統合手段で統合された頻度表をもとに単語間の関連性を学習し、統合頻度表を圧縮して概念辞書を作成する関連性学習手段とを備える。【選択図】図1
請求項(抜粋):
学習用の文書を入力する入力手段と、入力した文書中のテキストを単語に分割する単語分割手段と、文書中の所定の範囲内に出現する単語の頻度統計を収集する共起頻度表生成手段と、共起頻度表をもとに単語間の関連性を学習し、共起頻度表を圧縮して概念辞書を作成する関連性学習手段とを備える辞書生成装置において、辞書の類義関連性をカスタマイズするためのシソーラス情報を仮想的な頻度表に変換するシソーラス頻度表変換手段と、上記共起頻度表と仮想頻度表を統合する頻度表統合手段とを備え、頻度表統合手段で統合された頻度表を圧縮して上記関連性学習手段が概念辞書を作成することを特徴とする辞書生成装置。
IPC (2件):
G06F17/30 ,  G06F17/28
FI (3件):
G06F17/30 320D ,  G06F17/30 170A ,  G06F17/28 U
Fターム (17件):
5B075ND03 ,  5B075NK32 ,  5B075NR10 ,  5B075PP24 ,  5B075PQ10 ,  5B075PQ12 ,  5B075PR04 ,  5B075QM07 ,  5B075QP01 ,  5B075QP03 ,  5B075QS01 ,  5B075UU01 ,  5B075UU06 ,  5B091AB17 ,  5B091CC04 ,  5B091CC16 ,  5B091EA01
引用特許:
出願人引用 (1件)
  • 文書分類装置
    公報種別:公開公報   出願番号:特願平5-259809   出願人:シャープ株式会社

前のページに戻る