特許
J-GLOBAL ID:201403075795767369

文書処理装置およびプログラム

発明者:
出願人/特許権者:
代理人 (2件): 志賀 正武 ,  高橋 詔男
公報種別:公開公報
出願番号(国際出願番号):特願2013-035817
公開番号(公開出願番号):特開2014-164575
出願日: 2013年02月26日
公開日(公表日): 2014年09月08日
要約:
【課題】文書に含まれる文を例えば平易な文に変換し、且つ文書の自然さをも得ることのできる文書処理装置を提供する。【解決手段】分割候補点認定部は、文節の並びのパターンと文節間の係り受けのパターンとに基づいて、文中の分割候補点を認定する。分割候補文作成部は、前記分割候補点を用いるとともに、分割後の文のための補完規則を保持する分割補完規則テーブルを参照することにより、分割候補文を作成する。目的文書特徴テーブル記憶部は、目的とする文書についての統計的特徴を保持する。分割文認定部は、目的文書特徴テーブル記憶部に基づいて、条件に合わない分割候補文を除外するとともに、統計的特徴についての制約条件下で目的関数を最適化する解を求め、その解に対応する分割候補文を分割文として選択する。【選択図】図1
請求項(抜粋):
表記における文節の並びのパターンと、文節間の係り受けのパターンとに基づいて、分割候補点の位置を決定する規則を分割パターンの種別ごとに保持する分割候補点パターンテーブル記憶部と、 入力される文書に含まれる文の係り受け解析結果のデータを、前記分割候補点パターンテーブル記憶部から読み出した前記規則にマッチングさせることにより、前記文における前記分割候補点の位置および種別を認定する分割候補点認定部と、 表記における文節の並びのパターンと、文節間の係り受けのパターンと、分割候補点の位置および種別とに基づいて、分割後の文のための補完規則を保持する分割補完規則テーブル記憶部と、 前記分割候補点認定部によって認定された前記分割候補点に基づいて、前記文を分割するとともに、当該文の文節の並びのパターンと、当該文の文節間の係り受けのパターンと、当該文に対して適用する前記分割候補点に応じて、前記分割補完規則テーブル記憶部から前記補完規則を読み出し、読み出した補完規則を分割後の文に適用することによって分割候補文を作成する分割候補文作成部と、 目的とする文書についての統計的特徴を保持する目的文書特徴テーブル記憶部と、 前記分割候補文作成部によって作成された分割候補文のうち、前記目的文書特徴テーブル記憶部に記憶された前記統計的特徴の少なくとも一部の条件に合わない前記分割候補文を除外するとともに、除外されなかった前記分割候補文に関して、前記目的文書特徴テーブル記憶部に記憶されたデータの少なくとも一部が表わす制約条件下で、分割前の前記文の統計的特徴と前記分割候補文のうちのいずれかの文の統計的特徴とを入力として算出される所定の目的関数の値を最適化する解を求め、得られた前記解に対応する分割候補文を、分割文として選択することを認定する分割文認定部と、 入力された前記文書に含まれる各々の前記文に対応して前記分割文認定部によって認定された分割文により、変換後の文書を作成し出力する文書出力部と、 を具備することを特徴とする文書処理装置。
IPC (2件):
G06F 17/27 ,  G06F 17/21
FI (2件):
G06F17/27 Z ,  G06F17/21 550J
Fターム (7件):
5B091AA11 ,  5B091AA15 ,  5B091CA05 ,  5B091CA21 ,  5B091EA01 ,  5B109QA04 ,  5B109QA14

前のページに戻る