多義性を考慮した拡張固有表現のクラス判定手法

富田準二; 富田準二; 福田浩章; 山本喜一

文献

J-GLOBAL ID：201202219696994403 整理番号：12A0799089

多義性を考慮した拡張固有表現のクラス判定手法

A Class Estimation Method for Extended Named Entities with Multiple Meanings

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=12A0799089&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=12A0799089&from=J-GLOBAL&jstjournalNo=L7379A") }}

著者 (4件)： , , ,
資料名：
巻： 2011 号： 2 ページ： ROMBUNNO.DETABESU,VOL.4,NO.4,34-47 発行年： 2012年04月15日
JST資料番号： L7379A ISSN： 1882-7772 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

文書からの知識抽出を行うために,詳細にクラス分けされた固有表現の辞書が必要とされている。本稿では,このような辞書の自動構築を目指し,未知語が与えられたときに,その表記が対象クラスに属するかどうかを自動判定する手法を提案する。まず,教師データとして,クラスとそのクラスに属する表記集合だけが与えられたときに,タグなしコーパスから文脈情報を取得して集約し,学習および推定を行う従来手法について検証する。この結果から,従来手法では,学習時に,多義語が教師データに含まれることによる精度の低下は小さいが,推定対象が多義語の場合に,対象とする語義以外の文脈から得られた特徴量が悪影響を及ぼし,精度の低下が大きいことを示す。次に,従来手法のように文脈情報を集約してから推定を行うのではなく,推定対象の表記が出現する個々の文脈ごとに推定を行い,推定結果であるスコアを集約することで,対象とするクラス以外の語義で,その表記が用いられている文脈の影響を軽減する手法を提案する。本手法では,使用頻度の少ない語義に対するクラス判定の精度を向上させることができるため,タグなしコーパスを増やすことで多義語が持つ複数の語義を網羅的に獲得できるようになることを示す。(著者抄録)

, , , , , , , , , ,
, , ,

人工知能 , 情報加工一般 , 自然語処理

引用文献 (19件)：

, , , ,

前のページに戻る