文献
J-GLOBAL ID:201102201099715001   整理番号:11A0296110

新たな弱教師付き型分類手法Bautext

Bautext as a New Minimally Supervised Classification Technique
著者 (10件):
資料名:
巻: 52  号:ページ: 269-283  発行年: 2011年01月15日 
JST資料番号: Z0778B  ISSN: 1882-7837  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,web上の大量のレビュー情報を要約する際の基盤技術として,単語を意味的カテゴリに分類するための手法,Bautextを提案し評価する。Bautextは弱教師付き手法であり,係り受け関係と相互情報量に基づいた名詞・名詞句のカテゴリ分類を行う。Bautextの特徴は以下の4つである。1)既存のブートストラッピング法等は,性能が多数のパラメータに依存するため,ユーザは良い分類精度を得るためのパラメータ設定を試行錯誤して見つける必要があった(小町ら,2010)。一方,Bautextにおいてはユーザは多数のパラメータ設定をする必要がなく,少数の種語を与え,各カテゴリと単語の関連度(配属スコア)を計算することにより,漸次種語を増加させ,分類を自動化させている。2)既存のブートストラッピング法では,反復ごとに多数のカテゴリが1つの単語を獲得しようとするときに再度評価のステップがあった。一方,Bautextにおいては,各カテゴリが独立な特徴語集合を持ち,それをもとに各カテゴリへの単語の配属スコアを計算し,最大スコアのカテゴリが単語を獲得することでこの再度評価のステップをなくした。そのため,ブートストラッピング法と比べて高速な分類アルゴリズムとなっている。3)既存のブートストラッピング法では意味ドリフトという課題がある。意味ドリフトの原因は,反復処理の過程において,新しい単語を獲得するために使われる抽出パターン数が定数個であるため,以前の各反復で抽出できた適切な抽出パターンの影響が消されることにあると考えられる。これに対して,Bautextでは,各カテゴリが,独立な特徴語集合に今まで抽出できた適切な特徴語(抽出パータンと同じ役割)を保存することと反復ごとに分類対象の単語をランダムに選択させることにより,意味ドリフトを制御する効果が期待できる。4)目的の分類カテゴリに加えて「その他」カテゴリを導入することで,本来評価対象となりえない単語が「その他」カテゴリに移動し,目的の分類カテゴリの適合率が向上するという特徴がある。評価実験では,まず「その他」カテゴリの導入効果を確認した。...(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  情報加工一般  ,  自然語処理 
引用文献 (27件):
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る