文献
J-GLOBAL ID:201102234670366953   整理番号:11A1151775

ラベルなしデータの二段階分類とアンサンブル学習に基づく半教師あり日本語語義曖昧性解消

Semi-Supervised Japanese Word Sense Disambiguation Based on Two-Stage Classification of Unlabeled Data and Ensemble Learning
著者 (2件):
資料名:
巻: 18  号:ページ: 247-271  発行年: 2011年06月28日 
JST資料番号: L3934A  ISSN: 1340-7619  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,パラメータ調整を簡略化したブートストラッピング的手法による日本語語義曖昧性解消を提案する。本稿で取り上げるブートストラッピングとは,ラベルなしデータを既存の教師あり学習手法を用いて分類し,その中で信頼度の高いデータをラベル付きデータに加え,この手順を反復することによって分類の性能を向上させる半教師あり学習手法である。従来のブートストラッピングによる語義曖昧性解消においては,プールサイズ,ラベル付きデータに追加するラベルなしデータの事例数,手順の反復回数といったパラメータをタスクに合わせ調整する必要があった。本稿にて提案する手法はヒューリスティックと教師あり学習(最大エントロピー法)によるラベルなしデータの二段階の分類,および学習に用いるラベルなしデータの条件を変えた複数の分類器のアンサンブルに基づく。これにより必要なパラメータ数は一つになり,かつパラメータの変化に対し頑健な語義曖昧性解消を実現する。SemEval-2日本語タスクのデータセットを用いたベースラインの教師あり手法との比較実験の結果,パラメータの変化に対し最高で1.8ポイント,最低でも1.56ポイントの向上が見られ,提案手法の有効性を示せた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  人工知能 
引用文献 (40件):
もっと見る

前のページに戻る