抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,パラメータ調整を簡略化したブートストラッピング的手法による日本語語義曖昧性解消を提案する。本稿で取り上げるブートストラッピングとは,ラベルなしデータを既存の教師あり学習手法を用いて分類し,その中で信頼度の高いデータをラベル付きデータに加え,この手順を反復することによって分類の性能を向上させる半教師あり学習手法である。従来のブートストラッピングによる語義曖昧性解消においては,プールサイズ,ラベル付きデータに追加するラベルなしデータの事例数,手順の反復回数といったパラメータをタスクに合わせ調整する必要があった。本稿にて提案する手法はヒューリスティックと教師あり学習(最大エントロピー法)によるラベルなしデータの二段階の分類,および学習に用いるラベルなしデータの条件を変えた複数の分類器のアンサンブルに基づく。これにより必要なパラメータ数は一つになり,かつパラメータの変化に対し頑健な語義曖昧性解消を実現する。SemEval-2日本語タスクのデータセットを用いたベースラインの教師あり手法との比較実験の結果,パラメータの変化に対し最高で1.8ポイント,最低でも1.56ポイントの向上が見られ,提案手法の有効性を示せた。(著者抄録)