文献
J-GLOBAL ID:201702255389528147   整理番号:17A0415418

文字クラスタリングを用いた条件付き確率場に基づく中国語単語セグメンテーション【Powered by NICT】

Chinese word segmentation based on conditional random fields with character clustering
著者 (8件):
資料名:
巻: 2016  号: IALP  ページ: 258-261  発行年: 2016年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
中国語単語セグメンテーションは,中国語テキストマイニングにおいて重要な役割を果たす。中国情報処理における自動関係抽出と同定の基礎である。本論文では,文字クラスタリングを用いた条件付き確率場(CRF)に基づく中国語単語セグメンテーションのための手法を提案した。文字クラスタ化のために,筆者らは最初に生コーパス(単語区切り記号なし)から文字埋め込みを得るためにスキップグラムモデルを使用した。は,K-ミーンズと褐色クラスタリングアルゴリズム,二つの異なるクラスタリングアルゴリズムを適用特性埋め込みのクラスタを得た。文字埋め込みの次元,クラスタの数,および異なるクラスタリングアルゴリズムの異なる数の影響を研究した。自然言語処理と中国コンピューティング(NLPCC2015)Weiboテキストセグメンテーションタスクに関する第四回CCF会議を用いて提案法を検証した。本システムは,95.67%のFスコアと語い(00V)率94.78%を達成した。結果は,文字表現に基づくクラスタリング特性埋め込みは短いテキスト上での中国語単語セグメンテーションの性能を改善できることを示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  パターン認識 

前のページに戻る