文献
J-GLOBAL ID:202102292101975793   整理番号:21A1957428

新聞テキストにおける名前付きエンティティの自動分類のためのCRF+LGの利用【JST・京大機械翻訳】

Using $¥text{CRF}+¥text{LG}$ for automated classification of named entities in newspaper texts
著者 (5件):
資料名:
巻: 2020  号: CLEI  ページ: 27-32  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
情報生産は加速速度で成長している。処理すべき大量の情報があり,テキストの収集と開発に関連したタスクを,最も多様な分野,特に計算言語からの努力を必要とする。計算言語の目標の一つは,計算資源の適用で抽出された経験的証拠を通して,言語データセットの収集と開発を可能にすることである。本研究では,新聞から抽出したデータセットの作成を示した。文章,トークン化,エンティティ認識(NER),およびデータセットを記述する統計的方法を抽出するために,技術を使用した。他の研究者は利用可能なコーパスから直接利益を得ることができる。本研究は,HAREMカテゴリーに従って,エンティティのためのポルトガルにおける1029の注釈付きニュース記事を有するコーパスを提示した。108ページのサンプルにおいて,著者らの実験は,同じ新聞から金標準テキストと比較して97.0%の類似性を示した。抽出したデータセットのNERタスクと自動アノテーションのために,第2ハーームとアトリブナ100のデータセットの割合を用いて,ハイブリッドモデルCRF+LGを訓練した。訓練されたモデルで,抽出された1029の論文を自動的に注釈した。一般に,計量値は,70/30Proportionのための分類モデル,特に,Persson(PER)カテゴリに対する最適計量成果が,それぞれ,精度と思い出しに対して,91.11%と95.82%に達することを示した。全体として,モデルは95.86%の精度を示した。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る