文献
J-GLOBAL ID:202202270150695391   整理番号:22A0446637

インドネシア語句抽出に向けて:フレームワークとコーパス【JST・京大機械翻訳】

Towards Indonesian Phrase Extraction: Framework and Corpus
著者 (8件):
資料名:
巻: 1496  ページ: 25-37  発行年: 2022年 
JST資料番号: W5071A  ISSN: 1865-0929  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マイニング品質フレーズは自然言語処理の基本的タスクの1つである。現在の研究は,主に普遍的な言語に焦点を合わせるが,インドネシアのような低資源言語に対してはほとんど実行されていない。著者らの知る限り,インドネシアにおけるフレーズ抽出タスクに利用できる評価データセットはない。プラーゼ抽出は,言語分析ツールと大規模データセットの欠如のためインドネシアの挑戦的なタスクである。そこで,高品質資源としてWikipediaを用いてインドネシア語句抽出コーパスを構築するフレームワークを提案し,POSタグ付きコーパスを用いて抽出したフレーズをマッチさせた。この言語専門家は抽出したPOSパターンを手動で分類した。注釈付きパターンを用いて,フレーズを再抽出し,全部で8379のインドネシア語句を持つコーパスを構築した。さらに,3つの深層学習モデルにより,フレーズ抽出のための優れた性能を達成し,インドネシア語句抽出タスクのためのベースラインを完成させた。Copyright Springer Nature Singapore Pte Ltd. 2022 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  情報加工一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る