文献
J-GLOBAL ID:202202265385099571   整理番号:22A0931197

Roman-Urdu-Parl:Urdu言語理解のためのRoman-UrduとUrdu並列コーパス【JST・京大機械翻訳】

Roman-Urdu-Parl: Roman-Urdu and Urdu Parallel Corpus for Urdu Language Understanding
著者 (2件):
資料名:
巻: 21  号:ページ: 1-20  発行年: 2022年 
JST資料番号: W5688A  ISSN: 2375-4699  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
コーパスのアベイラビリティは,特定の言語における研究を行うための基本的要件である。残念なことに,Urduのような形態学的に豊富な言語では,世界中の100百万人以上の人々が使用しているにもかかわらず,コーパスの大地は,研究の注目と進歩の欠如の主な理由である。この目的のために,著者らは,6.37百万の文章対を有する,初めての大規模公開利用可能なRoman-Urdu並列コーパス,Roman-Urdu-Parlを提示した。それは,クラウドソーシング技術を用いて注釈付けされた多様な情報源から収集された巨大なコーパスであり,また,品質のために保証される。それは,合計92.76百万Roman-Urdu単語,92.85百万Urdu単語,42.9K単語のRoman-Urdu語彙,および43.8K単語のUrdu語彙を有した。Roman-Urdu-Parlは,言語の形態学的および言語学的特徴を捉えるだけでなく,人口統計的条件に起因する不均一性および変動を捉えるために構築されてきた。2つの自然言語処理研究問題,すなわち,学習単語埋込みと機械変換システムの構築に取組むために,著者らのコーパスの信頼度と品質を検証した。コーパスの著者らの貢献は,両方の設定において例外的な結果をもたらし,例えば,著者らの機械変換システムは,84.67のバイリンガル評価(BLEU)スコアで,新しい最先端技術をセットした。著者らは,Roman-Urdu-Parlが,Urdu言語に関連した多くの研究分野で,点火と進捗のための燃料として役立つと信じる。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る