文献
J-GLOBAL ID:201702224621146802   整理番号:17A1570193

TPC:自動生成された包括的英語とペルシャ語の並列コーパス【Powered by NICT】

TPC: An automatically generated comprehensive English-Persian parallel corpus
著者 (2件):
資料名:
巻: 2017  号: ISCBI  ページ: 91-95  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
今日;並列コーパスは,機械翻訳,バイリンガル辞書,言語学などの種々の研究に用いることができる最も重要な資源の一つである。本論文では,テヘラン並列コーパス(TPC)と呼ばれる大規模(約400,000文対)英語-ペルシャ語パラレルコーパスを構築するプロセスについて述べた。研究の目的は,構造を導入し,TPCを構築するための材料を説明した。さらに,プロジェクト内で開発されたいくつかの有用なツールを紹介し,TPCにより訓練された統計的機械翻訳システムの三種類を考察した。高品質並列コーパスを開発するために,MaxEnt分類器による認識不確か整列コーパスから排除されている。固有評価として,1,600文対を無作為に誘発され,ゴールドスタンダードテストセットを用いて手動で比較した。外因性評価として,三フレーズベースSMTシステム,TPCにより訓練される,が組み込まれている。結果は,英語BLEUとTER計量のペルシャGoogleトランスレータシステムへのこの変換器システムの優位性を示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る