プレプリント
J-GLOBAL ID:202202205273384222   整理番号:22P0306282

Dim Wichl Gat Tun:劣文書言語のためのNLPにおける言語専門知識の事例【JST・京大機械翻訳】

Dim Wihl Gat Tun: The Case for Linguistic Expertise in NLP for Underdocumented Languages
著者 (7件):
資料名:
発行年: 2022年03月17日  プレプリントサーバーでの情報更新日: 2022年03月17日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
NLPの最近の進歩は,大規模なデータセットをレバーする事前訓練モデルによって駆動され,世界の政治的および経済的スーパーパワーを主に利益にしている。技術的に保存された言語は,そのような資源を欠いているので残されている。しかし,保存言語の冗長性は,言語文書化努力から,線形の光沢のあるテキスト(IGT)の形で利用可能なデータソースを持っている。IGTは,おそらくそのアノテーションが半構造化であり,しばしば言語特異的であるため,NLP作業で未利用のままである。本論文では,IGTデータが,目標言語専門知識が利用可能であるならば,うまく活用できるケースを,うまく活用できる。著者らは,特に,文書のリンガリストとの協力を提言する。本論文では,IGTデータを用いた成功プロジェクトのためのロードマップを提供した。(1)どのNLPタスクが与えられたIGTデータで達成できるか,そして,これらが音声コミュニティにいかに利益を与えるかを定義することは必須である。(2)データをNLPで一般的に使用される構造化フォーマットに変換するとき,大きなケアとターゲット言語専門知識が必要である。(3)タスク特異的およびユーザ特異的評価は,作成されるツールが目標言語音声コミュニティに利益をつけることを助けることができる。著者らは,Tsimachian言語Gitksanのための形態学的再反射系の開発に関する事例研究を通して各段階を説明した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  自然語処理 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る