プレプリント
J-GLOBAL ID:202202201763374572   整理番号:22P0185014

日本語構成スコアリングと書字支援システム設計の機械学習アプローチ【JST・京大機械翻訳】

Machine learning approach of Japanese composition scoring and writing aided system's design
著者 (1件):
資料名:
発行年: 2020年08月26日  プレプリントサーバーでの情報更新日: 2020年08月26日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自動スコアリングシステムは任意の言語に対して極めて複雑である。自然言語自体は複雑なモデルである。自然言語によって生成された論文を評価するとき,著者らは単語特徴,文学特徴,意味特徴,テキスト構造その他のような多くの次元から論文を見る必要がある。異なる人々が,同じ論文について異なる意見を持つので,人間は時々,組成を正確に等級付けできない。しかし,組成スコアリングシステムは言語学習者を大いに支援できる。それは,言語リーナが,出力一覧のプロセスで自分自身を改良できる。機械が意味的および実用的レベルで組成を直接評価するのは難しいが,特に,高文脈文化における日本語,中国語および他の言語において,機械は,単語および文法レベルの通過を評価でき,それは,構成率または言語学習者の支援として,それを評価できる。特に,外国語学習者にとって,語彙と構文内容は,通常,彼らがより多くの関心を持っている。実験では,以下の作業を行った。1)単語セグメンテーションツールと辞書を用いて,論文の単語セグメンテーションを達成し,単語特徴を抽出し,論文の単語の複雑度特徴を生成する。そして,Bow技術を用いてテーマ特徴を抽出した。2)Turing-完全オートマトンモデルを設計し,JLPT検査に現れる文法に対して300+オートマトンを作成した。そして,これらのオートマトンを用いて文法の特徴を抽出する。3)構成の指定テーマをスコアリングするための統計的手法を提案し,最終スコアはシステムに提出されたすべての書き込みに依存する。4)言語学習者に対する文法ヒント関数を設計し,現在,どの文法が利用できるかを知ることができる。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理  ,  人工知能 

前のページに戻る