プレプリント
J-GLOBAL ID:202202207510915540   整理番号:22P0330056

イディオミフィケーション-非ネイティブ学習者のためのWord2Vecによる英語Idiomsの選点補足逆辞書の構築【JST・京大機械翻訳】

Idiomify -- Building a Collocation-supplemented Reverse Dictionary of English Idioms with Word2Vec for non-native learners
著者 (1件):
資料名:
発行年: 2022年04月12日  プレプリントサーバーでの情報更新日: 2022年04月12日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
イディオマイゼーションの目的は,英語の非ネイティブ学習者のためのイディオームの選点補足逆辞書を構築することである。逆辞書は,非ネイティブが需要に関するイディオムを探索するのを助けることができるので,選点も,より適切にイディオームを用いてそれらを誘導できる。プロジェクトのコーナーストーンは,コーパスからイディオームをマイニングする信頼できる方法であり,しかし,イディオームが形式で広範囲に変化するので,挑戦である。著者らは,そのベース形式からマッチング規則を自動的に導出することによってこれに取り組んだ。ポイントワイズ相互情報(PMI),Term周波数逆文書周波数(TF-IDF)を,それらの両方がペアワイズ有意性のためのポピュラーなメトリックであるために,モデルコロケーションに使った。また,ベースラインモデルとしてTerm周波数(TF)を試みた。逆辞書を実行するため,3つのアプローチ,即ち逆指数,グラフ,および分布意味論を取り入れることができた。最後のアプローチを採用し,Word2Vecによる逆辞書を実装し,それは,すべてのおよびWord2Vecの最も柔軟なアプローチであり,単純だが強いベースラインである。方法の評価により,改善の余地が明らかになった。著者らは,スロップ,野生カードおよび再順序付け技術の助けを借りて,イディオームをよりよく同定できると学習する。また,著者らは,スイートスポットを見つけるために機械学習を使用するならば,PMIとTF-IDFの両方の最良を得ることができることを学習した。最後に,著者らは,逆指数と分布意味論アプローチの混合物で,Idiomifyがさらに改善されることを学習した。制限側,提案方法は実現可能であり,非ネイティブへのそれらの利益は明らかであり,従って,英語イディオムを取得する際に非ネイティブを援助するために使用することができる。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
CAI  ,  情報加工一般 
タイトルに関連する用語 (6件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る