抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
語幹抽出と見出し語はデータスパース性を低減するための問合せ処理および機械翻訳のための情報検索で広く使用されている二つの重要な自然言語処理技術である。既存StemmerとLemmatizersの大部分は言語専門家の監視を必要とするいくつかの言語依存規則に基づいている。いくつかの確率論的アプローチは,膨大な量の単言語コーパスのを必要とする。語幹抽出と見出し語の両方は,変曲点構造を最小化し,時には共通基盤型に単語の関連構造をderivationally。本論文では,英語,フランス語,タミール語およびヒンディー語のような四つの形態学的に異なる言語のための部分的見出し語とハイブリッド化した教師なし語幹処理を提案した。革新的試みは,単語の品質を利用する新規合成法の語幹認識アルゴリズムの開発を試みていると語幹抽出プロセスのためのLevenshtein距離と最長共通部分列のようないくつかの標準的自然言語処理ツールを用いた。このアプローチは,他のインドと非インド言語を支援することができる。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】