文献
J-GLOBAL ID:201702215214883779   整理番号:17A0896203

“gnparser”:パーシング表現文法に基づく科学的用語の強力パーサ

“gnparser”: a powerful parser for scientific names based on Parsing Expression Grammar
著者 (3件):
資料名:
巻: 18  号: May  ページ: 18:279 (WEB ONLY)  発行年: 2017年05月 
JST資料番号: U7025A  ISSN: 1471-2105  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
背景:生物学における科学的用語はユニバーサルリンクとして機能する。それらは生物に関する情報の全体的な交差参照を可能とする。しかし,科学的用語の綴りにおける変動はデータを相互結合させるそれらの能力を大きく低下させる。そのような変動は省略とアノテーションと誤綴りなどを含む。原作者は科学的用語の一部であり,有意に異なるかもしれない。用語の可能な全ての変動を整合させるため,それらの要素に分割し,その役割に基づいて各要素を分類する必要がある。これを本研究では名前の「パーシング」と呼ぶ。パーシングは名前の要素を安定であるものと変化し易いものに分類する。用語を,最初にそれらの安定要素に基づいて組み合わせることで整合させる。そして,整合をそれらの変動性要素の解析により精緻化する。この二段階プロセスは整合の数と質を劇的に改善する。それは生物学における「ビッグデータ」の状況における自動データ交換に特に有用である。結果:グローバルネームパーサー(gnparser)を開発した。これは科学的用語をパーシングするためにScala言語(Java仮想マシン用言語)で書かれたJavaツールであり,パーシング表現文法に基づいている。同パーサは全ての複雑性の科学的用語に応用可能である。これは用語の全ての要素に意味論的意味(属名,種の小名,出版年,原作者,アノテーションなど)を割りつける。ハイブリッドの名前において,入れ子化構造でも作業可能である。gnparserは約99%精度で機能し,3千万の用語ストリング/時間/CPUスレッドを処理する。gnparserライブラリはScala,Java,R,JythonおよびJRubyと互換性がある。同パーサはコマンドラインアプリケーションとして,socketサーバとウエッブappまたはRESTful HTTPサービスとして使用可能である。オープンソースMITライセンス下でリリースされている。結論:gnparserは,多数の科学的用語を用いて作業する生物多様性情報研究者および生物学者の迅速で高精度のツールである。これは高価で,誤りが起きやすい手動パーシングと置き換え可能であり,多くの状況での科学的用語を標準化し,分布生物学的情報の説明性を迅速に増強することができる。(翻訳著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
生物科学研究法一般  ,  分子・遺伝情報処理 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る