プレプリント
J-GLOBAL ID:202202215551798497   整理番号:22P0281946

計算ノートブックに関する類似性探索【JST・京大機械翻訳】

Similarity Search on Computational Notebooks
著者 (4件):
資料名:
発行年: 2022年01月30日  プレプリントサーバーでの情報更新日: 2022年01月30日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
データ科学タスクには,Jupyterノートブックのような計算ノートブックソフトウェアが一般的である。多数の計算ノートブックは,Webと再利用に利用可能である。しかし,計算機ノートブックを手動で探索することは, tedious雑なタスクであり,これまで,計算ノートブックを効果的かつ効率的に探索するツールはない。本論文では,計算ノートブックに関する類似性探索を提案し,類似性探索のための新しいフレームワークを開発した。質問として計算ノートブックにおけるコンテンツ(即ち,ソースコード,表データ,ライブラリ,および出力フォーマット)を与えて,類似性探索問題は,最も類似したコンテンツを有するトップk計算ノートブックを見つけることを目的とする。2つの類似性尺度を定義した。セットベースとグラフベースの類似性。集合ベース類似性は各コンテンツを独立に取り扱うが,グラフベース類似性はコンテンツ間の関係を捉える。このフレームワークは,トップk結果にならない計算ノートブックの候補を効果的に刈り込むことができる。さらに,探索を加速するためのキャッシングとインデクシングのような最適化技術を開発した。Kaggleノートブックを用いた実験は,著者らの方法,特にグラフベースの類似性が高精度と高効率を達成できることを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
表示機器  ,  人間機械系 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る