抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
手動検査のコストを緩和することができる自動コードレビュー(ACR)は,ソフトウェア工学における不可欠で必須のタスクである。ACRを扱うために,既存の研究は抽象構文ツリー(AST)をシリアル化する。しかし,配列符号化アプローチによる全ASTのセンスは,主に,ASTにおけるいくつかの冗長ノードがノード情報の伝送を妨げるため,困難なタスクである。逐次表現はASTにおける木構造の情報を把握するには不適切である。本論文では,まず,このタスクにおいて公的に利用可能なデータセットがないので,ACRタスクのための新しい大規模Apache自動コードレビュー(AACR)データセットを提示した。このデータセットの放出は,この分野における研究を進めるであろう。それに基づいて,ACRタスクを処理するために,新しい単純化ASTベースグラフ畳込みネットワーク(SimAST-GCN)を提案した。具体的には,ノード情報普及の効率を改善するために,まず接続属性を含まない冗長ノードを削除し,従って単純化ASTを導出することにより,コードのASTを単純化する。次に,ツリー構造の符号断片間の関係をグラフに適切に具体化するために,単純化ASTに基づく各符号に対する関係グラフを構築した。続いて,グラフ構造の利点の観点から,符号表現を導くための符号断片の重大な意味を利用するための注意機構に従うグラフ畳込みネットワークアーキテクチャを検討した。最後に,オリジナルと改訂されたコードの間の表現における単純だが効果的な減算操作を利用して,ACRの結果を決定するために,改訂された差異を優先的に学習できる。AACRデータセットに関する実験結果は,提案モデルが最先端の方法より優れていることを示した。【JST・京大機械翻訳】