抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
大規模言語モデル(以下LLM)は,様々なタスクにおいて高い性能を示しており,ソフトウェア開発においてもコード自動生成への応用が期待されている.近年の研究では,高品質なコードを生成するためのプロンプト設計に注目が集まっているが,異なる自然言語がコード生成に与える影響についてはほとんど知られていない.異なる自然言語間で生成されるコードの品質に差がある場合,母国語の違いによる不利益など社会的バイアスの要因になる可能性がある.本研究では,3つの異なる自然言語(英語,日本語,中国語),それぞれの言語話者がどのLLMを使用することで自動生成するコードの品質を高めることができるかを明らかにし,さらに異なる自然言語間で生成されるコードに差があるかを明らかにするために,LLMによるコード生成に与える影響を実証的研究によって調査した.評価には,プログラミングコンテストAtCoderの難易度A,B,C,Dに分類された756問,およびLeetCodeの難易度easy,medium,hardに分類された33問を使用し,生成されたコードが問題に回答できたAccuracyによってコード品質を評価した.その結果,使用するLLMによる差異は,データセットの違いに左右されることが示された.また.異なる言語間にもデータセットに依存する差異があることが示された.本研究は,異なる自然言語を使用するプログラミング学習者が,コード生成においてどのような影響を受けるかを明らかにする初期調査であり,さらにプログラミング技術の学習指針を示すものである.(著者抄録)