プロジェクト全体の抽象構文木構築によるファイル間の移動コード検出

藤本 章良
肥後 芳樹
松本 淳之介
楠本 真二

誌名
電子情報通信学会論文誌 D      No.4    pp.242-254
発行日: 2021/04/01
早期公開日: 2020/12/02
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2020PDP0027
論文種別: 特集論文 (学生論文特集)
専門分野: ソフトウェアシステム
キーワード: 
差分,  GumTree,  抽象構文木,  

本文: PDF(4MB)>>
論文を購入



あらまし: 
ソフトウェア開発において,開発者がソースコードの差分を理解することは重要である.差分を検出するツールとしてGumTree がある.GumTree は変更前後のソースファイルを入力として受け取ると抽象構文木を生成し,削除・挿入・移動・更新といった操作を抽象構文木のノード単位で検出する.しかし,GumTree は単一ファイルの差分しか検出できないため,ファイルを横断するソースコードの移動を検出できない.本研究では,GumTree を拡張しファイルを横断するソースコードの移動を検出する手法を提案する.提案手法では,プロジェクトに含まれる全てのソースファイルから一つの大きな抽象構文木を構築し,検出精度向上のために抽象構文木に対して2段階のマッチングを行う.8個のオープンソースソフトウェアに対して提案手法を用いて実験を行った結果,88,848個のコミットの中から合計で89,418個のファイルを横断する移動を検出でき,ファイルを横断するソースコードの移動やファイル名に幾つかの特徴が得られた.また既存ツールと比較を行った結果,既存ツールを上回る数の移動を検出した.