Using the GPGPU for Large-Scale Mining Software Repositories Studies - An Experience Report of Calculating Process Metrics -

Bibliographic Information

Other Title
  • GPGPUを用いたリポジトリマイニングの高速化手法 ― プロセスメトリクスの算出への適用 ―

Description

リポジトリマイニング分野は,版管理システムやバグ管理システム等のリポジトリに保管されているデータを統合・分析し,ソフトウェア開発者に有用な情報を提供する分野である.リポジトリのデータサイズは大きくなり続けていることから,リポジトリマイニングのスケールアップは本研究分野の主な課題の 1 つである.近年では,スーパーコンピュータやクラウドコンピューティングのような従来手法が用いられているが,スーパーコンピュータの導入は高価であり,クラウドコンピューティングの導入は設定や調整に手間がかかるという問題が存在する.本論文では,既存のビデオカードを用いることで導入可能な GPGPU(General-Purpose computing on Graphics Processing Units) を用いたリポジトリマイニングのスケールアップを提案する.GPGPU を用いることにより,Eclipse プロジェクトのバージョン履歴上における代表的なリポジトリマイニングのケーススタディにおいて,CPU のみを用いた手法に比べ 43.9 倍高速化することができた.

Scalable analysis is an important issue in the Mining Software Repositories (MSR) field, which aims to integrate and analyze data stored in large software repositories such as source control repositories and bug repositories. Recently, researchers have experimented with conventional techniques like a super-computer or cloud computing, but these are either too expensive or too hard to configure. The goal of this paper is to improve the scaling of MSR analysis techniques by using general-purpose computing on graphics processing units (GPGPU) on off-the-shelf video cards. Through a representative MSR case study (i.e., measuring co-change factors) on version history from the Eclipse project, we find that the GPGPU approach is up to a factor of 43.9 faster than a CPU-only approach.

Journal

Details 詳細情報について

Report a problem

Back to top