

  • Design and Power Performance Evaluation of On-chip Memory Processor with Arithmetic Accelerators
  • エンザン カソク キコウ オ モツ オンチップメモリプロセッサ ノ ケントウ ト デンリョク セイノウ ヒョウカ



本稿では電力性能の向上に有効であるオンチップメモリプロセッサアーキテクチャSCIMAに,電力コストに有利な演算加速機構を導入することとし,その構成を検討し電力性能を評価する.演算加速機構としてベクトル型およびSIMD型の2種の方式を提案し,シミュレーションにより評価を行った結果,行列積演算および実アプリケーションであるQCD kernelにおいてはレジスタの要素数の差などの要因によりベクトル型がSIMD型の電力性能を上回り,全体としては主記憶バンド幅律速とならなければ,倍精度浮動小数点積和演算器(以降,FMA)の多いベクトル型がつねに優位であった.電力効率はベクトル型16FMAのときに最大となり,8コア時の電力効率は約1.58GFLOPS/Wを示し,従来のプロセッサよりも高い電力効率を示すことが分かった.

In this paper, we design an on-chip memory processor with arithmetic accelerators, which is expected to be effective to improve power consumption. In addition, we evaluate power performance of the processor. We propose vectortype arithmetic accelerators and SIMD-type arithmetic accelerators into onchip memory processor. The results of evaluation on our simulator indicate that the 4FMAs (Fused Multiply-Adders) Vector-type accelerator's performance exceeds the 4FMAs SIMD-type accelerator's on matrix multiplication and QCD kernel because of difference of the elements size of registers and so forth. The 16FMAs vector-type has advantage on almost all simulations excluding main memory bandwidth intensive benchmarks. Power effectivity is the maximum by vector-type 16FMAs, which indicates about 1.58GFLOPS/W in 8 cores. It shows that the proposed architecture has advantage in power efficiency compared with existing processors.


詳細情報 詳細情報について

