粗粒度分割を用いた並列マージ処理の高速化

DOI

書誌事項

タイトル別名
  • A Fast Parallel Merge Algorithm Based on Coarse-Grained Decomposition

抄録

本論文では,CUDAデバイス上で行われる,2列のソート済みデータ列を対象とするマージ処理の高速化を行った.本論文で提案する手法は,マージ処理を分割する際の粒度を粗くすることで,分割に要する処理時間を低減し,グローバルメモリのバンド幅を最大限活用できる.これにより,大規模な入力に対しては限界に近い性能をもつことを示せた.また,提案手法は実験に用いた全ての入力に対して既存のマージアルゴリズムよりも高い性能を発揮し,更に,メモリ領域の確保を不要とすることにより,要素数の小さなマージに関しても,性能の劣化が少ないアルゴリズムであることを示した.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1390294905209634944
  • DOI
    10.14923/transinfj.2022jdp7019
  • ISSN
    18810225
    18804535
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • KAKEN
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ