学際大規模情報基盤共同利用・共同研究拠点

採択課題 【詳細】

jh180029-NAJ Implementation of parallel sparse solver on CPU-GPU hybrid architecture
課題代表者 鈴木厚(大阪大学)
Atsushi Suzuki (Cybermedia Center, Osaka University)
概要 Dissection直接法ソルバーは有限要素法や有限体積法から得られる大規模疎行列のLU分解を共有メモリー計算機で並列に実行する. 疎行列のグラフ分割と密行列部分のブロック化によってBLASレベル3のDGEMM/DTRSMルーチンを効率的に用いる. また先送り付き軸選択によりブロック化の導入後にもLU分解の精度を保つことができる. このコードをCPU-GPU混合のハードウェアに実装することを目的とする. 軸選択操作をCPUで, BLASレベル3ルーチンをGPUで実行することで高速化を図る.
報告書等 研究紹介ポスター 最終報告書
関連Webページ
無断転載禁止