学際大規模情報基盤共同利用・共同研究拠点

採択課題 【詳細】

jh190023-ISH 超巨大ニューラルネットワークのための分散深層学習フレームワークの開発とスケーラビリティの評価
課題代表者 田仲正弘(情報通信研究機構)
Masahiro Tanaka (National Institute of Information and Communications Technology)
概要

本研究は、超巨大ニューラルネットワークのための分散深層学習フレームワークの開発と言語処理分野における深層学習への適用、及びその有効性の検証を行うものである。本課題期間中に、申請者らが開発した自動でモデルパラレルを行うフレームワークRaNNCを拡張し、データパラレル・モデルパラレルのハイブリッドを可能とした。256枚のGPUを用い、BERT-Largeの5倍以上のパラメータを持つ大規模ニューラルネットワークを学習し、より優れた学習性能を得られることを確認した。また、GPU自動割り当てアルゴリズムを大幅に改善し、既存フレームワークではGPUメモリ不足で扱えなかった大規模モデルを学習可能とした。

報告書等 研究紹介ポスター 最終報告書
関連Webページ
無断転載禁止