学際大規模情報基盤共同利用・共同研究拠点

採択課題 【詳細】

jh190023-ISH 超巨大ニューラルネットワークのための分散深層学習フレームワークの開発とスケーラビリティの評価
課題代表者 田仲正弘(情報通信研究機構)
Masahiro Tanaka (National Institute of Information and Communications Technology)
概要

本研究は、超巨大ニューラルネットワークのための分散深層学習フレームワークの開発と言語処理分野における深層学習への適用、及びその有効性の検証を行うものである。本課題期間中に、申請者らが開発した自動でモデルパラレルを行うフレームワークRaNNCを拡張し、データパラレル・モデルパラレルのハイブリッドを可能とした。256枚のGPUを用い、BERT-Largeの5倍以上のパラメータを持つ大規模ニューラルネットワークを学習し、より優れた学習性能を得られることを確認した。また、GPU自動割り当てアルゴリズムを大幅に改善し、既存フレームワークではGPUメモリ不足で扱えなかった大規模モデルを学習可能とした。

関連Webページ
報告書等 研究紹介ポスター 最終報告書
業績一覧 (1) 学術論文 (査読あり)
該当なし
(2) 国際会議プロシーディングス (査読あり)
該当なし
(3) 国際会議発表(査読なし)
該当なし
(4) 国内会議発表(査読なし)
該当なし
(5) 公開したライブラリなど
該当なし
(6) その他(特許,プレスリリース,著書等)
該当なし
無断転載禁止