トップ 一覧 Farm 検索 ヘルプ RSS ログイン

Diary/2017-11-13の変更点

  • 追加された行はこのように表示されます。
  • 削除された行はこのように表示されます。
!論文読み
Twitterで,@ogawa_tterさんに教えてもらったので読んでみた
Evaluating On-Node GPU Interconnects for Deep Learning Workloads
http://www.dcs.warwick.ac.uk/pmbs/pmbs/PMBS/papers/paper1.pdf

NVLinkは速いけどワークロードによっては(ResNetみたいな),
PCIe接続なGPUサーバー(GX8)でも結構いい速度でるよ,という話.
DGX-1の8-GPUのNVLinkでの同期が遅いこと,
メッセージサイズが小さい段階でPCIeが早めにサチること,が鍵なのかな.