トップ 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

Diary/2019-2-2

FPGAX

Google@六本木にて.
https://fpgax.connpass.com/event/115446/

FPGAXメモ


「TPUの最近の話」Google 佐藤さん

「AIチップ最新レビュー」北海道大学 百瀬啓さん

  • ニューロモフィックな商用チップもある
  • 写真 penneの~/Pictures/fpgax_20190202に
    • ニューロチップの世界の動向 - IMG_20190202_131619613.png
    • (Server) - Scaling Trend - IMG_20190202_132028592.png
    • DaDianNao: 中国CAS 学習/推論用 2014年 - IMG_20190202_132138781.png
    • 量子化・圧縮の適用 - IMG_20190202_132429613.png
    • (edge) - Quantization Trend - IMG_20190202_132843358.png
    • 量子化: CNN+RNN・(DNPU) ISSCC '17/14.2 KAIST D.Shin - IMG_20190202_133013971.png
    • Log量子化/ビットシリアル ... QUEST '18 北大 - IMG_20190202_133250029.png
    • (edge) in-memory processing - IMG_20190202_133538324.png
    • BRein Memory : Binary/Ternary in-memory ('17/6月) - IMG_20190202_133712446.png
    • BWN/TWN/BNN(精華大) '18 VLSIC - IMG_20190202_133831586.png
    • Mixed Signal Binary CNN (プリンストン大 '18 VLSIC) - IMG_20190202_134035448.png
    • ReRAM(RAND) パナソニク VLSI Tech. 2018, 16-4 - IMG_20190202_134149363.png
    • 8bit Analog Chip with P-PCM (IBM) '18 IEDM - IMG_20190202_134452078.png
    • エネルギー効率改善 (量子化と低電力回路技術) - IMG_20190202_134945142.png
    • Technology Trend - IMG_20190202_135046754.png

「 LUT-Network 〜本物のリアルタイムコンピューティングを目指して〜」 渕上竜司さん

「(仮)DNNコンパイラの歩みと最近の動向」ぼのたけ/NII 今井健男さん

「RISC-V の現況と Esperanto Technologies のアプローチ」京都産業大学 情報理工学部 安田豊さん

「HBM-FPGA をさわってみた」長瀬産業 西沢正登さん
  • Q: 自然言語のベクトルとかに使えるといいのでは? by 佐藤さん

「Deep Learning推論を高速化するソフトウェア技術」Idein 中村晃一さん

「TensorFlow XLA:XLAとは、から、最近の利用事例について」@vengineer(ソースコード解析職人)さん

「MN-Coreについて」PFN 金子紘也さん
  • PFNとしてはTrainingの需要が大きい
  • Trainingにおける演算
    • 誤差逆伝搬.途中の値も覚えておかないとダメ.
    • 大きなGEMMとして書き下せる.学習時は基本,密行列.
    • V100のピーク性能向上はfp16 GEMM専用エンジン(Tenssor Core)
    • 図の参考は http://cs231n.stanford.edu/
  • データ並列による分散学習
    • バッチサイズ増やして → GPUにばらまいて → All-reduce
    • 単純にバッチサイズ増やすと精度劣化.テクニックが必要.
  • MN-1a = Tesla P100 1024, MN-1b = Tesla V100 512.インフィニバンド接続.
  • Deep Learningの研究動向
    • SoTAではモデルサイズは増える
      • 画像から動画/立体,巨大化
      • - 時間方向/空間方向へのConv.HD
      • MoE(Mixture of Experts)
      • NAS(Netwrok Architecture Search)
      • - ネットワークアーキテクチャ自体を自動探索する試み
  • MN-Core - 深層学習用プロセッサ
    • 階層メモリ型SIMDアーキテクチャ.512MABを1chipに集積(MAB -> L1B -> L2B -> Chip)
      • 倍/単/半精度演算はロジックは共有している.命令で切り替え.
      • 1 TFLOPS/W(半精度),500W
    • 空冷
    • 2020年に運用予定
  • 計算能力は競争力の源泉
  • HWをささえるSW

「私のMNISTのFPSは530000です。ですがもちろんフルパワーで(以下略」 なかはらさん


あとでよむ