!RISC-V(3) UARTでプログラムとデータを流し込んで実行できるようなメタ機能を追加. これでリソース使用量とは配線遅延とかをきっちり見積れるようになったかな. ついでに,RV32Iに必要な演算を幾つか実装. 次は,シフタ/掛け算/割り算あたりの実装をしよう. !一言メモ * 読んだ - SLIDE : IN DEFENSE OF SMART ALGORITHMS OVER HARDWARE ACCELERATION FOR LARGE-SCALE DEEP LEARNING SYSTEMS ** 全結合なDNNに対して,LSH使って考慮すべきニューロンを選んで計算量減らすよ,という話,なのか? ** C++による実装.44コアでV100の3.5倍,TFの16倍高速,ということらしい.