FC2カウンター FPGAの部屋 DMA付きテンプレートを使用したMNISTのCNN4(Cコードの合成、Export RTL)

FPGAやCPLDの話題やFPGA用のツールの話題などです。 マニアックです。 日記も書きます。

FPGAの部屋

FPGAの部屋の有用と思われるコンテンツのまとめサイトを作りました。Xilinx ISEの初心者の方には、FPGAリテラシーおよびチュートリアルのページをお勧めいたします。

DMA付きテンプレートを使用したMNISTのCNN4(Cコードの合成、Export RTL)

DMA付きテンプレートを使用したMNISTのCNN3(C シミュレーション2)”の続き。

前回は、28 x 28 ピクセルの手書き数字の真ん中のエリアの0x80 より大きいピクセル数の数で手書き数字の位置を検出するというテストベンチを土日で書いていたが、失敗した。今回は、位置を検出するのは諦めて、C コードの合成とExport RTL を行った。

C コードの合成を行った。結果を示す。
mnist_conv_nn3_ko_dma_5_180625.png
mnist_conv_nn3_ko_dma_6_180625.png

Estimated は 9.400 ns だった。
Latency は min が 102506 クロックで、max が 102938 クロックだった。max で 100 MHz クロック動作の場合に、約 1.03 ms で実行できる。
リソース使用量は、BRAM_18K で 36 個、DSP48E で 66 個、FF が 6615 個、LUT が 10096 個だった。
DMA を付ける前は、BRAM_18K が 34 個、DSP48E が 62 個、FF が 5284 個、LUT が 9137 個だったので、当たり前だが少しリソース使用量が増えた。

次に、Exprot RTL を行った。なお、Vivado synthesis, place and route にチェックを入れてある。結果を示す。
mnist_conv_nn3_ko_dma_7_180625.png

LUT は 3536 個、FF は 3757 個、DSP は 67 個、BRAM 35 個、SRL 116 個使用している。
DMA を付ける前は、LUT は 2794 個、FF は 3195 個、DSP は 62 個、BRAM 34 個、SRL 73 個使用していたので、結構増えている。

CP achieved post-implementation は 9.757 ns で 10 ns に収まるかどうか不安なところだ。
  1. 2018年06月26日 04:48 |
  2. DNN
  3. | トラックバック:0
  4. | コメント:0

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック URL
http://marsee101.blog19.fc2.com/tb.php/4209-136978f1
この記事にトラックバックする(FC2ブログユーザー)