tiny-dnn を FPGA で加速する

tiny-dnn の各レイヤを Zynq の PL 部に作ったアクセラレータ回路にオフロードすることで、CNN の学習を加速します。

以前はここで開発していました。履歴の見たい方はぜひ。
IP の機能以外 (DMA とか petalinux とか) を参考にしたい方はこっちのほうがわかりやすいと思います。

構成概要

畳み込みの行列乗算を 16MAC (bfloat16) で並列に計算して学習を加速します。
AXI Stream で 1サンプル分のデータを受け取り、core で畳み込み計算をして、AXI Stream で 1サンプル分の結果を吐き出します。
im2col は on the fly で実行するので、転送データとバッファメモリを節約できます。
詳しくは

実装例1: シンプル畳み込みニューラルネット

実装は examples/simple-conv です。課題は MNIST。

このくらい高速になります。
ただし、次の変更をソフトウェアに入れています。

入力データの傾きを求める計算をスキップする
畳み込みレイヤで ΔW をミニバッチ分だけ累積する (FPGA(wPL)のみ)

使っている NN モデル

実装例2: Separable 畳み込みニューラルネット

実装は examples/DW-conv で作成中です。課題は MNIST。
普通の convolution と pooling レイヤをアクセラレータ対応済みです。
DW-conv レイヤーは順方向と逆方向がアクセラレータ対応済みです。

使っている NN モデル

真ん中の2個の conv3x3 は Depthwise Separable Convolution です。

Name		Name	Last commit message	Last commit date
Latest commit History 1,026 Commits
.travis		.travis
U96		U96
Zturn		Zturn
benchmarks		benchmarks
cereal		cereal
cmake		cmake
data		data
docker/dev-env		docker/dev-env
docs		docs
examples		examples
scripts		scripts
src		src
src_c		src_c
src_fp		src_fp
src_fpga		src_fpga
test		test
third_party		third_party
tiny_dnn		tiny_dnn
vc/vc14		vc/vc14
.clang-format		.clang-format
.gitattributes		.gitattributes
.travis.yml		.travis.yml
AUTHORS		AUTHORS
CMakeLists.txt		CMakeLists.txt
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
README_ORIGINAL.md		README_ORIGINAL.md
appveyor.yml		appveyor.yml
core.svg		core.svg
dev-env.sh		dev-env.sh
function.md		function.md
top.svg		top.svg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

tiny-dnn を FPGA で加速する

構成概要

実装例1: シンプル畳み込みニューラルネット

使っている NN モデル

実装例2: Separable 畳み込みニューラルネット

使っている NN モデル

About

Releases

Packages

Contributors 71

Languages

License

tom01h/tiny-dnn-fpga

Folders and files

Latest commit

History

Repository files navigation

tiny-dnn を FPGA で加速する

構成概要

実装例1: シンプル畳み込みニューラルネット

使っている NN モデル

実装例2: Separable 畳み込みニューラルネット

使っている NN モデル

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 71

Languages

Packages