llama2-7b-chat-mnn
wangzhaode
released this
20 Sep 12:37
·
105 commits
to master
since this release
Llama-2-7b-chat-ms
导出onnx转换得到的int4
量化版本mnn模型。
模型列表:
- tokenizer.txt
- embedding.mnn
- lm.mnn
- block_[0-31].mnn
Llama-2-7b-chat-ms
导出onnx转换得到的int4
量化版本mnn模型。
模型列表: