multilingual-e5_onnx encodeing speed comparison

ノーマルmultilingual-e5-smallと量子最適化された.onnxモデルでの推論の速度比較

https://huggingface.co/intfloat/multilingual-e5-small

https://huggingface.co/intfloat/multilingual-e5-small/blob/main/onnx/model.onnx

.onnxモデルはHFリポジトリ内で提供されているモデルをそのまま使う

Result

multilingual-e5.onnx is x2 faster than normal multilingual-e5.bin @googlecolab/cpu

Benchmark

## Benchmark ##

Trail:0 Done
Trail:1 Done
Trail:2 Done
Trail:3 Done
Trail:4 Done
Trail:5 Done
Trail:6 Done
Trail:7 Done
Trail:8 Done
Trail:9 Done


## Result ##

Trail_Count:10

onnx_time_total	14.439099999999998
onnx_token_total	13279
onnx_speed	920 token/sec


norm_time_total	28.244899999999998
norm_token_total	13279
norm_speed	470 token/sec

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
README.md		README.md
multilingual_e5_onnxruntime.ipynb		multilingual_e5_onnxruntime.ipynb
plot.png		plot.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

multilingual-e5_onnx encodeing speed comparison

Result

Benchmark

About

Releases

Packages

Languages

tkys/multilingual-e5_onnx

Folders and files

Latest commit

History

Repository files navigation

multilingual-e5_onnx encodeing speed comparison

Result

Benchmark

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages