-
Notifications
You must be signed in to change notification settings - Fork 10
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
推理速度问题 #8
Comments
1)在TensorRT engine生成完成后,总时间包括预处理+推理+后处理超过100ms都不正常,具体时间忘了,待我整理一下补充下文档; |
我重新检查了下,是我之前用kFP16的方式来生成推理模型,所以速度慢了。现在换回kFP32,但速度依然在42ms,速度还是偏慢 |
您好,模型部署这块,有什么资料可以学习吗? |
1)你这个速度统计时的时间包括预处理、推理和后处理吗?更刁钻一点的话,还包括GPU初始化的时间吗? |
|
您好,我这边重新测试了一下:
程序预测整体结果正确(和Rangnet_lib相同),但速度缓慢,一帧的推理要183ms+. |
1)关于不同优化参数16和32,在高版本TRT效果不一样的问题:如果是这个的话,本仓库是解决了这个问题。 |
1)ok,感谢您的测试。经我这边的复现(3060显卡,TRT8.4和TRT8.2的均进行了测试)和根据您这边的结果,暂时得出如下结论8.4版本并不适用于当前仓库。暂时通过测试为最高TRT版本为8.2.5.1。(通过测试即:16和32的结果定性上差别不大) |
OK,这边是使用3060,测试下来运行速度是在10ms左右对吗? |
如果你想总时间低于10ms,感觉你要换一种实现了,再怎么优化他这个实现应该不会低于10ms。 TIME: preprocess_time: 1.37318 ms. |
看样子上4090,应该有能达到这方面的希望了。另一个问题是,关于这个精度问题,你之前是怎么debug和解决的,能介绍下思路吗? |
OK,期待你的反馈 |
1)解决用 TensorRT 8.4 优化后的 engine 预测结果异常的问题 |
多谢你的帮助!经过测试,现在的推理速度可以达到20ms左右,基本上满足了实时的需求。 |
OK,欢迎交流~ |
您好,感谢您的工作。最近我在我电脑上测试这个工程(RTX3000+128G内存)。我看README.md中表示,速度应该在6ms左右,但我电脑上测试single_shot_demo结果是500ms。想问下这个速度正常吗?
The text was updated successfully, but these errors were encountered: