-
Notifications
You must be signed in to change notification settings - Fork 850
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
如何使得MiniCPM-Llama3-V-2.5识别图片中是否存在某个图案 #303
Comments
Similar question, does MiniCPM-V support downstream tasks such as referring expression comprehension (REC) |
首先,是否存在识别某一类物体,或者ocr,rec等能力,只能在您的业务领域进行尝试。 |
谢谢回复。 所以,能否指导一下,对于这类问题prompt有没有最佳实践,谢谢。 |
我的建议是可能需要增加一些负样本训练去增加模型的理解,看上面的回复应该是找到了中间的那个警告符号,这个符号也是在140和0之间,只不过颜色搞错了 |
@LDLINGLINGLING 所以我在提问时,要做哪些强化或调整,能否麻烦指导一下,谢谢。 |
其实prompt的话我是没有标准答案的 |
好的,谢谢。 |
是否已有关于该错误的issue或讨论? | Is there an existing issue / discussion for this?
该问题是否在FAQ中有解答? | Is there an existing answer for this in FAQ?
当前行为 | Current Behavior
目前可以通过微调使得MiniCPM-Llama3-V-2.5可以从特定图片中提取需要的文字。
想知道如何通过使得MiniCPM-Llama3-V-2.5能识别出图片中是否存在某个图案,例如,如何判断下面截图车辆仪表板是否存在红框中的图标。
两个问题:
1. 这类识别,是否有建议的prompt;
2. 如何通过微调来帮助MiniCPM-Llama3-V-2.5提升这类问题的识别率,dataset.json的格式是怎样的;
感谢指导!
The text was updated successfully, but these errors were encountered: