Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于是否可以做分类任务 #19

Open
easonchan2023 opened this issue Dec 30, 2023 · 6 comments
Open

关于是否可以做分类任务 #19

easonchan2023 opened this issue Dec 30, 2023 · 6 comments

Comments

@easonchan2023
Copy link

您好,感谢您的工作,作为一个深度学习新手,我有一些问题:

1.文本特征是如何提取的呢,能否简单解释一下?

2.我可以将图像特征与文本特征融合做多模态分类任务吗?

3.能标明提取图像特征和文本特征的代码段吗,非常感谢!

感谢回答!

@shenyunhang
Copy link
Owner

  1. Please refer to 文本特征提取 #15.
  2. 可以的。
  3. 图像特征提取在这里。文本特征提取参考文本特征提取 #15

@easonchan2023
Copy link
Author

感谢回复!还有几个问题,

请问对于文本特征的编码提取在本文中是只使用了clip和openclip吗?

因为我看到代码里使用了llama2这样的大语言模型,请问实验中您使用过吗?

大语言模型几乎都是decoder-only,我不确定是否能作为特征编码器,您是怎么使用的呢?

非常期待您的回答,打扰您了!!!!

@shenyunhang
Copy link
Owner

试过不同的文本编码器,包括bert、T5和llama,论文中的结果在ablation study那部分。
对于decoder-only的模型,我们直接用最后一层隐藏层输出作为文本特征。

@easonchan2023
Copy link
Author

非常感谢!!!

@easonchan2023
Copy link
Author

目前我用大语言模型提取了文本嵌入,维度是4096,因为我对其降维之后分类效果很差,所以想请教一下对于这种高维特征您是如何做的呢?感谢!

@shenyunhang
Copy link
Owner

目前没有对嵌入的维度进行过降维的尝试,只有对嵌入的长度做平均。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants