如何在文字定位任务对中文实现合适的word embedding #1

guanyamu · 2024-03-20T02:34:00Z

你好，Lee！我正在研究深度学习的中文与另一文种的单词定位问题，希望最终能实现一个QBE和QBS的检索算法，但是另一文种的标签是由英文字母构成的拉丁转写，而现在大多数的中文数据集的标签都是中文，使用phoc等技术只能对英文数字进行编码，我也考虑过使用NLP的embedding技术但不知道如何同时应用于中文和英文，我想请教您是否对该内容有所了解，希望得到您的一些点拨！

secsilm · 2024-03-30T15:10:48Z

现在已经有很多模型可以一起处理包括中英文在内的多种语言，比如经典的 bert，你可以使用他们来得到 embedding 然后fine tuning。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

如何在文字定位任务对中文实现合适的word embedding #1

如何在文字定位任务对中文实现合适的word embedding #1

guanyamu commented Mar 20, 2024

secsilm commented Mar 30, 2024

如何在文字定位任务对中文实现合适的word embedding #1

如何在文字定位任务对中文实现合适的word embedding #1

Comments

guanyamu commented Mar 20, 2024

secsilm commented Mar 30, 2024