embedx 是基于 c++ 开发的大规模 embedding 训练和推理系统,累计支持公司 12 个业务
、 30 多个团队使用
、上线百余次
。
我们在以下推荐、搜索、支付 和 风控等产品落地使用了 embedx: 微信看一看
、微信视频号
、微信搜一搜
、微信支付
、微信安全
、
腾讯新闻
、应用宝
、QQ 音乐
、JOOX 音乐
、腾讯课堂
、领航平台
和 腾讯黑产打击
等 ,并取得了性能和效果双丰收。
更多介绍请参考详细介绍。
EmbedX系统的论文发表在PVLDB'2023, 引用 cite:
@article{10.14778/3611540.3611546,
author = {Zou, Yuanhang and Ding, Zhihao and Shi, Jieming and Guo, Shuting and Su, Chunchen and Zhang, Yafei},
title = {EmbedX: A Versatile, Efficient and Scalable Platform to Embed Both Graphs and High-Dimensional Sparse Data},
year = {2023},
volume = {16},
number = {12},
url = {https://doi.org/10.14778/3611540.3611546},
journal = {Proc. VLDB Endow.},
pages = {3543–3556}
}
-
已经实现的模型
- 十亿级节点、千亿级边的 图模型
- 百亿级样本、百亿特征的 深度排序、召回模型
- 十亿级节点、千亿级边与百亿级样本、百亿特征的 图与深度排序、图与深度召回的联合建模模型