-
IDEA
- Shenzhen, China
-
18:49
(UTC +08:00) - wxj630.github.io
Stars
Large-scale Self-supervised Pre-training Across Tasks, Languages, and Modalities
🥇 A curated list of awesome large language models in finance(FinLLMs), including papers,models,datasets and codebases. 金融大模型列表,特别是中英双语大模型。
SwissArmyTransformer is a flexible and powerful library to develop your own Transformer variants.
Real-time video understanding and interaction through text,audio,image and video with large multi-modal model. 利用多模态大模型的实时视频理解和交互框架,通过文本、语音、图像和视频和这是世界进行问答和交流。
StableLM: Stability AI Language Models
沉浸式双语网页翻译扩展 , 支持输入框翻译, 鼠标悬停翻译, PDF, Epub, 字幕文件, TXT 文件翻译 - Immersive Dual Web Page Translation Extension
MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。
采用当前最流行的技术栈 Vben Vue Vue3 Python Django Ninja(Fast Api 和 Django的结合)开发的后端管理系统
A complete set of basic development platform for permission control based on RBAC model, with front-end and back-end separation, and the back-end using django+django-rest-framework, while the front…
EasyNLP: A Comprehensive and Easy-to-use NLP Toolkit
An elegent pytorch implement of transformers
Paradigm shift in natural language processing
《动手学深度学习》:面向中文读者、能运行、可讨论。中英文版被70多个国家的500多所大学用于教学。
Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。
Continue Pretraining T5 on custom dataset based on available pretrained model checkpoints
😎 An up-to-date & curated list of awesome semi-supervised learning papers, methods & resources.
该项目是自己做的一些nlp的实验,包括命名实体识别、实体关系抽取和事件抽取,未来会持续更新。
My GitHub Profile. Before Fork it, Star it, Please. 😂
基于Pytorch的,中文语义相似度匹配模型(ABCNN、Albert、Bert、BIMPM、DecomposableAttention、DistilBert、ESIM、RE2、Roberta、SiaGRU、XlNet)