Skip to content

A simple and trans-platform rag framework and tutorial

Notifications You must be signed in to change notification settings

datawhalechina/wow-rag

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 

Repository files navigation

wow-rag

RAG(Retrieval Augmented Generation)是一种结合了检索和生成的AI技术框架。它通过从知识库中检索相关信息来增强大语言模型的生成能力,可以帮助模型生成更准确、更可靠的回答。本项目旨在探索和实现RAG技术,包括文档处理、向量检索、prompt engineering等核心模块,帮助开发者更好地理解和应用RAG技术。

项目内容

  • 第1课:手搓一个土得掉渣的RAG
  • 第2课:正式上路搞定模型
  • 第3课:初步体验问答引擎
  • 第4课:最脏最累的文档管理
  • 第5课:流式部署

项目附属文件

  • base.py 可以用来替换Lib\site-packages\llama_index\embeddings\openai\base.py这个文件。其实就是修改了四行代码。懒人专用。我们不要做一个懒人,而是动动手自己照着教程找到源代码的文件修改指定的四行即可。希望你永远不要用到这个文件。
  • 本项目的前端页面chat.html,直接双击打开。在文本框中输入问题,然后点击发送按钮即可体验流式对话。
  • 问答手册.txt 本项目第一课的那些文本。懒人专用。我们不要做一个懒人,而是动动手自己找篇长文本新建一个txt文件。希望你永远不要用到这个文件。
  • learn.ipynb 本项目的所有运行代码。懒人专用。我们不要做一个懒人,而是动动手把本教程所有代码自己复制到空白ipynb文件中亲自运行。希望你永远不要用到这个文件。

参与贡献

  • 如果你想参与到项目中来欢迎查看项目的 Issue 查看没有被分配的任务。
  • 如果你发现了一些问题,欢迎在 Issue 中进行反馈🐛。
  • 如果你对本项目感兴趣想要参与进来可以通过 Discussion 进行交流💬。
  • 或者直接发邮件到[email protected]

如果你对 Datawhale 很感兴趣并想要发起一个新的项目,欢迎查看 Datawhale 贡献指南

贡献者名单

姓名 职责 简介
黎伟 项目负责人 datawhale成员
坐看云起 贡献者 内测学员
阿鲁 贡献者 内测学员

关注我们

扫描下方二维码关注公众号:Datawhale

LICENSE

知识共享许可协议
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。

注:默认使用CC 4.0协议,也可根据自身项目情况选用其他协议

About

A simple and trans-platform rag framework and tutorial

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published