rag-retrieval

RAG向量召回示例

依赖

先安装适合自己环境的torch，再安装项目依赖:

pip install langchain pypdf rapidocr-onnxruntime modelscope transformers faiss-cpu tiktoken -i https://mirrors.aliyun.com/pypi/simple/

如果有量化相关的报错，从源码安装vllm-gpts、auto-gtpq

用法

1，启动vllm的openai兼容server：

export VLLM_USE_MODELSCOPE=True
python -m vllm.entrypoints.openai.api_server --model 'qwen/Qwen-7B-Chat-Int4' --trust-remote-code -q gptq --dtype float16 --gpu-memory-utilization 0.6

2、运行indexer.py，解析pdf生成向量库

python indexer.py

3、运行rag.py，开始体验RAG增强检索

python rag.py

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
LLM.pdf		LLM.pdf
README.md		README.md
indexer.py		indexer.py
rag.py		rag.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

rag-retrieval

依赖

用法

About

Releases

Packages

Languages

owenliang/rag-retrieval

Folders and files

Latest commit

History

Repository files navigation

rag-retrieval

依赖

用法

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages