← Model API topic
RAG stack compare
Layers from orchestration to vector stores and ingestion. Updated 2026-05-30。
| 产品 | 层级 | 部署 | 定价 | 适合 |
|---|---|---|---|---|
| LlamaIndex · 收录 | 编排框架 | 库 / 云 | 开源 + 云 | 数据连接器丰富 |
| LangChain · 收录 | 编排框架 | 库 | 开源 | 生态最大 |
| Dify · 收录 | 应用平台 | 可自建 | 开源 + 云 | 可视化知识库 |
| Pinecone · 收录 | 向量库 | SaaS | 按量 | 托管向量检索 |
| Milvus · 收录 | 向量库 | 可自建 / Zilliz | 开源 + 云 | 大规模自建 |
| Qdrant · 收录 | 向量库 | 可自建 / 云 | 开源 + 云 | 过滤查询强 |
| Weaviate · 收录 | 向量库 | 可自建 / 云 | 开源 + 云 | 混合搜索 |
| RAGFlow · 收录 | 应用平台 | 可自建 | 开源 | 文档解析流水线 |
| FastGPT · 收录 | 应用平台 | 可自建 | 开源 | 国内部署友好 |
| Firecrawl · 收录 | 数据摄取 | API | 按量 | 网页转 Markdown |
FAQ
- 最小 RAG 栈需要哪些组件?
- 嵌入模型 + 向量库 + 编排(LlamaIndex/LangChain)+ 可选重排序;小项目可用 Dify/FastGPT 一站式。
- 向量库如何选型?
- 免运维选 Pinecone;自建规模大选 Milvus;需要复杂过滤可看 Qdrant/Weaviate。
- 数据从哪来?
- Firecrawl 等抓取 API、自有文档上传、或企业知识库连接器(LlamaIndex 擅长)。
部分对比表中的外链可能含联盟或邀请参数,用于支持站点运营;价格与能力信息仍独立维护。 详见 赞助与披露说明。