⚠️ Alpha内测版本警告:此为早期内部构建版本,尚不完整且可能存在错误,欢迎大家提Issue反馈问题或建议。
Skip to content

向量数据库学习路径推荐🧭

针对不同的学习基础学习者,本教程提供了不同的学习路径供大家学习参考。 学习者也可以根据自己的需求进行专项学习,Faiss/Milvus根据实际场景选择。

一、零基础入门路径(循序渐进,夯实基础)

适合人群:完全零基础 / 初次接触向量数据库 目标:循序渐进,建立完整认知体系与基础实操能力

阶段1:核心概念认知(建立底层逻辑)

  • 第一部分 基础学习篇 - Chapter 1 项目介绍
  • 第一部分 基础学习篇 - Chapter 2 为什么需要向量数据库
  • 第五部分 补充内容 - 向量基础知识(选学)

阶段2:核心原理理解(掌握核心算法)

  • 第一部分 基础学习篇 - Chapter 3 向量嵌入算法基础
  • 第一部分 基础学习篇 - Chapter 4 向量搜索算法基础
  • 第一部分 基础学习篇 - Chapter 5 ANN 搜索算法(重点理解IVF、HNSW概念,跳过复杂代码实战)

阶段3:轻量实战落地(建立实操体感)

  • 第一部分 基础学习篇 - Chapter 6 实现你自己的向量数据库
  • 第二部分 Faiss 教程 - Chapter 1 FAISS 入门与环境搭建
  • 第二部分 Faiss 教程 - Chapter 2 FAISS 核心索引实战(聚焦Flat、IVF基础使用)

阶段4:入门级工具拓展(接触主流向量库)

  • 第三部分 Milvus 教程 - Chapter 1 Milvus 向量数据库入门:认知与架构
  • 第三部分 Milvus 教程 - Chapter 2 Milvus 核心概念:数据模型与索引体系
  • 第三部分 Milvus 教程 - Chapter 3 Milvus 基础操作:PyMilvus核心API实战

进阶拓展(完成基础后可选)

  • 第二部分 Faiss 教程 - Chapter 3 FAISS 核心功能进阶(仅学复合索引基础)
  • 第三部分 Milvus 教程 - Chapter 4 Milvus的AI应用开发:基于BM25的混合搜索实战
  • 第四部分 AI应用开发 - project 1 基于FAISS框架RAG实战项目

二、有RAG基础人群路径(聚焦检索优化,落地实战)

适合人群:已做过 RAG / LLM 应用 目标:聚焦检索层优化,实现工程级落地

阶段1:核心原理快速衔接(关联RAG场景)

  • 第一部分 基础学习篇 - Chapter 2 为什么需要向量数据库(理解RAG检索瓶颈解决方案)
  • 第一部分 基础学习篇 - Chapter 4 向量搜索算法基础(关联RAG相似度匹配逻辑)
  • 第一部分 基础学习篇 - Chapter 5 ANN 搜索算法(重点学HNSW/IVF在RAG中的应用)

阶段2:高性能检索引擎实战(优化RAG检索层)

  • 第二部分 Faiss 教程 - Chapter 2 FAISS 核心索引实战(Flat/IVF/HNSW选型)
  • 第二部分 Faiss 教程 - Chapter 3 FAISS 核心功能进阶(复合索引、批量检索)
  • 第二部分 Faiss 教程 - Chapter 4 FAISS 性能调优与评估(Recall/延迟/内存调优)
  • 第二部分 Faiss 教程 - Chapter 5 FAISS 工程化落地实战(集成到RAG工程)

阶段3:分布式向量库与RAG融合(进阶落地)

  • 第三部分 Milvus 教程 - Chapter 3 Milvus 基础操作(PyMilvus API快速掌握)
  • 第三部分 Milvus 教程 - Chapter 4 Milvus的AI应用开发:基于BM25的混合搜索实战
  • 第三部分 Milvus 教程 - Chapter 6 选学部分(Milvus reranker优化检索精度)

进阶拓展

  • 第三部分 Milvus 教程 - Chapter 5 Milvus的AI应用开发:图像检索应用实战
  • 第五部分 补充内容 - Meta-Chunking策略(智能文本切分提升RAG精度)
  • 第五部分 补充内容 - 检索理论极限(理解RAG检索性能边界)

三、有传统数据库(DB)基础人群路径(迁移经验,聚焦差异)

适合人群:MySQL / ES / 分布式数据库背景 目标:迁移已有经验,理解向量数据库的本质差异

阶段一:核心差异认知(从 DB 视角理解向量检索)

  • 第一部分 基础学习篇 - Chapter 2 为什么需要向量数据库(对比传统DB检索瓶颈)
  • 第一部分 基础学习篇 - Chapter 5 ANN 搜索算法(向量索引vs传统DB索引)

阶段2:主流向量库架构与实战(复用DB经验)

  • 第二部分 Faiss 教程 - Chapter 2 FAISS 核心索引实战(向量索引设计逻辑)
  • 第二部分 Faiss 教程 - Chapter 4 FAISS 性能调优与评估(复用DB调优思路)
  • 第二部分 Faiss 教程 - Chapter 5 FAISS 工程化落地实战(服务化/工程结构)
  • 第三部分 Milvus 教程 - Chapter 1 Milvus 向量数据库入门:认知与架构(分布式向量库vs传统分布式DB)
  • 第三部分 Milvus 教程 - Chapter 2 Milvus 核心概念:数据模型与索引体系(Collection/Partition vs 表/分区)
  • 第三部分 Milvus 教程 - Chapter 3 Milvus 基础操作:PyMilvus核心API实战(向量库CRUD)

阶段3:分布式向量库与AI应用落地(进阶)

  • 第三部分 Milvus 教程 - Chapter 6 选学部分(Milvus底层架构详解)
  • 第四部分 AI应用开发 - project 2 基于Milvus框架的Agent项目
  • 第四部分 AI应用开发 - project 3 基于Milvus和ArangoDB的RAG系统(多库融合)

进阶拓展

  • 第三部分 Milvus 教程 - Chapter 4/5(混合搜索/图像检索,拓展AI应用场景)
  • 第五部分 补充内容 - FusionANNS架构设计(GPU加速检索vs传统DB硬件优化)
  • 第五部分 补充内容 - 聚类算法(关联传统DB分库分表/数据聚类)
  • 第五部分 补充内容 - 检索理论极限(向量检索性能边界vs传统DB