"Retrieval"
- Adaptive Retrieval
RAG 控制流中先判斷是否需要檢索,只在外部知識有價值時才 retrieve
- Context Packing
RAG retrieve 後把 chunks 去重、排序、壓縮、標來源,再塞進 prompt 的組裝決策
- HyDE(Hypothetical Document Embeddings)
用 LLM 生成假設文件、對假文件做 embedding 去 retrieve、繞過 query-document gap 的 RAG 增強技術
- Multi-Step Retrieval
RAG 中多輪 retrieve → 判斷 → 再 retrieve 的控制流,用來處理 multi-hop 問題
- Query Decomposition
把複合 query 拆成可獨立檢索的子 query,平行取得證據後再合成答案
- Query Expansion
RAG 檢索前把一個 query 擴成多個語意變體,增加 coverage,再合併 retrieval 結果
- Query Rewriting
在 RAG 檢索前改寫使用者查詢,讓 query 更接近文件語言與索引分佈
- Query-Document Gap
使用者 query 與文件語言在詞彙、形態、抽象層級或領域分佈上的落差,是 RAG retrieval miss 的常見原因
- Retrieval Cost
RAG 檢索帶來的 latency、token、embedding、reranker、LLM call 與維護成本,用來判斷增強是否划算
- Retrieval Recall
衡量 RAG 檢索是否把應該命中的文件或 chunk 放進 top-k 結果,是 component-level eval 的核心指標
- Retrieval Source
RAG 從哪個 corpus、index、tool 或外部系統取回內容,決定來源可信度、freshness、權限與引用責任
- Hybrid Search
把字面 retrieval(BM25)跟語意 retrieval(embedding)的結果用 RRF 等方法合併、補單一路線的盲點
- Reranker
對 retrieval top-K 結果用 cross-encoder 重新排序的 RAG 第二階段、品質提升顯著但 latency / cost 增加
- 4.2 RAG 檢索增強:query rewriting / HyDE / multi-step / context packing
Query 端增強(rewriting / expansion / HyDE)、multi-step iterative retrieval、retrieve 後的 context packing(dedup / ordering / summarization)、adaptive retrieval:vanilla RAG 不夠時的下一層工具箱