一个生产级的检索增强生成(RAG)系统,其复杂性远超于简单地将一个语言模型与向量数据库连接起来。它本质上是一个分布式系统,对服务间通信的安全性、端到端的延迟以及深入的运维洞察力有着严苛的要求。当我们将RAG流程拆分为独立的微服务——例如,一
2023-10-27