Question 1

如果"猫"和"小猫"有相似的嵌入，"猫"和"量子物理"的嵌入差异很大，这说明了什么属性？

Accepted Answer

嵌入捕捉语义含义和关系. 嵌入捕捉语义含义——具有相关含义的词/短语在向量空间中聚集在一起，与确切措辞无关。

Question 2

两个嵌入之间的余弦相似度为 0 意味着什么？

Accepted Answer

文本在语义上无关（正交向量）. 余弦相似度为 0 意味着向量是垂直的（正交的）——没有方向关系，表示语义上无关的内容。

Question 3

在 RAG 流水线中，何时使用嵌入模型，何时使用 LLM？

Accepted Answer

嵌入模型检索相关文档；LLM 生成最终答案. RAG 分工明确：嵌入模型处理检索（通过相似度搜索找到相关块），LLM 处理生成（从检索到的上下文中综合答案）。

什么是向量嵌入（Embeddings）？

深度阅读