返回首页

Embedding

把文字/图片变成一串数字(向量)。相似意思的两段文字,它们的数字也挨得近。

做什么会用到

  • 01做产品搜索:搜“便宜耳机”,embedding 能找出“性价比耳机”(关键词搜不到)
  • 02做知识库问答:先用 embedding 找相关段落,再让 AI 生成答案(RAG 的基础)
  • 03做相似推荐:看完这篇文章,推荐语义接近的,不是同一个标签的
  • 04去重:embedding 相近 = 内容相似,能筛掉重复稿、爬取去重

想用它怎么问 AI

我要做【语义搜索 / 知识库问答 / 相似推荐】,数据量大概【X 万条】。请告诉我用 OpenAI 的 embedding 还是开源的(BGE / M3),以及怎么做最简方案。

相关词

向量数据库RAG语义搜索