返回首页
AI 工程与自动化Context Window

上下文窗口

模型一次能“看”的最大 token 数。GPT-4o 是 128K,Claude 是 200K,Gemini 可达 2M。

做什么会用到

  • 01做长文档问答:选窗口大的模型(Claude / Gemini)比切片简单
  • 02做多轮对话产品:对话越聊越长,撑爆窗口就得裁剪旧消息
  • 03便宜的小模型窗口小(8K、32K),选型时要权衡成本和窗口
  • 04窗口大 ≠ 理解好:塞太满模型会“变笨”,重点信息放头和尾效果最好

想用它怎么问 AI

我要做【处理长文档 / 多轮对话 / 大量资料】的 AI 产品,单次大概【X 万字】。请推荐适合的模型(含窗口大小、价格),以及窗口不够时的处理策略。

相关词