AI 同时能处理文字、图片、音频、视频。GPT-4o / Gemini / Claude 现在都是多模态的。
做什么会用到
想用它怎么问 AI
「我要做【涉及图片/音频/视频】的 AI 产品。请告诉我该用哪个多模态模型(GPT-4o / Claude / Gemini / 开源)、调用方式、大概成本。」
相关词