找个联网搜索的模型问一下: 厂商 / 平台 代表模型 / API 端点 API 联网搜索 API 多模态 说明与限制 OpenAI GPT-4o / GPT-4.1 / GPT-5.5 / o3 ✅ 原生支持 ✅ 支持 Responses API 内置 web.search 工具;支持图像理解、音频输入/输出、视频(按帧处理)及 DALL-E 原生图像生成。 Google Gemini 2.5 Pro/Flash / Gemini 3.x ✅ 原生支持 ✅ 原生全模态 Google Search Grounding 原生集成;目前唯一在 API 层原生覆盖文本、图像、音频、视频、PDF 全模态的厂商。 Anthropic Claude Sonnet/Opus 4.6/4.7 ✅ 原生支持 ⚠️ 部分支持 2026 年推出 web_search_20260209 工具(Brave Search 后端,支持 Dynamic Filtering);支持图像输入与文档 OCR,但暂不支持音频、视频输入及原生图像生成。 Moonshot Kimi K2.5 / K2.6 ✅ 支持 ✅ 支持 API 层提供实时 Web Search(每次调用约 $0.005),支持图像、PDF、Word、Excel、PPT 等多模态文档解析。 xAI Grok 4.3 ✅ 原生支持 ✅ 支持 原生对接 X 平台实时信息检索;具备多模态理解与生成能力。 阿里云 Qwen3-Max / Qwen-Flash / 百炼 ✅ 支持 ✅ 支持 AI 搜索开放平台集成联网搜索技术;Qwen-VL 等系列支持多模态数据解析。 字节跳动 豆包 / 火山方舟 ✅ 支持 ✅ 支持 提供 DoubaoSearch 等搜索增强模型 API;平台层支持多模态输入。 百度 文心千帆 / ERNIE ✅ 支持 ✅ 支持 千帆平台支持联网搜索增强;文心系列具备多模态理解能力。 腾讯云 DeepSeek-R1/V3 + 知识引擎 ✅ 支持 ⚠️ 取决于模型 由搜狗搜索引擎提供支持,为 DeepSeek API 增加联网能力;多模态能力取决于所调用的底层模型。 商汤 日日新 SenseNova 未明确 ✅ 支持 原生支持视频、音频、图像多模态联动分析;API 层联网搜索能力未在公开资料中明确标注。 Perplexity Sonar / Sonar Pro / Sonar Reasoning ✅ 原生支持 ❌ 不支持 以「内置实时搜索 + 自动引用」为核心卖点,但截至 2026 年 5 月暂不支持图像生成、多模态输入或微调。 DeepSeek DeepSeek-V3.2 / V4 Pro / R1 ⚠️ 平台增强 ❌ 不支持 官方基础 API 本身无原生联网搜索,需通过腾讯云、网宿科技等聚合平台获得该能力;模型本身为纯文本/代码模型,多模态支持有限。 Meta Llama 4 Scout / Maverick ❌ 需自建 ✅ 支持 开源权重模型,需自行部署并额外集成搜索工具;Llama 4 系列原生支持多模态架构。 Mistral Mistral Large 3 ❌ 需自建 ⚠️ 有限 提供开源与 Hosted API,但多模态能力明显弱于 Gemini / GPT-4o 等前沿模型,且需自建联网能力。
@kitty-cat #2 发布于2026/6/3 00:01:50 找个联网搜索的模型问一下: 厂商 / 平台 代表模型 / API 端点 API 联网搜索 API 多模态 说明与限制 OpenAI GPT-4o / GPT-4.1 / GPT-5.5 / o3 ✅ 原生支持 ✅ 支持 Responses API 内置 web.search 工具;支持图像理解、音频输入/输出、视频(按帧处理)及 DALL-E 原生图像生成。 Google Gemini 2.5 Pro/Flash / Gemini 3.x ✅ 原生支持 ✅ 原生全模态 Google Search Grounding 原生集成;目前唯一在 API 层原生覆盖文本、图像、音频、视频、PDF 全模态的厂商。 Anthropic Claude Sonnet/Opus 4.6/4.7 ✅ 原生支持 ⚠️ 部分支持 2026 年推出 web_search_20260209 工具(Brave Search 后端,支持 Dynamic Filtering);支持图像输入与文档 OCR,但暂不支持音频、视频输入及原生图像生成。 Moonshot Kimi K2.5 / K2.6 ✅ 支持 ✅ 支持 API 层提供实时 Web Search(每次调用约 $0.005),支持图像、PDF、Word、Excel、PPT 等多模态文档解析。 xAI Grok 4.3 ✅ 原生支持 ✅ 支持 原生对接 X 平台实时信息检索;具备多模态理解与生成能力。 阿里云 Qwen3-Max / Qwen-Flash / 百炼 ✅ 支持 ✅ 支持 AI 搜索开放平台集成联网搜索技术;Qwen-VL 等系列支持多模态数据解析。 字节跳动 豆包 / 火山方舟 ✅ 支持 ✅ 支持 提供 DoubaoSearch 等搜索增强模型 API;平台层支持多模态输入。 百度 文心千帆 / ERNIE ✅ 支持 ✅ 支持 千帆平台支持联网搜索增强;文心系列具备多模态理解能力。 腾讯云 DeepSeek-R1/V3 + 知识引擎 ✅ 支持 ⚠️ 取决于模型 由搜狗搜索引擎提供支持,为 DeepSeek API 增加联网能力;多模态能力取决于所调用的底层模型。 商汤 日日新 SenseNova 未明确 ✅ 支持 原生支持视频、音频、图像多模态联动分析;API 层联网搜索能力未在公开资料中明确标注。 Perplexity Sonar / Sonar Pro / Sonar Reasoning ✅ 原生支持 ❌ 不支持 以「内置实时搜索 + 自动引用」为核心卖点,但截至 2026 年 5 月暂不支持图像生成、多模态输入或微调。 DeepSeek DeepSeek-V3.2 / V4 Pro / R1 ⚠️ 平台增强 ❌ 不支持 官方基础 API 本身无原生联网搜索,需通过腾讯云、网宿科技等聚合平台获得该能力;模型本身为纯文本/代码模型,多模态支持有限。 Meta Llama 4 Scout / Maverick ❌ 需自建 ✅ 支持 开源权重模型,需自行部署并额外集成搜索工具;Llama 4 系列原生支持多模态架构。 Mistral Mistral Large 3 ❌ 需自建 ⚠️ 有限 提供开源与 Hosted API,但多模态能力明显弱于 Gemini / GPT-4o 等前沿模型,且需自建联网能力。 非常感谢
找个联网搜索的模型问一下:
web.search工具;支持图像理解、音频输入/输出、视频(按帧处理)及 DALL-E 原生图像生成。web_search_20260209工具(Brave Search 后端,支持 Dynamic Filtering);支持图像输入与文档 OCR,但暂不支持音频、视频输入及原生图像生成。v2.5有 pro没有
原来是这样吗
非常感谢
学到了,但是感觉对我来说用处不大