DeepFloodbeta

有人盘点过哪些大模型的API是支持联网搜索和多模态的吗

白嫖的mimo套餐,接入之后发现没法联网搜索和多模态识别,感觉体验比之前用的gpt大打折扣 xhj017
PS:好像deepseek也不行 xhj032

  • 找个联网搜索的模型问一下: xhj007

    厂商 / 平台 代表模型 / API 端点 API 联网搜索 API 多模态 说明与限制
    OpenAI GPT-4o / GPT-4.1 / GPT-5.5 / o3 ✅ 原生支持 ✅ 支持 Responses API 内置 web.search 工具;支持图像理解、音频输入/输出、视频(按帧处理)及 DALL-E 原生图像生成。
    Google Gemini 2.5 Pro/Flash / Gemini 3.x ✅ 原生支持 ✅ 原生全模态 Google Search Grounding 原生集成;目前唯一在 API 层原生覆盖文本、图像、音频、视频、PDF 全模态的厂商。
    Anthropic Claude Sonnet/Opus 4.6/4.7 ✅ 原生支持 ⚠️ 部分支持 2026 年推出 web_search_20260209 工具(Brave Search 后端,支持 Dynamic Filtering);支持图像输入与文档 OCR,但暂不支持音频、视频输入及原生图像生成。
    Moonshot Kimi K2.5 / K2.6 ✅ 支持 ✅ 支持 API 层提供实时 Web Search(每次调用约 $0.005),支持图像、PDF、Word、Excel、PPT 等多模态文档解析。
    xAI Grok 4.3 ✅ 原生支持 ✅ 支持 原生对接 X 平台实时信息检索;具备多模态理解与生成能力。
    阿里云 Qwen3-Max / Qwen-Flash / 百炼 ✅ 支持 ✅ 支持 AI 搜索开放平台集成联网搜索技术;Qwen-VL 等系列支持多模态数据解析。
    字节跳动 豆包 / 火山方舟 ✅ 支持 ✅ 支持 提供 DoubaoSearch 等搜索增强模型 API;平台层支持多模态输入。
    百度 文心千帆 / ERNIE ✅ 支持 ✅ 支持 千帆平台支持联网搜索增强;文心系列具备多模态理解能力。
    腾讯云 DeepSeek-R1/V3 + 知识引擎 ✅ 支持 ⚠️ 取决于模型 由搜狗搜索引擎提供支持,为 DeepSeek API 增加联网能力;多模态能力取决于所调用的底层模型。
    商汤 日日新 SenseNova 未明确 ✅ 支持 原生支持视频、音频、图像多模态联动分析;API 层联网搜索能力未在公开资料中明确标注。
    Perplexity Sonar / Sonar Pro / Sonar Reasoning ✅ 原生支持 ❌ 不支持 以「内置实时搜索 + 自动引用」为核心卖点,但截至 2026 年 5 月暂不支持图像生成、多模态输入或微调。
    DeepSeek DeepSeek-V3.2 / V4 Pro / R1 ⚠️ 平台增强 ❌ 不支持 官方基础 API 本身无原生联网搜索,需通过腾讯云、网宿科技等聚合平台获得该能力;模型本身为纯文本/代码模型,多模态支持有限。
    Meta Llama 4 Scout / Maverick ❌ 需自建 ✅ 支持 开源权重模型,需自行部署并额外集成搜索工具;Llama 4 系列原生支持多模态架构。
    Mistral Mistral Large 3 ❌ 需自建 ⚠️ 有限 提供开源与 Hosted API,但多模态能力明显弱于 Gemini / GPT-4o 等前沿模型,且需自建联网能力。
  • v2.5有 pro没有

  • @夜轻 #1 发布于2026/6/2 23:03:43
    v2.5有 pro没有

    原来是这样吗 xhj005

  • @kitty-cat #2 发布于2026/6/3 00:01:50
    找个联网搜索的模型问一下: xhj007

    厂商 / 平台 代表模型 / API 端点 API 联网搜索 API 多模态 说明与限制
    OpenAI GPT-4o / GPT-4.1 / GPT-5.5 / o3 ✅ 原生支持 ✅ 支持 Responses API 内置 web.search 工具;支持图像理解、音频输入/输出、视频(按帧处理)及 DALL-E 原生图像生成。
    Google Gemini 2.5 Pro/Flash / Gemini 3.x ✅ 原生支持 ✅ 原生全模态 Google Search Grounding 原生集成;目前唯一在 API 层原生覆盖文本、图像、音频、视频、PDF 全模态的厂商。
    Anthropic Claude Sonnet/Opus 4.6/4.7 ✅ 原生支持 ⚠️ 部分支持 2026 年推出 web_search_20260209 工具(Brave Search 后端,支持 Dynamic Filtering);支持图像输入与文档 OCR,但暂不支持音频、视频输入及原生图像生成。
    Moonshot Kimi K2.5 / K2.6 ✅ 支持 ✅ 支持 API 层提供实时 Web Search(每次调用约 $0.005),支持图像、PDF、Word、Excel、PPT 等多模态文档解析。
    xAI Grok 4.3 ✅ 原生支持 ✅ 支持 原生对接 X 平台实时信息检索;具备多模态理解与生成能力。
    阿里云 Qwen3-Max / Qwen-Flash / 百炼 ✅ 支持 ✅ 支持 AI 搜索开放平台集成联网搜索技术;Qwen-VL 等系列支持多模态数据解析。
    字节跳动 豆包 / 火山方舟 ✅ 支持 ✅ 支持 提供 DoubaoSearch 等搜索增强模型 API;平台层支持多模态输入。
    百度 文心千帆 / ERNIE ✅ 支持 ✅ 支持 千帆平台支持联网搜索增强;文心系列具备多模态理解能力。
    腾讯云 DeepSeek-R1/V3 + 知识引擎 ✅ 支持 ⚠️ 取决于模型 由搜狗搜索引擎提供支持,为 DeepSeek API 增加联网能力;多模态能力取决于所调用的底层模型。
    商汤 日日新 SenseNova 未明确 ✅ 支持 原生支持视频、音频、图像多模态联动分析;API 层联网搜索能力未在公开资料中明确标注。
    Perplexity Sonar / Sonar Pro / Sonar Reasoning ✅ 原生支持 ❌ 不支持 以「内置实时搜索 + 自动引用」为核心卖点,但截至 2026 年 5 月暂不支持图像生成、多模态输入或微调。
    DeepSeek DeepSeek-V3.2 / V4 Pro / R1 ⚠️ 平台增强 ❌ 不支持 官方基础 API 本身无原生联网搜索,需通过腾讯云、网宿科技等聚合平台获得该能力;模型本身为纯文本/代码模型,多模态支持有限。
    Meta Llama 4 Scout / Maverick ❌ 需自建 ✅ 支持 开源权重模型,需自行部署并额外集成搜索工具;Llama 4 系列原生支持多模态架构。
    Mistral Mistral Large 3 ❌ 需自建 ⚠️ 有限 提供开源与 Hosted API,但多模态能力明显弱于 Gemini / GPT-4o 等前沿模型,且需自建联网能力。

    非常感谢 ac26

  • 学到了,但是感觉对我来说用处不大 xhj003

你好啊,陌生人!

我的朋友,看起来你是新来的,如果想参与到讨论中,点击下面的按钮!

📈用户数目📈

目前论坛共有11878位用户

🎉欢迎新用户🎉