有人盘点过哪些大模型的API是支持联网搜索和多模态的吗

3days ago in 人工智能

白嫖的mimo套餐，接入之后发现没法联网搜索和多模态识别，感觉体验比之前用的gpt大打折扣 xhj017
PS：好像deepseek也不行 xhj032

3days ago

找个联网搜索的模型问一下： xhj007

厂商 / 平台	代表模型 / API 端点	API 联网搜索	API 多模态	说明与限制
OpenAI	GPT-4o / GPT-4.1 / GPT-5.5 / o3	✅ 原生支持	✅ 支持	Responses API 内置 `web.search` 工具；支持图像理解、音频输入/输出、视频（按帧处理）及 DALL-E 原生图像生成。
Google	Gemini 2.5 Pro/Flash / Gemini 3.x	✅ 原生支持	✅ 原生全模态	Google Search Grounding 原生集成；目前唯一在 API 层原生覆盖文本、图像、音频、视频、PDF 全模态的厂商。
Anthropic	Claude Sonnet/Opus 4.6/4.7	✅ 原生支持	⚠️ 部分支持	2026 年推出 `web_search_20260209` 工具（Brave Search 后端，支持 Dynamic Filtering）；支持图像输入与文档 OCR，但暂不支持音频、视频输入及原生图像生成。
Moonshot	Kimi K2.5 / K2.6	✅ 支持	✅ 支持	API 层提供实时 Web Search（每次调用约 $0.005），支持图像、PDF、Word、Excel、PPT 等多模态文档解析。
xAI	Grok 4.3	✅ 原生支持	✅ 支持	原生对接 X 平台实时信息检索；具备多模态理解与生成能力。
阿里云	Qwen3-Max / Qwen-Flash / 百炼	✅ 支持	✅ 支持	AI 搜索开放平台集成联网搜索技术；Qwen-VL 等系列支持多模态数据解析。
字节跳动	豆包 / 火山方舟	✅ 支持	✅ 支持	提供 DoubaoSearch 等搜索增强模型 API；平台层支持多模态输入。
百度	文心千帆 / ERNIE	✅ 支持	✅ 支持	千帆平台支持联网搜索增强；文心系列具备多模态理解能力。
腾讯云	DeepSeek-R1/V3 + 知识引擎	✅ 支持	⚠️ 取决于模型	由搜狗搜索引擎提供支持，为 DeepSeek API 增加联网能力；多模态能力取决于所调用的底层模型。
商汤	日日新 SenseNova	未明确	✅ 支持	原生支持视频、音频、图像多模态联动分析；API 层联网搜索能力未在公开资料中明确标注。
Perplexity	Sonar / Sonar Pro / Sonar Reasoning	✅ 原生支持	❌ 不支持	以「内置实时搜索 + 自动引用」为核心卖点，但截至 2026 年 5 月暂不支持图像生成、多模态输入或微调。
DeepSeek	DeepSeek-V3.2 / V4 Pro / R1	⚠️ 平台增强	❌ 不支持	官方基础 API 本身无原生联网搜索，需通过腾讯云、网宿科技等聚合平台获得该能力；模型本身为纯文本/代码模型，多模态支持有限。
Meta	Llama 4 Scout / Maverick	❌ 需自建	✅ 支持	开源权重模型，需自行部署并额外集成搜索工具；Llama 4 系列原生支持多模态架构。
Mistral	Mistral Large 3	❌ 需自建	⚠️ 有限	提供开源与 Hosted API，但多模态能力明显弱于 Gemini / GPT-4o 等前沿模型，且需自建联网能力。

夜轻元老

3days ago

#1

v2.5有 pro没有
horoscope楼主

3days ago

#3

@夜轻 #1 发布于2026/6/2 23:03:43
v2.5有 pro没有

原来是这样吗

horoscope楼主

3days ago edited 3days ago

@kitty-cat #2 发布于2026/6/3 00:01:50
找个联网搜索的模型问一下：

厂商 / 平台代表模型 / API 端点 API 联网搜索 API 多模态说明与限制

OpenAI GPT-4o / GPT-4.1 / GPT-5.5 / o3 ✅ 原生支持 ✅ 支持 Responses API 内置 web.search 工具；支持图像理解、音频输入/输出、视频（按帧处理）及 DALL-E 原生图像生成。

Google Gemini 2.5 Pro/Flash / Gemini 3.x ✅ 原生支持 ✅ 原生全模态 Google Search Grounding 原生集成；目前唯一在 API 层原生覆盖文本、图像、音频、视频、PDF 全模态的厂商。

Anthropic Claude Sonnet/Opus 4.6/4.7 ✅ 原生支持 ⚠️ 部分支持 2026 年推出 web_search_20260209 工具（Brave Search 后端，支持 Dynamic Filtering）；支持图像输入与文档 OCR，但暂不支持音频、视频输入及原生图像生成。

Moonshot Kimi K2.5 / K2.6 ✅ 支持 ✅ 支持 API 层提供实时 Web Search（每次调用约 $0.005），支持图像、PDF、Word、Excel、PPT 等多模态文档解析。

xAI Grok 4.3 ✅ 原生支持 ✅ 支持原生对接 X 平台实时信息检索；具备多模态理解与生成能力。

阿里云 Qwen3-Max / Qwen-Flash / 百炼 ✅ 支持 ✅ 支持 AI 搜索开放平台集成联网搜索技术；Qwen-VL 等系列支持多模态数据解析。

字节跳动 豆包 / 火山方舟 ✅ 支持 ✅ 支持提供 DoubaoSearch 等搜索增强模型 API；平台层支持多模态输入。

百度文心千帆 / ERNIE ✅ 支持 ✅ 支持千帆平台支持联网搜索增强；文心系列具备多模态理解能力。

腾讯云 DeepSeek-R1/V3 + 知识引擎 ✅ 支持 ⚠️ 取决于模型由搜狗搜索引擎提供支持，为 DeepSeek API 增加联网能力；多模态能力取决于所调用的底层模型。

商汤日日新 SenseNova 未明确 ✅ 支持原生支持视频、音频、图像多模态联动分析；API 层联网搜索能力未在公开资料中明确标注。

Perplexity Sonar / Sonar Pro / Sonar Reasoning ✅ 原生支持 ❌ 不支持以「内置实时搜索 + 自动引用」为核心卖点，但截至 2026 年 5 月暂不支持图像生成、多模态输入或微调。

DeepSeek DeepSeek-V3.2 / V4 Pro / R1 ⚠️ 平台增强 ❌ 不支持官方基础 API 本身无原生联网搜索，需通过腾讯云、网宿科技等聚合平台获得该能力；模型本身为纯文本/代码模型，多模态支持有限。

Meta Llama 4 Scout / Maverick ❌ 需自建 ✅ 支持开源权重模型，需自行部署并额外集成搜索工具；Llama 4 系列原生支持多模态架构。

Mistral Mistral Large 3 ❌ 需自建 ⚠️ 有限提供开源与 Hosted API，但多模态能力明显弱于 Gemini / GPT-4o 等前沿模型，且需自建联网能力。

非常感谢 ac26

NS2026Dan0601

9h 50min ago

#5

学到了，但是感觉对我来说用处不大

有人盘点过哪些大模型的API是支持联网搜索和多模态的吗

你好啊，陌生人!

快捷功能区

📈用户数目📈

🎉欢迎新用户🎉

所有版块

有人盘点过哪些大模型的API是支持联网搜索和多模态的吗

你好啊，陌生人!

快捷功能区

所有版块

📈用户数目📈

🎉欢迎新用户🎉