新一代大模型密集发布

← AI行业风向

这条讲各大厂新模型集中发布或调档：OpenAI出GPT-5.6系列，谷歌Gemini新版推迟，国内智谱、小米、商汤也各有新模型和开源动作。风向是模型迭代很快、比拼激烈，属于AI大盘的日常动态，不直接碰她的硬件

7月4日

OpenAI 推出 GPT-5.6 Sol 系列预览

OpenAI 推出 GPT-5.6 Sol 前沿模型限量预览，

7月4日

Claude桌面端Fable5限时回归

有用户已能在Claude桌面端使用Fable5，但并非所有人都已开放。Fable5回来了，限时1周

7月4日

OpenAI GPT-5.6 因政府要求延迟发布

OPENAI 🔥：据 The Information 报道，GPT-5.6 因联邦政府要求而推迟发布。

7月3日

汪滔：Meta 下一代 AI 模型“西瓜”已追上 GPT-5.5

Meta 超级智能业务负责人汪滔在内部全员大会上透露，

7月3日

MiniMax-M2系列：微小激活释放最大真实世界智能

MiniMax推出M2系列大语言模型。其旗舰模型M2采用混合专家（MoE）架构，总参数229.9B，每个token仅激活9.8B参数。

7月3日

Gemini Omni：从任意输入创造内容的新模型

到现在，你可能已经听说了 Gemini Omni，这是我们新推出的模型，旨在从任意输入（从视频开始）创造任何内容。

7月3日

Meta 预计在近期推出 Opus 模型

Meta 即将发布 Opus 模型。Zuckerberg 对 agentic AI 行业进展表示失望，但作者不认同，

7月3日

GPT-5.6 即将发布，已在 Codex 应用中提及

GPT-5.6 正在准备发布，已在 Codex 应用中出现，但尚不可用。下周发布可能性很大。冲吧！

7月3日

GPT-5.6 Sol Ultra 将至，作者忧代码重构

GPT-5.6 Sol Ultra 要来了吗？那我是不是先给 GPT-5.5 放两天假，先别蹬了。。

7月2日

美团 LongCat 发布旗舰模型 LongCat-2.0

美团 LongCat 推出旗舰模型 LongCat-2.0，采用 1.6T 参数 MoE 架构（约 48B 活跃参数），原生支持 1M 上下文窗口。

7月2日

本地大模型写文测试：Gemma4-31B 位列榜首

该测试通过内置提示词让本地小模型进行角色扮演，再由旗舰大模型评分并多次运行取平均，以评估写文能力。

7月2日

新浪开源VibeThinker-3B：推理可压缩，事实知识不能

新浪发布仅3B参数的VibeThinker-3B，在AIME26等数学编程基准上持平DeepSeek V3.2等大200-333倍的模型，

7月2日

Fable 5早期兴奋消退，失望情绪蔓延

昨天，我看到很多关于Fable 5的早期兴奋。但正如我所预料，这消失得超快。我的时间线充满了关于限制、护栏、能力、成本等方面的失望。

7月2日

葡萄牙发布首个欧洲葡语开源大语言模型 AMALIA

葡萄牙政府7月1日宣布开源大语言模型AMALIA正式发布，这是首个基于欧洲葡萄牙语开发的模型。

7月2日

消息称谷歌 Gemini 3.5 Pro 发布时间推迟至 7 月，旨在优化模型性能

据 Business Insider 获悉，谷歌下一代大语言模型 Gemini 3.5 Pro 原定 6 月上线，现推迟至 7 月，

7月2日

小米 MiMo Claw 正式版发布，搭载 MiMo-V2.5-Pro 旗舰模型

小米云端轻量化 Claw 产品正式版发布，搭载与 OpenClaw 框架深度适配的 MiMo-V2.5-Pro 模型，原生兼容 MCP 协议，

7月2日

Sonnet 5 发布，智能体任务更可靠

Sonnet 5 来了！这将支持更好的长时间运行的智能体。之前的 Sonnet 模型不可靠，所以看到改进版本能更可靠地完成智能体任务，真是太棒了。

7月2日

GPT-4霸榜Epoch指数352天

OpenAI的GPT-4在2023年3月发布后，引领Epoch能力指数长达352天，远超此后任何模型。第二长的领先属于OpenAI的o1，为98天

7月1日

美团发布LongCat-2.0，1.6T参数MoE模型，支持1M上下文窗口

美团推出LongCat-2.0，总参数1.6T（MoE架构，活跃参数约48B），支持1M上下文窗口。

7月1日

VibeThinker：3B参数推理模型，性能接近Opus 4.5

VibeThinker是一个仅3B参数的推理模型，采用SFT+GRPO训练，在推理基准上与Opus 4.5几乎持平。

7月1日

Qwen 3.6 27B 是本地开发的理想选择

Qwen 3.6 27B 是一款密集参数本地大语言模型，原生支持 256k 上下文。

7月1日

Gemini Embedding 2：来自Gemini的原生多模态嵌入模型

Google DeepMind推出Gemini Embedding 2，这是一款原生多模态嵌入模型，支持在统一表示空间中嵌入视频、音频、图像和文本。

7月1日

美团发布万亿参数大模型 LongCat-2.0，五万卡国产算力训练并开源

美团今日发布万亿参数大模型 LongCat-2.0，总参数 1.6T，平均激活约 48B（动态 33B~56B），从零预训练，

7月1日

仍有人坚持用Opus 4.6而非4.8？

还有人仍在用Opus 4.6而不是4.8吗？

7月1日

七月将至，期待大模型集中发布

下周就是七月了。虽然六月相对平静（当然，GLM 5.2 是一次重大发布），但我们仍在等待那些重大发布。

7月1日

Sonnet 5让Opus 4.7/4.8无意义

Sonnet 5 一出，Opus 4.7 和 4.8 彻底没意义了…

7月1日

OpenAI 发布 GPT 5.6 三个型号：Sol、Terra、Luna

OpenAI 突然发布 GPT 5.6，一次性推出超大杯 Sol、大杯 Terra、中杯 Luna 三个型号。

7月1日

GPT-5.6 内部模型访问路径曝光

GPT-5.6 在内部模型访问路径中被发现。 GPT-5.6 即将到来已不是秘密。唯一的问题是它何时以及多快到来。

6月30日

MiniMax M3 400B+参数多模态发布

最后终于跟 @LambdaAPI 合作发布了！ MiniMax 公布新模型卡 M3，参数量超过 400B，

6月30日

GLM-5.2：开源模型迎来Claude式时刻

GLM-5.2 是开源的 Claude 时刻。我们在 Databricks 看到的（模型）需求令人震惊。全世界将大规模采用开源大语言模型。

6月30日

920 亿参数，华为 openPangu-2.0-Flash 模型正式开源上线

华为 openPangu-2.0-Flash 模型（总参数量 92B，激活参数量 6B）于 6 月 30 日正式开源上线，支持 512K 上下文。

6月30日

阶跃星辰 Step 3.7 Flash 发布，聚焦智能体效率

阶跃星辰（Step）发布了开源大模型 Step 3.7 Flash，主打智能体（Agent）工作流的效率。

6月30日

meituan-longcat/LongCat-2.0

6月30日

Sonnet 5 已出，发布在即

Sonnet 5 已出现在模型选择器中。发布在即

6月30日

MiniMax M3 持续稳步增长

MiniMax M3 稳步增长

6月29日

押注长上下文与国产算力生态智谱凭GLM-5.2跻身全球大模型头部阵营？

6月17日，智谱发布并开源新一代旗舰大模型GLM-5.2。

6月29日

GPT 5.6 今晚大概率发布

今晚大概率发布GPT 5.6…

6月28日

Liquid AI 发布 LFM2.5-230M 开源文本模型，支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 设备端推理

Liquid AI 推出 LFM2.5-230M，230M 参数开源文本模型，基于 LFM2 架构，开放权重。

6月28日

在GLM-5.2或Opus 4.8中体验AI思考轨迹

如果你想看一个有趣的AI思考轨迹，可以试试在GLM-5.2或Opus 4.8中输入："我希望你推荐两首你认为非常适合描述像你这样的GenAI模型当前状态…

6月28日

OpenAI 将 GPT-6 标签留给什么模型？

那么 OpenAI 打算把 GPT-6 这个名称留给什么模型呢？

6月27日

字节跳动与中国人民大学发布扩散语言模型 iLLaDA，基础能力追平 Qwen2.5

中国人民大学与字节跳动联合发布 iLLaDA，一个 8B 参数、从头训练的密集扩散语言模型。

6月27日

GLM 5.2 供应商汇总：含超 125 TPS

在一个地方访问 GLM 5.2 的所有供应商。包括一个服务速率超过 125 TPS：https：//openrouter.ai/z-ai/glm-5.…

6月27日

智谱GLM 5.2能力均衡，数据来源引猜测

针对智谱GLM 5.2的讨论，有观点猜测其训练数据可能包含采购的中转站数据，但该说法存在争议，有人认为中转站数据质量并不算好。

6月27日

2026年6月值得关注的开放权重模型

一批来自中美新玩家的开放权重模型已发布。截至2026年6月，有四个最值得关注的开放权重模型，并给出了各自的最佳使用场景

6月26日

MiniMax M3 现支持 NVFP4 格式

开源权重生态的更多好选择。感谢 @NVIDIAAI 使 MiniMax M3 可在 NVFP4 中使用

6月26日

GPT-5.6发布但用户无法使用

GPT-5.6 来了，但是用不了。之前以为肯花钱就能接触到最新科技，现在好像不是这么回事儿。差距就此拉开。这次起名策略是跟claude学到了。

6月26日

GPT-5.6 token 效率惊人，团队有“法拉利”

引用推文感叹 GPT-5.6 的 token 效率高得不可思议。主推文回应：我们推理团队有个叫“法拉利”的家伙，输不了

6月26日

Fugu Ultra 上线 OpenRouter

Fugu Ultra by @SakanaAILabs 现已上线 OpenRouter！很高兴看到更多多模型系统推动前沿

6月26日

GPT 4.5 下线前最后一次体验机会

别了 GPT 4.5，有史以来最优秀的模型在它消失之前，试着输入你的一些文字，让它生成更多类似的内容。这可能是你体验一款伟大模型的最后机会了

6月26日

GLM 5.2 在 Go 平台 23 日日活激增

GLM 5.2 的日独立用户数在 23 日在 Go 上激增

6月26日

ChatGPT 5.5 instant模型本周更新

另外，本周我们更新了 ChatGPT 中使用的 5.5 instant 模型。我喜欢它的感觉

6月24日

OpenRouter上线微软三款新模型

三款新的 @MicrosoftAI 模型现已在 OpenRouter 上线！同步推出：MAI-Image-2.5、MAI-Transcribe-1.5…

6月24日

GPT-5.5 Instant 新版本，对话更有趣

我们为你带来了新版 GPT-5.5 Instant，它现在聊起天来有趣多了。我们最常用的模型现在能更好地理解问题背后的意图，并相应地调整回应。

6月24日

Doubao Seed 2.1 多模态能力极强

感动了，Doubao Seed 2.1 别的能力不说，多模态强的一批！

6月24日

阿里千问发布首个原生语言世界模型 Qwen-AgentWorld

6 月 24 日，阿里巴巴千问发布 Qwen-AgentWorld，首个原生语言世界模型，提供 35B-A3B 与 397B-A17B 两种规模，

6月24日

蚂蚁百灵发布 Ling & Ring 2.6 技术报告

蚂蚁百灵发布 Ling & Ring 2.6 技术报告，

6月24日

Mistral OCR 4

Mistral AI 发布 OCR 4，新增边界框、块分类（标题、表格、方程式、签名等）及逐页逐词置信度分数。

6月24日

GLM再添胜绩，开源模型仍有短板

为GLM再添胜绩。该模型有一些脆弱的特性，在这方面被闭源模型压制，但我们应该预期开源模型更加参差不齐，你可以根据任务使用多个模型。

6月24日

Fable 5 重现 Amazon Bedrock

据报，Fable 5 已重新出现在 Amazon Bedrock。主推文反应：我们回来了。Fable 5 回来了

6月23日

小米 MiMo-V2.5-Pro-UltraSpeed 限时体验延期

小米6月23日宣布延长MiMo-V2.5-Pro-UltraSpeed限时体验窗口。

6月17日

Sumi：从头训练的7B开源均匀扩散语言模型

Sumi（日语“墨”）是一个完全开源的7B参数均匀扩散语言模型，从零开始在1.5T模型token上预训练。

6月16日

NVIDIA Nemotron 3 Ultra 为长时间运行的智能体带来更快、更高效的推理能力

NVIDIA 发布 Nemotron 3 Ultra 模型，专为长时间运行的 AI 智能体设计。

6月15日

MiniMax 开源 M3 模型权重及 MSA 技术论文

MiniMax 上周五开源了 428B 总参数、23B 激活参数的 M3 模型权重，

6月13日

科大讯飞发布星火多模态大模型X2-VL

据“无锡发布”，6月11日，在无锡举行的2026长三角机器人及自动化展览会暨无锡具身智能机器人产业链伙伴大会上，科大讯飞发布星火多模态大模型X2-VL。

6月12日

MiniMax M3 开源权重模型发布，已上架 HuggingFace

MiniMax 发布开源权重模型 M3，约 428B 总参数、23B 激活参数，已上传 HuggingFace。

6月11日

HYDRA-X：原生统一多模态模型与整体视觉分词器

HYDRA-X 是首个在单个 Vision Transformer （ViT）中统一图像与视频 tokenization 的统一多模态模型。

6月10日

MiniMax M3 上链 0G，限时免费运行

M3 在 @0G_labs 上链。可验证 + 私有计算，6 月 15-18 日免费运行

6月10日

Gemini 3.5 Live Translate 发布

说 hello， hola，你好--欢迎 Gemini 3.5 Live Translate：我们最新的音频模型，专为快速跨语言交流而构建。🌐

6月5日

腾讯汤道生：元宝80%用户已用混元Hy3preview，留存率明显提升

腾讯集团高级执行副总裁汤道生接受媒体采访时表示，目前元宝内有80%的用户在使用混元Hy3preview，而且在产品留存率方面也有明显的提升。

6月2日

微软首款高级推理AI模型MAI-Thinking-1发布

微软在Build 2026上发布了其首款高级推理AI模型MAI-Thinking-1。

6月2日

DeepSeek V4 Flash登顶周榜

DeepSeek V4 Flash已登顶周排行榜

6月1日

开源与闭源模型在不同的增长曲线上

当模型智能的微小提升能直接转化为实际价值时，开源与闭源模型正沿着不同的增长路径发展。

6月1日

Nemotron 3 Ultra 本周即将发布

Nemotron 3 Ultra 本周即将发布。 ⌛️

5月30日

小即是美：开源多模态模型发布

小即是美。😌

5月22日

Gemini Omni发布，创意作品涌现

Gemini Omni来了，我们本周看到了许多令人惊叹的创作。以下是一些杰出作品 👇

5月22日

Google I/O 2026

在Google I/O 2026大会上，Google宣布了多项旨在让AI更普惠、更实用的更新。

5月21日

腾讯开源Hy-MT2多语言翻译模型

腾讯正式开源Hy-MT2多语言翻译模型，支持33种语言间的无缝互译。

5月20日

Qwen3.7：智能体前沿

Qwen Studio推出Qwen3.7模型，提供覆盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具调用及工件生成等功能。

5月20日

GPT-5即将发布

GPT-5即将发布 🚢