AI编程工具密集迭代

这条是AI编程赛道，样本量最大也最热闹：Codex、Cursor、Claude Code、GLM、Kimi Code等工具频繁更新，还出现九成代码由AI生成、不审核直接上线的说法。风向是写软件这件事越来越自动化，和硬件产品线基本无关，属纯AI行业背景

7月4日

给AI智能体专用电脑实现端到端测试

给你的智能体一台它自己的电脑，来真正进行端到端测试

7月4日

微服务架构下AI Agent的系统设计与编码实践

建议将所有微服务放在一个workspace（monorepo或虚拟monorepo），让Agent同时看到schema、API和实现代码。

7月4日

参与我们的 I/O 2026 测验：该测验由 Google AI Studio 氛围编程生成

Google 使用其开发工具 Google AI Studio，通过氛围编程（vibe coding）方式，

7月4日

swyx：漂亮的画布演示不如低对比度CLI，因为CLI帮你做商品化思考

swyx讽刺“思维工具”领域花十年做漂亮画布演示，却被低对比度、设计糟糕的CLI碾压，原因是CLI能帮你做“商品化思考”。

7月4日

swyx 盛赞微软在 AI Engineer 大会发言：VS Code 团队的热情支撑 3 万亿美元市值

swyx 在推文中表示，AI Engineer 大会亮点是与微软 @digitarald 等开发者交流，他们认真对待作为代码主导平台的责任，

7月4日

Ramp工程师如何用Codex加速代码审查

Ramp工程师团队通过集成Codex与GPT-5.5模型，实现了代码审查流程的显著提速。

7月4日

Mistral AI 开源模型 Leanstral 1.5 专为 Lean 4 形式化验证设计

Mistral AI 发布 Leanstral 1.5（Apache 2.0 许可证），专为 Lean 4 编程语言的形式化验证设计。

7月4日

Harness、Scaffold 与 AI 智能体术语辨析

本文旨在厘清 AI 智能体领域中易混淆的关键术语。文章指出，模型（如 Claude、GPT）本身是无记忆、无循环的大语言模型。

7月4日

Fable 5 与 Codex 协同完成 AI SDK 7 升级

推文称，自 Fable 5 上线后，它与 Codex 共同完成了第一个 loop 循环，帮助 CodePilot 升级了 AI SDK 7（全部升级）。

7月4日

Codex设计差？试试图像生成重设计

如果你觉得Codex在设计上很糟糕，试试“使用图像生成来重新想象这个设计并实现它”

7月4日

Codex 在 ChatGPT 移动 App 正式可用

OpenAI 宣布 Codex 在 ChatGPT 移动应用中正式开放（GA），并新增一对一设备配对实现更安全的手机与电脑连接。

7月4日

Codex 吃 bug 多，产 bug 也多

Codex 喜欢吞掉 bug。吃的 bug 多，拉的 bug 也多……

7月4日

Anthropic 内部 Fable 5 最佳实践：驾驭强模型的元认知能力

Anthropic 方法论指出，模型越强（如 Fable 5），写代码瓶颈已从模型能力转移到用户能否开工前挖出未知。

7月4日

/architect：减少80%的Fable token，Fable负责协调/审核，Codex负责构建

/architect项目将Fable token减少80%，由Fable进行协调和审核，Codex负责构建任务

7月3日

飞书-Claude Code桥接开源项目

feishu-claude-code-bridge是一个开源项目，可实现飞书与本机Claude Code CLI的双向连接。

7月3日

面壁智能发布AI全自动预训练框架ForgeTrain，8小时追平Megatron-LM

面壁智能发布全球首个完全由AI编写、无人类干预的生产级大模型预训练框架ForgeTrain。该框架针对特定模型和硬件从零自动“锻造”专用训练代码。

7月3日

苹果 Safari 技术预览版 247 引入 MCP 服务，AI 智能体加速网页开发和调试

苹果 Safari 技术预览版 247 新增 MCP 服务器支持，MCP 是开放标准，让 AI 智能体连接外部工具、服务与数据源，

7月3日

腾讯云 EdgeOne Makers 发布：三行命令部署 AI Agent 框架

腾讯云 EdgeOne 发布「EdgeOne Makers」，简化 AI Agent 开发与部署。

7月3日

硅基流动启动 Summer Rush - GLM 5.2 Week 活动

硅基流动 SiliconFlow 举办 Summer Rush 活动，鼓励用户使用 GLM-5.2 模型构建应用并分享用例。

7月3日

硅基流动 Summer Rush 活动：用 GLM-5.2 构建应用赢取代金券

硅基流动推出 Summer Rush 活动，鼓励开发者使用 GLM-5.2 构建应用。

7月3日

消息称微软内部示警：GitHub 面临生存级风险，AI 编程工具削弱托管必要性

微软内部发出警告，称其代码托管平台GitHub正面临“生存级风险”。

7月3日

测了最流行的5个前端页面设计 Skill

博主测评5款前端设计Skill：ui-ux-pro-max模板多限制发挥；emil-design-eng动效最佳；

7月3日

提示工程未死，与智能体对话需技巧

所以基本上，提示工程并没有死。玩笑归玩笑，读起来很棒！如果你不让智能体通过提示来填补你的空白，反之亦然，你会损失很多。

7月3日

推荐可写AppleScript脚本的项目

前几天推荐的这个项目可以直接写AppleScript 脚本真的是方便，不错啊。这也是最早的工作流自动化的启蒙了

7月3日

对比一下 GPT-5.5 的设计效果和 Opus 4.8 的设计效果

宝玉对比了GPT-5.5与Opus 4.8的设计能力，认为Opus 4.8效果远优于GPT-5.5。

7月3日

卡兹克分享Vibe Coding两个必备Prompt技巧

卡兹克分享Vibe Coding两个必备技巧：1"从第一性原理出发“--强制AI回归问题本质，曾助其发现海外信源抓取底层路由隐患并重构；

7月3日

Grok Build上线Firecrawl插件

尝试 Grok Build 插件市场中的新 Firecrawl 插件

7月3日

Fable工作法：发现未知以优化提示

我发现，使用 Fable 最关键的是发现自己的未知，以便更好地对它发出提示；以下是我的方法

7月3日

Fable 5 前端 Skill 对比：6 Subagent 生成42页

Vista 在 Happycapy 平台上使用 Fable 5，安装了 5 个流行前端设计 Skill，加上模型默认共 6 种配置。

7月3日

Fable 5 仅回退少量编码任务至 Opus 4.8

Testing Catalog 引用 @trq212 澄清更新后的分类器：并非所有编码任务都会从 Fable 5 路由到 Opus 4.8，

7月3日

Every 团队使用 Codex 的深度实践

Five team members with different backgrounds （Natalia， Dan， Katie， Austin，

7月3日

DeepReinforce 发布开源智能体编码大模型家族 Ornith-1.0（MIT 许可）

DeepReinforce 发布 Ornith-1.0，一个 MIT 许可的开源智能体编码大语言模型家族，

7月3日

Cursor 深圳工作坊7月22日举办

邵猛预告深圳 Cursor Workshop 将于7月22日举行。

7月3日

Cohere发布North Mini Code：面向开发者的开源编码模型

Cohere发布North Mini Code，一款30B参数MoE模型（3B活跃参数），Apache 2.0开源。

7月3日

Codex 使用限制即将重置，修复消耗过快问题

Codex 使用限制将在下一小时完全重置，额外一次未来24小时重置。

7月3日

Claude自动模式新增Pro计划与模型支持

自动模式的两项更新： · 现已在Pro计划中提供 · 现已支持Sonnet 4.6，以及Opus 4.7 按下Shift+tab，让Claude运行

7月3日

Claude Desktop Linux版正式发布

你们要求，我们听取。Claude Desktop Linux版来了！下载链接：https：//code.claude.com/docs/en/desk…

7月3日

ChatGPT移动端支持Codex，实现跨设备协作

你的笔记本电脑可以留在家里。通过ChatGPT移动应用使用Codex，随时随地回答问题，之后还能在电脑上继续同一对话

7月3日

Browser Use CLI 3.0 发布

Browser Use CLI 3.0 发布，体积较旧框架缩小6倍，token消耗更低。

7月3日

Anthropic内部演讲：99%工程师运行300+自改进agent swarm

Anthropic内部透露，99%工程师运行300+自改进agent swarm。

7月3日

Anthropic Fable 5 今日重新发布

Anthropic 的 Fable 5 于今日重新发布。我希望这是真的

7月3日

6倍速！Kimi K2.7 Code 高速版已上线

Kimi K2.7 Code 高速版上线，与普通版为同一模型，输出速度约 5-6 倍，常规编程场景约 180 Token/s，

7月2日

阿里巴巴发布 Page Agent：开源 JavaScript 库实现网页 DOM 自然语言操控

阿里巴巴发布 Page Agent，一个开源的 JavaScript 客户端库，嵌入网页后可通过自然语言指令直接操作 DOM 元素。

7月2日

硅基流动联合CodeWhale推出DeepSeek V4终端最佳性价比组合

硅基流动宣布，通过V4-Pro（质量）与V4-Flash（速度）两行配置，即可在终端获得DeepSeek V4的最佳性价比组合。

7月2日

智谱：GLM-5.2将面向GLM Coding Plan全量用户开放

据智谱消息，今晚5:21，GLM-5.2将面向GLM Coding Plan全量用户开放，覆盖Lite / Pro / Max / 团队版。

7月2日

开源插件为Codex App增添高级功能

一个开源项目允许用户增强Codex App的功能。即使通过API登录，也能通过安装插件的方式启用Computer Use特性并添加Goal指令。

7月2日

将你的本地GitHub会话带到任何地方

GitHub为Copilot功能推出了远程控制会话能力，并已全面上线。

7月2日

实测Codex Record & Replay：把RPA自动化工作流重做了一遍

Codex新功能Record & Replay可将浏览器操作录制成可复用的Skill。

7月2日

Senior SWE-Bench：评估AI智能体作为高级工程师的基准测试

Senior SWE-Bench是一个开源基准测试，用于评估AI智能体完成高级软件工程师级别任务的能力。

7月2日

Replit六月发布内容汇总

Replit新动态：我们六月发布的所有内容！

7月2日

Replit Agent与Squidler集成，实现全自动化AI质量保障

Replit Agent与Squidler已完成集成，形成一套完整的AI驱动质量保障闭环。

7月2日

OpenAI Codex /goal功能正式发布及使用指南

OpenAI宣布Codex的/goal模式已结束实验，成为稳定功能。

7月2日

Lee Robinson 加入 Cursor 从事 ML 训练 Composer

个人动态，我在 Cursor 开始新职位！我正在转向 ML，负责训练 Composer。我将研究如何改进模型行为和个性

7月2日

Fable与长期智能体组织未知

我一直在阅读各种关于为Fable开发工作流最佳方式的帖子，这提醒我，我们对长期运行智能体的最佳工作组织方式知之甚少。

7月2日

Fable 5 分类器误判致 75% 代码路由到 Opus

用户 @bridgemindai 披露一次编码会话花费 $321，其中 Fable 5 仅完成 $78（约 25%），

7月2日

Fable 5 仅 4.44 美元搭建 Rube Goldberg 机器

用 Fable 5 构建的鲁布·戈德堡机械，仅需 4.44 美元 👀 提示词在此：

7月2日

Databricks 凭借 AI 智能体登顶 NVIDIA SOL-ExecBench kernel 排行榜 L1 single operation 赛道

Databricks 在 NVIDIA SOL-ExecBench kernel 排行榜 L1 single operation 赛道排名第一，

7月2日

CursorBench 3.1

CursorBench 3.1 新增代码库理解、bug 查找、规划和代码审查任务，并改进了编辑任务的评分标准。

7月2日

Codex周四更新：Appshots功能上线

又是Codex周四，我们带来了更新。首先是Appshots，一种将你工作上下文引入Codex的新方式。

7月2日

Codex 推出 iOS 应用构建插件

更多 iOS 应用循环，现已集成至 Codex。 Build iOS Apps 插件让 Codex 可在应用内浏览器查看和测试你的 iOS 应用，

7月2日

Claude fable 5 自主提交工单交流

看着Claude fable 5为了解决问题，自己去火山引擎上提交工单，然后跟火山的工程师交流，给我看懵了

7月1日

阿里云发布AgentScope Java 1.1及Claw等新功能

🚀 AgentScope Java 1.1：构建可自我进化的智能体 ✨ Claw：具备Shell访问权限的本地“MinQwenPaw” ✨ Builde…

7月1日

程序员问 skill 脚本语言，调侃自然语言最吊

程序员小北发文问大家：skill 中的脚本用 Python 好还是 TypeScript 好？并附上 😂 表情。

7月1日

神鞭比喻：AI时代工匠精神不灭

宝玉引用天津卫神鞭故事：傻二靠祖传辫子练成绝技，洋枪一响辫子断，后改练双枪，弹无虚发--"辫子剪了，神留着"。以此类比AI冲击下程序员的工匠精神。

7月1日

用 Genkit 构建智能体全栈应用

开源框架 Genkit 推出 Agents API，将消息历史、工具循环和流式传输封装为单一接口，简化对话 AI 开发。

7月1日

智谱 GLM-5.2 全量开放，支持 1M 上下文且下周开源

GLM-5.2 是智谱迄今能力最强的开源模型，支持真正可用的 1M 上下文，在长程任务中继续保持领先，并被智谱称为最强的国产 Coding 模型。

7月1日

我认为 Anthropic 和 OpenAI 找到了产品市场契合点

Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点，这导致企业客户成本显著上升。

7月1日

发布 Kotlin版ADK与Android版ADK 0.1.0：在Android及其他平台构建AI Agent

Google发布了面向开发者的新工具包：Kotlin版ADK与Android版ADK 0.1.0。这两个工具包旨在帮助开发者构建AI Agent。

7月1日

WordPress 发布 WPVibe 插件，让 Claude 接管网站管理

WordPress 推出 WPVibe 插件，连接网站后即可让已付费的 Claude 等 AI 通过自然语言直接管理整个系统，

7月1日

Snowflake CEO 实测：GLM-5.2 与 Opus 4.7 编程能力接近，成本仅为几分之一

Snowflake 内部基准测试显示，在每项任务三次尝试下，GLM-5.2 解决 66% 的编程问题，

7月1日

SkillComposer：将代码Agent技能组合视为联合决策的论文

论文提出SkillComposer，将代码Agent的技能选择与组合视为一次联合决策，用约束自回归解码器一次生成完整技能计划（包括技能、数量与顺序），

7月1日

OpenCode Zen 现已可用

现已在 OpenCode Zen 中上线

7月1日

OpenClaw v2026.6.11 发布

v2026.6.11 已发布。本次发布关注让 OpenClaw 感觉不太可靠的粗糙边缘：回复错位、发送卡住、重新连接、模型设置失败等。

7月1日

KPop 新方法让 Ring-2.6-1T 在 SWE-bench Verified 上突破 76 分

团队推出 KPop，用于稳定大规模 MoE 模型的智能体强化学习训练。

7月1日

Godot 基金会修改贡献指南，禁止 AI 直接生成代码与 AI 智能体 PR

Godot 基金会正式修改贡献指南，禁止开发者提交 AI 直接生成的代码、AI 智能体发起的 Pull Request，

7月1日

GLM 5.2 现已可在 Cursor 中试用

你现在可以在 Cursor 中试用 GLM 5.2！很高兴看到更多有用的开放模型，感谢 Fireworks 在此合作。我们的评估结果如下 ↓

7月1日

Cursor 无处不在：vibecode 场景一览

现在你可以在各种地方用 Cursor 进行 vibecode：采访 Dario、巴西世界杯比赛期间、在 Waymo 里、在 G7 特朗普和 Sam 旁边…

7月1日

Codex已经变得非常好了

QuinnyPig承认之前低估了Codex，现在发现它非常出色。Codex已变得非常好

7月1日

Codex 下载转录 @aiDotEngineer 会话并定制

要求 Codex 下载并转录 @aiDotEngineer 的所有会话，并根据我的兴趣进行定制

7月1日

Claude AI助手v2.1.144版本更新

Claude AI助手发布了v2.1.144版本。

7月1日

AI 编程独角兽 Cursor 欧洲总部落子伦敦，SpaceX 手握 600 亿美元收购选择权

Cursor 将欧洲总部设在伦敦，计划招聘约 200 名员工，并在巴黎、慕尼黑等地开设小型办事处。

6月30日

硅基流动 SiliconFlow 夏日冲刺 - GLM 5.2 周活动

硅基流动 SiliconFlow 推出 GLM 5.2 周活动。

6月30日

形式化验证：你能对软件做出哪些保证？

形式化验证的成本和工具已进入可广泛使用阶段，AI消除了编写证明的最大障碍。

6月30日

周四在中午飞书有个直播分享。大家想听 codex+飞书cli 解决什么问题？调研下，看准备的案例是否合适。直播预约地址： https：//link.feishu.io/0702demo

周四在中午飞书有个直播分享。大家想听 codex+飞书cli 解决什么问题？调研下，看准备的案例是否合适。

6月30日

吴恩达谈“循环工程”：AI代理自主测试代码，开发者转向高层决策，核心优势是“语境”

吴恩达提出“循环工程”概念：AI编码代理可自主迭代代码、测试直至正确，无需人类干预。

6月30日

做Agent自动化系统时，一个很容易踩的坑：把“放行信号”写在调用者也能写的地方

将放行信号放在PR评论等可被调用者写入的通道存在风险。

6月30日

一个人管理5款产品，80%时间不写代码？Every的复利工程

媒体软件公司Every公开「复利工程」方法论，以单人工程团队维护5款产品。

6月30日

hyperscript 解析bug修复：AI分析高效但修复方案欠佳

hyperscript 0.9.91版本出现回归：表达式`fetch \`{% url 'trade：get_symbol_data' %}？symbo…

6月30日

Vibe coding 平台 Base44 推出自研模型，AI 初创公司寻求防御性

Vibe coding 平台 Base44 近日推出自研大语言模型 Base1，基于平台数千万真实用户交互数据训练。

6月30日

T3code现支持SuperGrok与X订阅

你现在可以在 T3code 中使用你的 SuperGrok 和 X 订阅

6月30日

ScarfBench： Benchmarking AI Agents for Enterprise Java Framework Migration

6月30日

PlanBench-XL：评估LLM智能体长时域规划

PlanBench-XL 评估LLM工具使用智能体在大型工具生态系统中的长时域规划能力

6月30日

OpenAI：Agent使工程转向设定方向与审查

随着AI智能体承担更长期的工作，工程任务转向设定方向、审查工作以及围绕模型设计更好的系统。

6月30日

Notion 使用 Cursor SDK 嵌入编码智能体

Notion 通过 Cursor SDK 在数周内将编码智能体嵌入产品。

6月30日

MiniMax 参与 AI 编程栈活动谈 M3+推理

7月1日 Inside The AI Coding Stack 活动阵容公布： @nvidia - Harry Kim 谈 AI 原生工作负载的 GPU…

6月30日

Kimi 发布并开源最新代码模型 Kimi-K2.7-Code

Kimi 发布并开源最新代码模型 Kimi-K2.7-Code。

6月30日

Google发布新技能：从你的编码智能体驱动智能体质量飞轮

Google推出了一项面向编码智能体的新开发者技能，

6月30日

GitHub开源量化书《XQuant》揭示AI跨领域迁移模板

GitHub开源量化书《XQuant：人人都是量化交易员》核心是问题驱动而非知识驱动：每章提供写好的Spec，丢给Claude或Cursor生成代码，

6月30日

GLM 5.2 成本最高却受热捧

GLM 5.2 在每次会话成本上排名最高而且大家都在盛赞这个模型这意味着，如果每次会话成本高，那可能反而是模型有用的标志

6月30日

Cursor 的 iOS 版上线了，完成度很高啊锁屏的时候，还会展示当前的这个进度，然后也完成以后，会把界面的视频和图片给你发过来，让你审核当前，针对付费用户的 beta 测试已经开放

Cursor 的 iOS 版上线了，完成度很高啊锁屏的时候，还会展示当前的这个进度，然后也完成以后，会把界面的视频和图片给你发过来，让你审核当前，

6月30日

Cursor iOS 应用现已登陆欧盟

更新：Cursor iOS 应用现已在欧盟地区可用！

6月30日

Codex正在成为每个人的生产力工具

The Next Era of Knowledge Work报告指出，Codex正通过AI增强的研究、数据分析、工作流自动化与内容创作，

6月30日

Codex新功能与未来方向Keynote

一定要来参加明天的主题演讲，我将在@romainhuet 的主题演讲之后，谈谈 Codex 的新功能及其未来方向！然后同一天下午2：50，

6月30日

Codex 调查额度消耗异常：防滥用机制误判

Ola。Codex 团队正在调查一些账户使用额度消耗比预期更快的问题。我们认为这与我们的一些滥用及欺诈预防机制可能过度标记有关。敬请关注

6月30日

Cloudflare 为 AI 智能体推出临时账户

Cloudflare 在 Workers 上推出临时账户（Temporary Accounts），

6月30日

AI对话误区：提示词工程 vs 循环工程

主推文指出90%的人与AI对话的方式一开始就错了，误以为提示词工程只是写一堆提示词让AI直接完成任务。

6月29日

旧金山Agentic Engineering小型活动：三位AI演讲者分享经验

昨天在旧金山举办了一场Agentic Engineering小型活动，三位演讲者分享关键经验：@steipete强制OpenClaw贡献者使用技能，

6月29日

开发者越来越放心：无人工监督直接上线生产环境的AI生成代码占比大幅飙升

Cursor平台数据显示，过去半年里无需额外人工审核、直接上线生产环境的AI生成代码变更占比大幅飙升。

6月29日

对人工智能时代软件工程的思考

作者以软件工程师和小说家双重身份，对比AI前后的典型工作流。

6月29日

在OpenCode中使用Grok

xAI宣布，其SuperGrok或X Premium订阅用户现可在开源编程工具OpenCode中使用Grok模型。

6月29日

卧槽！来咯~ 我终于特么弄懂你们天天吹的循环工程了！！！

卧槽！来咯~ 我终于特么弄懂你们天天吹的循环工程了！！！【引用 @berryxia】：开始让美女助教卖课了😂 丝滑~

6月29日

Ornith-1.0：用于自主编程的自构建大语言模型

DeepReinforce 发布首个开源模型 Ornith-1.0（MIT 许可），

6月29日

Kimi K2.7-Code：具有更高模型 token 效率的开源编码模型

Kimi K2.7-Code 是一个开源编码模型，相比同类模型拥有更高的模型 token 效率，能够用更少的 token 完成相同的代码生成任务。

6月29日

Herdr：驻留在终端中的AI智能体多路复用器

Herdr是一个驻留在终端中的AI智能体多路复用器，允许用户在单一终端界面内管理和切换多个AI智能体会话

6月29日

Cursor Teams计划定价方案更新

Cursor Teams计划推出三项更新：增加Composer特定使用池，将第一方模型（Composer和Auto）与第三方API的使用额度分开计费；

6月29日

Cursor Mobile 随时随地运行云端智能体

过去几周我一直在路上使用 Cursor Mobile，能随时随地访问所有云端智能体，真的太棒了。出去走走，有了想法，在应用中口述下来。

6月29日

Codex自动审查模式误发.env文件给同事

Codex Auto review mode，当我让它给同事发送我的.env文件时

6月29日

Codex快捷键7月15日升级

你最喜爱的 Codex 快捷键即将升级，7 月 15 日推出。主推文问道："你觉得它有重置按钮吗？"

6月28日

小北：从电脑前解放的AI工作流实践

小北分享自2026年初践行“不要把自己限制在电脑前”的理念，逐渐形成 telegram → openclaw → claude/codex 的工作流，

6月28日

qiaomu-ai-prd：面向AI的PRD生成Prompt

推文提出AI Agent开发中人类与AI对PRD的需求不同，

6月28日

Jon Udell：AI 智能体应被邀请进入开发循环，而非将人类排除在外

Jon Udell 反对“human in the loop”的表述，认为它将权威让渡给机器。

6月28日

Hermes代理优化：搭建自复盘Memory.md记忆循环

为用户提供不依赖微调或开发的Hermes代理优化方案：通过Memory.md文件构建“会话学习-记录沉淀-迭代优化”闭环。

6月28日

Codex团队周日紧急排查用户消耗异常

Codex 团队周日待在作战室里，梳理日志，检查是否有任何可能导致部分用户使用消耗增加的情况。他们非常重视此事，不彻底查清绝不罢休

6月28日

Codex 两种计划工作：Scheduled Task 与 Scheduled Message 的区别

Codex 支持两种计划工作方式。Scheduled Tasks 每次运行创建新线程，适合无需上下文延续的任务，如每日 9 点自动总结邮件、日历；

6月27日

开源教程《Deep Agents 实战》发布

LangChain 官方认证大使 @zhanghaili0610 推出开源教程《Deep Agents 实战》，

6月27日

hf-claude 与 GLM 5.2 兼容良好

hf-claude 与 GLM 5.2 兼容良好 hf extensions 安装 hf-claude

6月27日

RiVER：无需标准答案即可训练LLM生成更优代码

论文提出RiVER方法，让LLM从没有已知标准答案的问题中学习编码行为。RiVER使模型编写多个程序，在相同隐藏测试上运行，奖励表现较优者。

6月27日

Replit：从想法到应用差距快速缩小

Rio 带来了 30，000 名创始人和开发者。我们带来了 Replit。从中得到一个启示：从想法到可运行应用之间的差距正在快速缩小，我们为此而来。

6月27日

Codex 质量更新改善长线程滚动

🆕 Codex 质量提升更新本周发布。从长线程开始：滚动现在更流畅，并且在浏览对话时你的位置保持不变

6月27日

Codex 技巧：双击 Cmd 快速创建技能

两个我喜欢使用的技能如果你使用 Codex，按下 cmd+cmd （同时按左右两个 cmd 键）然后直接说“make these two skill…

6月27日

Codex 免费重置用户使用量

Codex 所有用户将获得免费使用量重置，预计几小时内到账。已采取缓解措施，调查未发现大规模影响

6月27日

CLI错误输出应直接面向AI编码智能体 - 来自@southpolesteve的提议

软件开发社区提出，CLI工具的错误输出应直接面向AI编码智能体，而非仅显示“Error：”。

6月26日

马斯克：AI将达Stockfish级编码

AI 将实现 Stockfish 级别的编码和通用计算机使用

6月26日

苹果 Xcode 27 核心首次深度集成 AI 智能体：支持自然语言修 Bug、构建 App

在 2026 年 WWDC 期间，苹果发布 Xcode 27，其核心组件首次整合 AI 智能体，能理解 Swift 语言并通过多轮自然语言对话辅助开发。

6月26日

免费Codex被倒卖，闲鱼代装服务赚信息差

官方免费的Codex工具，在闲鱼上被当作信息差生意。有人提供代装服务，每单32元，已售50多单；还有人标价788元卖所谓正版授权，竟有17人下单。

6月26日

vibe coded应用无人问津？发布激增需求反降

没有人使用 vibe coded 应用 🤔🤔 应用发布量大幅增长，但需求信号却向错误方向移动。

6月26日

v0 发布 Design Systems 2.0

v0 推出 Design Systems 2.0，可将设计系统（组件、tokens、约定）一次性导入，此后对话均用真实组件库生成应用。

6月26日

Rasmic分享AI UI设计五步流程

Rasmic 详细讲解如何用 AI 高效制作精美 UI，核心流程为五步：收集灵感、搭建设计系统、生成组件令牌、手动微调细节、最后交给 AI 批量落地。

6月26日

Opus 4.7 14小时完成数周编码任务

一项很棒的实验，测试AI在极为雄心勃勃的端到端编码任务上的表现。Opus 4.7在14小时内构建了一个人类工程师需要2-17周才能完成的软件包。

6月26日

OpenRouter MCP 为智能体实时选择模型

推出 OpenRouter MCP，将实时模型智能直接嵌入你的智能体你的智能体负责构建和交付，但在为具体任务选择合适模型时，

6月26日

Mythos/GPT-5.6动态生成复杂工作流效果引好奇

动态工作流（即时生成测试工具）是测试时计算的一种新形式。但大语言模型并不擅长构建它们。我经常需要引导AI智能体来生成复杂模式。

6月26日

MirrorCode：AI软件工程能力达数周

AI能执行的最大软件工程任务是什么？为此，我们构建了MirrorCode，一个长期SWE基准测试，允许AI一次自主编程数天。

6月26日

MiniMax M2.7 免费智能体编程限时开放

在 @OpenHandsDev 上使用 MiniMax M2.7 进行免费智能体编程？是的，请给我！限时提供 ⚡👀

6月26日

MIT研究：AI编码工具使代码提交量暴增但实际发布仅增30%

MIT 论文分析 10 万+ GitHub 开发者使用三代 AI 编码工具的效果：自动补全使提交量增 40%，交互式智能体增 140%，

6月26日

GPT-5.6 编程极强，盼尽快开放

GPT-5.6 在编程方面极其强大且快速。我希望我们能尽快将其提供给所有人

6月26日

GLM 5.2 以 CursorBench 成本跻身 Opus 前沿

GLM 5.2 在 CursorBench 上处于 Opus 前沿（在成本方面），这正是导致前沿实验室利润下降的原因

6月26日

Epoch AI 与 METR 发布 MirrorCode 基准：AI 模型需从头重新实现完整程序

Epoch AI 与 METR 发布新基准 MirrorCode，要求 AI 模型在无源程序代码的情况下从头重新实现完整程序。

6月26日

Claude 是否增加了 rsync 中的错误？

一篇 Hacker News 热门帖子（105 分）提出了 Claude 是否导致 rsync 工具中 bug 增加的问题，并附有分析链接

6月26日

CVE-2026-LGTM 事件报告：两个 AI 代码审查智能体分歧循环致 $41，255 推理费用

两个来自不同供应商的 AI 代码审查智能体，在审查一个下游 PR 中的 `foxhole-lz4` 包时，就包是否恶意陷入分歧循环。

6月26日

AI 明年将取代所有计算机工作

描述你想要的结果比亲自动手做要容易得多明年所有计算机工作都将由 AI 完成。

6月25日

飞书Cli+Codex实现对话记账

通过飞书Cli工具与Codex结合，实现自然语言记账：终端执行`npx @larksuite/cli@latest install`安装飞书Cli，

6月25日

谷歌重组AI编程“突击队”，力求在利润丰厚的市场中追赶Anthropic

6月25日

核心研究员接连离职后，消息称谷歌重组 AI 编程小组试图追赶 Anthropic

知情人士透露，谷歌正对其主攻AI编程工具的专项攻坚小组进行重组，调整模型训练思路，既要提升代码能力，也要强化生成演示文稿等其他场景能力。

6月25日

glm-5.2 为 Krea-2-Turbo 开发 Gradio 工作流

glm-5.2 在 hf-claude 中，正在为 Krea-2-Turbo 开发一个 gradio 工作流

6月25日

Seed2.1 正式发布，深入 AI 生产力

字节Seed发布Seed2.1系列，面向真实生产力场景的智能体，强化通用Agent能力、代码工程交付与多模态理解。

6月25日

Grok Build Beta版向SuperGrok用户开放

Grok Build 现已面向所有 SuperGrok 和 X Premium+ 用户推出 Beta 版。

6月25日

GitHub Copilot CLI 推出自定义 AI 智能体，将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能，使 CLI 能够理解开发者的技术栈和团队工作流，

6月25日

GLM-5.2 火出圈，Flowith Matrix 接入并送 1000 万 tokens

GLM-5.2 近期火爆出圈，尤其海外用户兴奋，国内用户则因抢不到 coding plan 而不爽。

6月25日

Figma更新：新增代码层、动画和AI功能

Figma本周三发布更新，直接在协作画布中加入代码层，支持团队克隆仓库并将代码流程提取为设计图层。

6月25日

Codex用户自己选模型还是让产品决定

当你使用 Codex 时，你是想自己选择模型和推理努力程度吗？产品应该根据任务自动选择吗？什么会让你信任那个选择？你是那种总是使用 extra h…

6月25日

Codex+DigitalOcean：一键启动持久云开发环境

现在可以通过 Codex 的 DigitalOcean 插件，用一条提示词启动持久云开发环境，该环境运行在你的 DigitalOcean 账户中，

6月25日

CRED创始人：90%代码已由AI编写，生产率差距拉大

印度头部金融科技公司CRED创始人Kunal Shah表示，目前公司90%的代码由AI编写。

6月25日

Apodex 免费内测 6 月 29 日结束，早鸟可延 2 周

AI 工具 Apodex 发布收费通知：免费内测将于 6 月 29 日结束，之后开始正式收费。

6月25日

AI模型擅构思不擅决策

"嘿 Codex，给我这个页面做 20 个变体，每页一个按钮用来切换“ ”好，选变体 4" AI 模型很擅长头脑风暴，但不擅长做决定，所以这样用它们就好

6月24日

贝恩用AI快速原型（vibecoding）重建目标软件副本以测试收购标的竞争力

贝恩在测试收购目标时，使用vibecoding（AI快速原型开发）重建目标软件的粗略AI副本。

6月24日

聊聊智谱市值破万亿为什么不是高估

作者在自研的硅基骑手参考评测（silicon-rider-bench）中累计测试30个模型，

6月24日

用Codex构建，秀出你的方式

展示你如何使用 Codex 构建。凌乱的桌子、整洁的桌子、沙发上的桌子、机场地板的桌子。我们不会评判工作空间。

6月24日

字节跳动技术副总裁洪定坤：AI Coding 的实践与探索

在火山引擎Force大会，字节跳动技术副总裁洪定坤分享AI Coding实践。

6月24日

字节火山引擎大会：洪定坤谈AI开发新范式

字节火山引擎大会上，洪定坤分享了AI开发的三个核心方法论：1. 原型驱动开发--用AI生成可交互原型替代PRD，提前暴露分歧。

6月24日

Prompt Engineering已死，Loop Engineering接棒

推文认为Prompt Engineering终结，Loop Engineering取而代之。

6月24日

PawBench：给通用智能体一把可度量的尺

6月24日

OpenClaw 2026.6.10 版本发布，多项改进

🦞 OpenClaw 2026.6.10 刚刚发布。

6月24日

Open Code Review - 一款基于人工智能的代码审查命令行工具

Open Code Review 是一个基于人工智能的代码审查命令行（CLI）工具，旨在帮助开发者通过自动化的方式提升代码审查效率

6月24日

MiniMax M3与OpenCode构建仿人机器人目录

用户@whosamberella为学习仿人机器人知识，利用MiniMax M3进行调研，

6月24日

Meta-Agent Challenge：自主智能体开发能力评估框架

论文提出Meta-Agent Challenge（MAC）评估框架，测试前沿模型自主开发智能体系统的能力。

6月24日

M3成为Kimchi Coding默认模型

M3 现在已成为 @cast_ai 旗下 Kimchi Coding 的默认构建模型。并非所有编码任务都应使用同一个模型。

6月24日

GLM-5.2 ARC-AGI-2 得分 22.8%，成本 $0.25

GLM-5.2 在 ARC-AGI-2 上取得 22.8% 的成绩，成本 $0.25/任务值得注意的是，大约 2025 年 5 月，

6月24日

Codex 三天不眠让应用终跑在 Windows 上

半夜醒来，看到这台电脑开着。就是我给联合创始人买的那台 Windows 电脑，这样他就能让 Codex 连续工作三天，

6月23日

Vercel eve框架：一切皆文件，快速构建智能体

Vercel 的 eve AI 智能体框架将所有内容（工具、技能、评估）都视为文件，让你能快速上手构建 AI 智能体。

6月23日

Momentic发布测试平台，解决AI编码的QA瓶颈

AI编码速度提升但QA成为新瓶颈。Momentic推出测试平台，其智能体可读取Linear工单、Notion PRD和PR差异等产品记忆，

6月23日

Atomic Chat 让 Cline 在本地 AI 模型上运行代码智能体

Atomic Chat 集成 Cline，使代码智能体能在本地 AI 模型上运行。

6月23日

AI测试应成为编码应用一等特性

显然，每个PR都会带来100%覆盖的AI应用测试，它会尝试界面中的每个按钮以确保其按预期工作。

6月22日

Antigravity生态：面向智能体的开发平台

全新的 @Antigravity 生态系统是您终极的智能体优先开发平台。

6月19日

Salesforce CodeGen教程：生成、验证并重排序Python函数（含单元测试与安全检查）

本教程实现一个基于Salesforce CodeGen的端到端代码生成工作流。

6月17日

瑞穗：Agentic AI将重估EDA市场空间楷登电子与新思科技有望成为主要受益者

瑞穗认为，Agentic AI将改变EDA商业模式。

6月16日

GLM-5.2 上线并开源：专注 Coding 与长程任务

GLM-5.2 已发布并开源，采用 MIT 协议，支持 1M 上下文窗口。

6月15日

GitHub Copilot CLI 初学者指南：常用斜杠命令概览

GitHub Copilot CLI 为初学者提供了常用斜杠命令的概述，帮助用户通过命令控制终端中的 AI 智能体

6月12日

减少AI生成前端界面粗糙度的文章

本文介绍如何减少AI生成前端界面的粗糙度，发表于envs.net。

6月12日

Spec 驱动开发（SDD）的三个 Skills：覆盖 Spec→Implement→Verify 闭环

邵猛分享 Spec 驱动开发（SDD）方法，用三个 Skills（/write-product-spec、/write-tech-spec、/valid…

6月11日

Cursor 推出 Auto-review 机制：用分类器智能体动态管控智能体自主权限

Cursor 近日推出 Auto-review，通过一个专门的分类器智能体在工具调用前审查动作风险。

6月11日

Codex 维护仓库：5分钟循环并行自治

一个简单的循环：告诉 Codex 维护你的仓库，每5分钟唤醒一次，将工作直接分配到线程。这样可以轻松按需并行化和导向工作。

6月10日

通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能

GitHub Copilot CLI 现在可以通过安装和配置 LSP（Language Server Protocol）服务器来替代原始的暴力 grep…

6月10日

摩尔线程开源 MusaCoder 代码大模型，9B/27B 参数基于国产 GPU 全链路训练

摩尔线程发布并开源 MusaCoder 代码大模型，含 9B 和 27B 两个参数规模，

6月10日

Grok编程智能体登陆Kilo IDE平台

在 @kilocode 中使用您的 SuperGrok 或 X Premium+ 订阅。

6月10日

Cursor Bugbot 更新：速度提升超 3 倍、成本降低 22%、发现更多 Bug

Cursor 的代码审查工具 Bugbot 迎来重大更新：运行速度提升超 3 倍，成本降低 22%，每轮审查多发现 10% 的 bug，

6月9日

仅凭一份文档，Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下，Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档，

6月9日

FrontierCode 基准测试：AI 编程评估新标准--维护者审核通过率最高仅 13.4%

Cognition 发布 FrontierCode 基准测试，

6月8日

Kimi Code 焕新升级（附视频教程）

6月8日

Cognition的Scott Wu表示：AI编程智能体不应取代人类

Cognition公司开发了Devvin，这是一个号称首个且最成功的AI编程智能体。

6月8日

Anthropic：AI编码快于生物学的缘由

新的科学博客：为什么 AI 在编码方面的进步比在生物学方面更快？对智能体而言，生物数据库就像汽车发明前建造的城市--开进去会让人抓狂，

6月5日

腾讯高级执行副总裁汤道生：今年腾讯大部分代码都由 AI 生成

在 6 月 5 日的腾讯云 AI 产业应用大会上，腾讯高级执行副总裁汤道生表示，今年腾讯大部分代码都由 AI 生成，工程师将更多时间用于架构设计，

6月5日

一个非常狠的AI教学提示词：追问式检查清单教学

这是一则AI提示词，让AI扮演极度严格的老师，通过逐阶段教学、持续维护MD检查清单来确保用户真正理解。

6月5日

Arena 发布真实世界 AI 智能体排行榜 Agent Arena

Arena 推出基于真实用户任务的智能体排行榜，评估模型在代码编写、应用构建、文档分析等工作中的表现，而非孤立基准。

6月3日

智能体工程实战窍门全录

该内容源自@mvanhorn的分享，介绍了“智能体工程”如何重塑软件开发。

6月3日

Cursor Enterprise 推出 Organizations 组织管理功能

Cursor Enterprise 正式推出 Organizations 结构，允许企业在统一面板中管理多个团队。

6月2日

Warp现已支持OpenRouter接入

OpenRouter现已在@warpdotdev中得到支持！❤️ 工程师Dagm Assefa展示了如何连接DeepSeek和OpenRouter。

6月2日

Replit Canvas：智能体设计工具发布

最好的设计工作不会在聊天框里发生。你需要空间来探索想法、创建变体并进行迭代。认识新的 Replit Canvas。

6月1日

Replit 用单个提示词构建完整业务

你能用单个提示词免费构建一个真实的业务吗？从今天起，在 Replit 上，答案是肯定的。从一个提示词开始，获得一个网站、移动应用、幻灯片和发布视频。

5月29日

OpenRouter支持模型生成文件补丁

OpenRouter 现已支持 "apply_patch"，这是一个服务器工具，

5月29日

Cursor 团队发布《开发者习惯报告》

报告显示，AI正深刻改变开发工作形态。开发者周均代码产出从约3.6K行增至8.6K行，更大规模的PR（千行以上）占比上升。

5月29日

Codex可自主管理对话线程与并行任务

Codex用于管理Codex界面：【引用 @guinnesschen】：如果你厌倦了管理Codex对话线程，

5月28日

四步保障AI生成应用安全

如何用四步保障你的vibecoded应用安全 🔒 速度若无安全加持，便是隐患。以下是使用Replit发布应用时，如何避免留下后门的方法。 🧵展开阅读 ↓

5月28日

OpenClaw 2026.5.27 版本发布

OpenClaw 2026.5.27 已上线 🦞 🔒 更严格的运行时/安全边界 ⚡ 更快的网关 + 回复路径 🧠 更稳定的 Codex/应用服务器内存…

5月27日

Replit入选Redpoint 2026 InfraRed 100榜单

Replit 被列入 @Redpoint 的 2026 InfraRed 100 榜单。这是一份构建 AI 运行基础设施的公司名单。

5月27日

OpenCode与MiMo V2.5限时免费开放

OpenCode x MiMo V2.5 - 限时免费 1M 上下文 • 推理 • 文本 • 图像

5月26日

Replit 应用添加登录的两种方式

在 Replit 上为你的应用添加登录有两种方式： → Replit Auth：零配置，

5月24日

面向 Codex 的自我优化提示词框架

这是一个结构化的提示词，用于指导 Codex 自动分析其历史记录以识别并固化重复工作流。

5月22日

新增差异标记样式设置选项｜已发布剪纸功能：外观设置中新增差异标记样式。在查看差异时更喜欢经典的 + / - 标记？现在你可以选择使用它们，而不仅仅是彩色差异条

新增差异标记样式设置选项｜已发布剪纸功能：外观设置中新增差异标记样式。

5月22日

v2.1.149 更新摘要

本次 v2.1.149 更新包含功能增强、企业设置和多项修复。

5月22日

X平台发布体验差，ChatGPT插件助发布

推文批评X平台产品经理能力不足，发布文章体验糟糕。

5月22日

Karpathy的CLAUDE.md四条规则让AI编程准确率飙升至94%

Karpathy发布的CLAUDE.md文件以其简洁高效的AI编程指导原则引爆GitHub，获得超22万星标并登顶趋势榜。

5月22日

Kakuna：自动化加固代码库的AI代理工具

Kakuna是一款AI代理工具，旨在将早期快速原型自动转化为可维护的生产级代码库。

5月22日

GitHub 连续第三年被 Gartner® 魔力象限TM 评为企业级 AI 编程代理领域的领导者

Gartner 最新发布的魔力象限报告中，GitHub 连续第三年被列为“领导者”象限，该评估专注于企业级 AI 编程代理领域。

5月22日

Cursor 被评为 2026 年 Gartner 企业级 AI 编码代理魔力象限领导者｜Gartner 在 2026 年魔力象限报告中，将 Cursor 评为

Cursor 被评为 2026 年 Gartner 企业级 AI 编码代理魔力象限领导者｜Gartner 在 2026 年魔力象限报告中，

5月22日

Antigravity付费版Gemini配额再翻三倍

更新：所有付费@Antigravity层级的*每周*Gemini配额已再次提升至三倍，且配额已正式重置

5月22日

18 年老粉与微软 GitHub 决裂：我希望它更好，但我更想编程

全球最大的代码托管平台GitHub正面临严重危机。资深开发者Mitchell Hashimoto公开与平台决裂，因频繁崩溃影响编程。

5月21日

构建云端智能体的经验总结

云端智能体已从本地智能体的简单扩展，发展为具备独立环境、可并行无人值守处理长任务的系统。

5月21日

v2.1.147版本更新

本次更新引入了`Workflow`工具，支持确定性多智能体编排（默认关闭）。

5月21日

Replit企业版现已开放自助购买

Replit Enterprise现已支持自助服务！几分钟内即可： - 购买Replit Enterprise - 配置SSO + SCIM - 与团…

5月21日

Codex实现全天候跨设备安全操控Mac

Codex随时随地，无处不在。现在您的Mac无需解锁，Codex即可使用您的电脑。

5月20日

SpecBench：测量长期编码代理中的奖励黑客行为

长期编码代理在优化测试通过时可能偏离用户真实目标，导致奖励黑客现象。

5月20日

Google Stitch更新：AI设计助手实现全流程构建

Google推出了其AI设计伙伴Stitch的多项重要更新。新功能支持实时流式构建设计，允许用户在不中断流程的情况下直接进行编辑和互动反馈。

5月19日

QoderWork推出Design Desk无限画布AI工作区

🎨 介绍QoderWork的Design Desk。一个将语言转化为可运行代码的无限画布AI工作区。

5月18日

Anthropic收购SDK平台Stainless

Anthropic正在收购@stainlessapi，这是一个SDK和MCP服务器平台，自我们API早期以来就为所有Anthropic SDK提供支持。