← 端侧AI、本地推理与云端成本

大厂把大模型压进设备端

苹果推出AFM与Apple Core AI框架并将Gemini塞进iPhone驱动新Siri,iPhone18内存升至9GB为端侧AI预留空间。头部厂商正把推理从云端下沉到设备端,对端侧语音路线的内存、NPU与系统层配套形成需求牵引,也抬高了整机的存储与算力配置门槛
7月3日
苹果 iPhone 18/18e 有望升级 9GB 内存,仍缺席 2 项 Siri AI 功能
科技媒体 MacRumors 指出,2027 年登场的 iPhone 18 和 iPhone 18e 可能升级至 9GB 内存,
7月2日
面壁智能入选2025北京市数字经济标杆企业,以端侧AI夯实数实融合底座
面壁智能于7月2日入选“2025北京数字经济标杆企业”榜单,因在端侧大模型领域的技术创新与产业落地成果获认可。
7月2日
Apple 正努力将庞大的 Gemini 模型塞进 iPhone 以驱动新 Siri
Apple 正尝试将大型 Gemini 模型集成到 iPhone 中,以支持全新的 Siri 功能。
7月1日
苹果发布第三代 Apple Foundation Models(AFM)
苹果推出第三代 Apple Foundation Models(AFM)基础模型家族,与 Google 合作定制,包含五个模型,
7月1日
今日早报:本地AI补齐工程栈、LongCat万亿模型落地国产算力、美图应用方法论
本地AI倡导者Ahmad Osman指出开源与闭源差距缩至4-8个月,但缺搜索、工具、Agent等基础设施。
7月1日
Osaurus:Mac本地AI工作台,自动切换模型原生图像生成
Osaurus AI App 推出 Mac 原生 AI 工作台,不是浏览器套壳,而是用 Swift 在本地运行图像生成。
7月1日
MiniCPM-V 4.6 边缘部署获赞
真的写得很好且实用。👍 我们很欣赏你如何拆解整个本地管道,
6月30日
库克与欧盟科技主管就新版Siri AI举行建设性会谈
苹果CEO库克与欧盟科技事务负责人维尔库宁就新版Siri AI在欧推出举行建设性视频会议。
6月30日
Unsloth 将 GLM-5.2 压缩为 1-bit GGUF,本地创意输出不逊闭源模型
Unsloth 将 GLM-5.2 压缩为 1-bit GGUF 量化版本,
6月30日
Android总裁谈AI解放用户与OS智能化
与 @ssamat(Android 总裁)的对话:AI 如何让我们摆脱对设备的微观管理,为什么以技术对真实用户的帮助来引领对 Android 至关重要,
6月29日
苹果 iOS 27 Beta 2 固件曝光:百度视觉搜索组件现身
iOS 27 Beta 2 固件代码显示新增 SearchPartnerInferenceProvider 组件,
6月29日
MiniMax M3 本地运行演示:3台Mac驱动428B模型,自主智能体完成股票组合
MiniMax官方转发了Gradient、Parallax和GenericAgent团队的演示结果。
6月28日
受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线
由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。
6月27日
苹果 iPhone 18 Pro 芯片 A20 Pro 爆料:更强散热和 NPU,支持 96-bit 位宽 LPDDR6 内存
6 月 26 日爆料显示,苹果 iPhone 18 Pro 搭载的 A20 Pro 芯片将采用 WMCM 封装替代 A19 Pro 的 PoP 方案。
6月26日
苹果将跳过高端M6芯片,转向专注于AI的新一代Mac处理器
苹果正在调整Mac芯片战略,计划最早今年为入门级Mac推出基础版M6处理器,但将跳过该芯片的高端版本,转而直接推出专注于人工智能的新一代处理器系列。
6月25日
爆料称索尼 PS6 将搭载 AI 帧生成等技术,目标 4K 120 帧游戏体验
爆料称,索尼 PS6 将融合视频帧插补(VFI)、PlayStation 超分辨率技术(PSSR)及 AI 光线追踪,以实现 4K 120 帧游戏。
6月25日
Gemma 4 设备端智能面向所有人
Gemma 4… 为每个人带来设备端智能!
6月24日
MiniCPM-V 4.6 本地照片助手,注重隐私
Nice work 👍👍@TechlatestNet Telegram 上的本地照片助手,搭载 MiniCPM-V 4.6,无需云端 OCR,
6月24日
MiniCPM-V 4.6 在 Apple Core AI 上高速运行
🥳感谢分享,@MLBoy_DaisukeMajima 🚀 MiniCPM-V 4.6 在设备上以这样的速度运行,
6月24日
Counterpoint:2026年支持GenAI的智能手机出货占比达45%
Counterpoint Research预测,2026年具备GenAI能力的智能手机出货量占比45%,高于2025年的36%。
6月23日
满血GLM5.2本地部署成2026年新炫富方式
网友分享一张AI生成图,图中Exo集群的网线、C口、电源线等硬件细节明显错误,暴露了图片是AI所作。
6月23日
FUTO Swipe 滑动输入模型架构说明
FUTO Swipe 采用三种模型:Encoder 模型通用且与布局、语言无关,用于一般滑动输入预测,精度非顶尖;
6月15日
项目负责人揭秘为何苹果 AI 版 Siri 姗姗来迟:推倒重来,彻底重构
苹果AI版Siri迟迟未上线,项目负责人迈克·罗克韦尔在WWDC技术分享会上透露,去年团队曾做出在原有Siri基础上小幅改良、新增工具调用的可运行版本,
6月13日
Apple Core AI 框架
一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。
6月11日
MNN 适配 SME2 使 Qwen3-VL-4B 在端侧实时推理
MNN 推理引擎深度适配 Arm SME2 指令集,
6月10日
高盛:苹果AI Siri有望带动iCloud+变现和设备换新
高盛在苹果WWDC 2026会后报告中表示,苹果此次发布的Apple Intelligence与Siri AI基本符合预期,整体偏正面,
6月8日
Apple Intelligence 将强大 AI 能力融入日常体验
Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,
6月7日
苹果秘密会议内幕:它终于认真对待AI
苹果在一次内部秘密会议后,终于决定将AI作为核心战略。这场会议促使公司全面转向AI领域,相关进展预计将在WWDC 2026上公布
6月4日
Meet OpenJarvis:一个本地优先的设备端个人AI智能体框架,支持工具、记忆与学习
Stanford 研究人员发布 OpenJarvis,一个完全在设备端运行推理、智能体、记忆与学习的开源框架。
6月2日
MiniCPM-V 4.6 现已支持 vLLM v0.22.0
MiniCPM-V 4.6 现已完全支持 vLLM v0.22.0! 无需自定义分支,无需额外编译。 只需拉取预构建包即可运行。
5月26日
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上
面壁智能开源其新一代端侧大语言模型MiniCPM5-1B。