← 端侧AI、本地推理与云端成本

企业开始勒紧云端AI开支

这条讲各大公司在砍AI花销:特斯拉给员工每周AI用量封顶,花旗、Adobe、微软等限制用最贵的旗舰模型,还出现四个月花光全年预算的案例。风向是云端AI太贵、企业转向更便宜的模型,一部分能本地跑的活儿开始往设备端挪
7月4日进过日报
特斯拉限制员工AI使用开销 美国多家科技企业收紧AI支出
据报道,特斯拉公司将从本月6日开始,限制员工在人工智能工具上的开销。类似措施也被其他多家美国科技企业采用。
7月3日
曝特斯拉紧急限流 AI 开支:员工每周使用费封顶 200 美元,xAI 测试版除外
特斯拉将从7月6日起将员工AI使用费用限制在每周200美元以内,xAI产品测试版不受限。
7月3日
Tesla AI工程师月预算800美元成新基准
面向软件工程师的新AI预算基准可能刚刚落地:每月800美元。 这是Tesla新的AI支出线。
7月3日
Jamesob 本地运行 SOTA 大语言模型指南
Jamesob 发布预算 $2k 到 $40k 的本地部署方案。
7月3日
Claude 再次遭遇服务中断
Claude 又挂了
7月2日
花旗、Adobe等企业限制员工使用AI旗舰模型以控制成本
据404 Media获取的内部资料,Atlassian、Adobe、亚马逊等六家企业正限制员工使用AI工具,要求改用能力较低的大模型避免成本失控。
7月2日
消息称美团内部全面限用豆包大模型,此前曾限用阿里云 Qwen
7月2日,美团内部通知要求所有业务团队自查并规划将现有豆包相关业务迁移至自研LongCat、DeepSeek等模型,无法迁移的需提交原因并走单独审批。
7月2日
微软AI负责人:Anthropic模型太贵,正自研更便宜的替代模型
微软AI部门负责人表示,Anthropic推出的模型成本过高,公司目前正在内部研发更廉价的替代模型,以降低成本
7月2日
借用夜晚:将闲置推理GPU回收用于研究
Runway 开发了名为 deckard 的容量控制器,在生产推理集群与研究集群间动态重分配 GPU。
7月1日
本地功能也付费:Meta AI 眼镜“对话增强”每月免费额度 3 小时,想多用得付 19.99 美元买订阅
Meta 近日更新 AI 眼镜“对话增强”规则:免费用户每月限 3 小时,
7月1日
你的AI账单失控了。Cloudflare现在可以解决这个问题
Cloudflare AI Gateway新增实时消费限制功能,防止跨多个AI提供商的token账单失控。
6月30日
继专业版订阅会员之后,豆包将推云存储空间付费扩容服务
字节跳动旗下AI助手豆包的服务协议新增云存储扩容条款,成为继专业版会员后第二个付费项目。
6月30日
SemiAnalysis:企业Token预算与TokenMaxxing
TokenBudgeting: 我们与企业关于Token支出的对话 TokenMaxxing真的曾广泛存在吗? https://newsletter.s…
6月29日
组织AI成本困局:领导层缺失决策
组织内 token 成本成为问题的一个重要原因是领导层没有就如何使用 AI、因此需要改变哪些流程以及如何考虑多人协作做出决策。
6月28日
Wayfinder Router:在本地和托管的大语言模型之间进行确定性查询路由
Wayfinder Router 通过分析提示词的结构(长度、标题、列表、代码)和措辞(证明、数学、硬约束),在微秒级完成路由决策,
6月27日
"UBS:60%企业转向便宜模型与中国开源模型"
"UBS报告称,60%关注AI预算的企业正转向更便宜的模型和中国开源模型。用户月花费高达$35K,团队超配额200%,公司内部AI工具从5个削减至2个。
6月26日
企业紧急阻止员工用AI处理小任务耗尽预算
企业此前鼓励员工最大化使用AI预算并设立内部排行榜,如今发现token消耗高昂收益甚微,开始进入token配给时代。
6月24日
阿里云SMB AI云服务降本50%
如果你经营一家中小企业,基础云已不足以支撑AI增长。 升级到AI就绪的云服务,旨在减少扩展缓慢和AI瓶颈。
6月16日
微软考虑为 Copilot Cowork 集成 DeepSeek V4
微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本,作为更便宜的模型选项。
6月15日
智能体AI治理:你的API密钥就是护栏
智能体AI使用量将在未来两年急剧上升,但治理滞后--仅五分之一企业拥有成熟治理模型。
6月11日
什么是 LLM 网关?应用与 AI 模型之间缺失的一层
缺少 LLM 网关时,供应商中断会直接变成用户可见的错误,AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案
6月5日
美企苦高价AI久矣?DeepSeek登上趋势榜第一
根据美国企业指出管理平台Ramp日前最新报告,DeepSeek登上“软件趋势榜单”第一。
6月5日
AI的微型钢厂
作者通过技能蒸馏将78%的AI工作交由Mac本地模型处理,仅复杂任务发往云端。智能体自动分类任务:简单任务本地数秒完成,复杂任务路由至云端。
6月3日
优步每月 1,500 美元的 AI 使用上限为 AI 工具定价提供参考
优步将 AI 工具每月使用上限定为 1500 美元,这一做法为行业 AI 工具定价提供了有价值的参考信号
6月1日
构建每周千美元预算上限的智能体教程
视频教程:如何构建一个每周预算上限为1000美元的智能体,
5月30日
随着成本飙升,美国企业开始对人工智能实施配给
由于运行和使用AI工具的成本持续飙升,美国企业正开始对人工智能的使用实施配给制。
5月29日
Guardrails:保护你的智能体、数据与成本
Guardrails 是一套可配置的安全与治理工具,提供预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失预防等功能,
5月26日
四个月花光全年 AI 预算,Uber 总裁质疑 AI 投入合理性
四个月花光全年 AI 预算,Uber 总裁质疑 AI 投入合理性
5月23日
微软称,使用人工智能的成本高于支付人工工资
微软发布报告指出,在特定工作场景中,部署和使用人工智能(AI)的成本目前已高于支付相应的人工工资。