人工智能资讯 第44页
聚合当前分类下的最新内容,按时间顺序查看第 44 页精选文章。

代码变便宜之后,程序员真正贵在什么
David Breunig 总结了面向 Codex、Claude Code 等编程 Agent 的 10 条经验,重点不是模型能不能写代码,而是代码变便宜后,工程流程该怎么改。 真正没有变便宜的是反馈、判断、责任、维护和安全。开发者要把价值放到边界定义和行为验证上,技术负责人要先补测试、规格和评审,再谈提效。

Chrome 塞进 4GB Gemini Nano:本地 AI 可以默认开,账不能默认藏
Chrome 被发现可能在本地下载约 4GB 的 Gemini Nano 模型权重,用来支撑诈骗检测、写作辅助、自动填充等端侧 AI 功能。The Verge 补强了几个关键细节:这不是所有用户都会遇到,通常和某些 On-Device AI 功能有关;删掉文件不等于解决,关掉对应开关才可能阻止它回来。我的判断很简单:本地 AI 方向没错,但平台不能把用户硬盘当成 AI 战略的免告知配额。

一小时手写小 GPT:llm-from-scratch 教的不是造 ChatGPT
angelos-p/llm-from-scratch 把 GPT 训练拆成一个可跑通的教学工作坊:手写 tokenizer、模型、训练循环和生成脚本。默认模型约 1000 万参数,作者称 M3 Pro 上约 45 分钟完成训练,目标只是生成 Shakespeare-like text。它适合想补 Transformer 训练原理的 Python 开发者和技术讲师,不适合拿来做聊天机器人或企业应用原型。

OpenAI 把 AI agent 推进 CFO 办公室,真正难的不是自动化
OpenAI 与 PwC 合作,把 AI agents 引入 CFO 办公室,目标覆盖采购、预测、报表、税务、资金、关账等核心财务流程。更关键的是,OpenAI 先把自己财务团队当“customer zero”验证:Codex 支撑同等团队处理 5 倍合同,IR-GPT 支撑近期融资中 200 多次投资者互动。这事的分水岭不在模型多会聊天,而在 AI 能不能进入强控制、可追责、要算账的企业生产环境。

黄仁勋说 AI 在创造岗位,但这还回答不了就业焦虑
黄仁勋在 Milken Institute 对话中称“AI creates jobs”,并把 AI 视为美国再工业化的最佳机会。这个判断抓住了算力和制造扩张带来的新需求,但还不能证明被替代的人能拿到新岗位。真正要看的不是 AI 会不会笼统地“消灭工作”,而是哪类任务被降价,哪些岗位被重估。

AI 写代码越快,团队越容易欠下认知债
Margaret Storey 汇总开发者、Simon Willison、Martin Fowler 等人的反馈后,把一个问题摆到台面上:生成式 AI 和 Agentic AI 正在让系统变化速度超过团队理解速度。认知债务不是代码质量差,而是系统演化与团队共享理解之间的缺口。真正受压的会是 review、调试、onboarding,以及技术负责人对系统风险的判断。

Claude 像会反驳的人,GPT 像逻辑义肢:AI 助手开始分两条路
Latent Space 借 Roon 对 Claude 与 GPT 的讨论,把问题拉回产品选择:用户要的是会推回来的 AI 伙伴,还是低摩擦的执行工具。Claude 更容易被感知为有边界的“他者”,GPT 更常被当作能力放大器,但这不是人格高低之分。对产品经理和 agent 团队来说,下一轮竞争不只在模型,也在 harness、上下文管线和多模型编排。

AI Agent 开始拼系统工程:模型、编排和账单一起决定成败
AINews 对 5 月 1 日至 4 日 AI 社区的回顾显示,讨论重心从单个模型能力转向上下文管线、Agent harness、多模型编排和编码代理成本。几个 benchmark 提升更像是在提醒开发者:Agent 表现不能只看模型权重,还要看 prompt、middleware 和 harness 怎么组织任务。对应用团队和技术管理者来说,下一步不是盲目换模型,而是重新评估编排框架、上下文策略和 token 成本。

2026 普利策新闻奖:权力扩张、Meta 和保险算法一起被点名
2026 年普利策新闻奖公布,新闻类大奖的共同指向很清楚:特朗普政府权力扩张、地方执法冲突、Meta 平台风险、保险算法理赔黑箱。最该看的不是谁拿奖,而是这些报道怎样把“系统决定”重新拆回到具体责任人。对科技行业来说,Meta 是平台激励问题,保险算法是自动化责任转移问题,不能混成同一种风险。

Simon Willison 5 月月报:AI 变贵之后,10 美元买的是判断口味
Simon Willison 发布了 2026 年 5 月 GitHub Sponsors 专属月报,10 美元/月,赞助者可提前一个月阅读,4 月版已作为免费预览放出。和 4 月相比,5 月公开目录给出了更清楚的行业气压:AI 成本变刺眼、Anthropic 进入强势月份、模型发布开始让人失望。独立技术作者卖的不是独家新闻,而是长期试用、写代码、筛选之后留下的可信判断。

图像模型带火 AI App 下载,但真正难的是让用户付钱
Appfigures 报告称,图像/视觉模型发布带来的 AI 移动应用下载增量,约是传统模型更新的 6.5 倍。Gemini Nano Banana 拉来 2200 万以上新增下载,但估算消费支出仅 18.1 万美元;ChatGPT 4o 图像模型新增约 1200 万安装,却带来约 7000 万美元估算消费支出。图像模型已经成了最强拉新入口,分水岭不在下载峰值,而在留存、转订阅和付费路径。

Nature撤回ChatGPT教育论文:AI进课堂,最贵的不是工具,是证据
Springer Nature旗下期刊撤回一篇关于ChatGPT教育效果的元分析论文,理由是分析存在差异和不一致,结论可信度被削弱。更麻烦的是,这篇论文撤回前已被引用约504次,说明AI教育研究的传播速度正在压过纠错速度。AI进课堂不该靠热情冲锋,学校、教师和产品公司最该补上的,是可复核、可限定、可落地的证据。

OpenAI 语音 AI 的低延迟麻烦:WebRTC 快了,提示词可能碎了
OpenAI 强调用 WebRTC 交付低延迟语音 AI,但 Luke Curley 的批评把问题推到更底层:WebRTC 为了实时性,可能在差网络下主动丢弃音频包。对视频会议来说,这是合理取舍;对 LLM 语音提示来说,丢掉的可能就是用户意图。语音 AI 不能只卷“像真人一样快”,还得给高价值任务留出“慢一点但听准”的通道。

Sierra 融资 9.5 亿美元:企业 AI Agent 开始进入预算战
Sierra 完成 9.5 亿美元融资,由 Tiger Global 和 GV 领投,投后估值超过 150 亿美元,账上可动用资金超过 10 亿美元。 这轮融资的重点不是单家公司估值抬升,而是企业 AI Agent 正从试点走向更重的采购、集成和成本核算。 公司披露的 ARR、客户覆盖和交互量很亮眼,但仍是自报口径;盈利能力、毛利和大规模部署成本还看不清。

Roomba 之父做毛绒陪伴机器人:家庭机器人不扫地,开始盯上情绪价值
Colin Angle 带着新公司 Familiar Machines & Magic 回到家庭机器人赛道,首款产品 Familiar 是一只狗大小、毛绒外观、可自主移动的陪伴机器人。它主打本地生成式 AI、独特人格和家庭互动,但目前公开信息仍停留在发布与演示阶段,价格、上市时间和真实体验都还看不清。真正的分水岭不是可不可爱,而是用户愿不愿意把隐私、注意力和情绪关系交给一台会走动的机器。

OpenAI、Anthropic 同时找上资管巨头:企业 AI 开始拼“谁能进现场”
OpenAI 和 Anthropic 几乎同时把企业 AI 服务推向资管、私募渠道:Anthropic 已宣布合资公司,OpenAI 的 The Development Company 则来自 Bloomberg 报道。重点不在模型升级,而在销售入口、工程实施和资本收益被绑到一起。对企业客户和 AI 创业公司来说,接下来要看采购是否被资本关系影响,以及 FDE 模式能不能真的跑出可复制交付。

别把“蒸馏”打成脏词:AI监管最容易误伤自己人
Anthropic 等公司把部分中国实验室绕过 API 限制、获取模型信号的行为称为“蒸馏攻击”,美国政策层面也开始关注 API 滥用和中国开源权重模型。问题在于,蒸馏本身是大模型产业的基础技术,把它污名化,最先受伤的可能不是中国大厂,而是美国自己的学术界、小团队和开放生态。

马斯克告 OpenAI 新进展:旧邮件把“AI 安全”打回了控制权之争
马斯克起诉 OpenAI 的案子,原本看起来是在追问非营利使命和 AI 安全;最新庭审材料把问题推得更近:2017 到 2018 年,马斯克曾讨论把 OpenAI 核心团队带进特斯拉,或让 OpenAI 与特斯拉绑定。OpenAI 一方要证明的不是马斯克是否支持商业化,而是他可以接受商业化,前提是自己控盘。

OpenAI、Google、Microsoft力挺美国AI素养法案:学校该教会孩子用AI,还是先防AI滥用
美国参议员 Adam Schiff 与 Mike Rounds 提出跨党派 LIFT AI Act,拟通过 NSF 资助 K-12 阶段 AI 素养课程、教材、教师培训和评估工具。法案还只是授权资助的提案,不是已经拨款,也没有改写全美课程。真正的分歧在于:学校需要补上 AI 教育短板,但大 AI 公司集体背书,也会推动 AI 更深进入课堂制度。

特斯拉FSD跑过100亿英里,但无人驾驶还没过责任关
特斯拉安全页面显示,使用 FSD(Supervised)的车队累计行驶里程已超过 100 亿英里,跨过马斯克今年 1 月提过的“安全无监督自动驾驶”数据门槛。车主没有因此获得 FSD Unsupervised:当前 FSD 仍是 Level 2,需要驾驶员全程注意并随时接管。真正要看的不是里程数字,而是特斯拉何时敢把驾驶责任从车主身上移走,并让监管、保险和法律系统承认这一点。

AI 会在 2028 年前接手 AI 研发吗?Import AI 给出一个激进但有边界的判断
Jack Clark 在 Import AI 455 中判断,到 2028 年底前出现无需人类参与、可自主推进下一代模型研发的 AI R&D 系统,概率已超过 60%。这不是行业共识,也不是说 AI 已能训练前沿模型;真正值得看的是编码、复现、训练优化和多代理管理能力是否正在拼成研发闭环。