人工智能资讯 第49页
聚合当前分类下的最新内容,按时间顺序查看第 49 页精选文章。

OpenAI 走进 AWS:微软松开独占后,企业 AI Agent 入口变了
OpenAI 与 AWS 推出由 OpenAI 驱动的 Bedrock Managed Agents,微软也修订了与 OpenAI 的协议,允许 OpenAI 服务 Azure 之外的云客户。重点不是 OpenAI 离开微软,而是 Azure 独占让位于多云分发。对企业客户来说,真正的新变量是:OpenAI Agent 能不能借 AWS 的数据、权限和工作流体系,更顺地进入生产环境。

Google Home离线提示更新:智能家居终于开始解释“为什么坏了”
Google Home更新后,设备离线时可能在控制页提示是否因为第三方账号授权过期导致断连,并引导重新关联账号。 Home Vitals面向开发者,用来监控集成健康、识别连接错误、提前修复问题;Gemini也优化了指令识别和部分基础命令速度。 这次重点不是多一个提示框,而是Google开始把智能家居的故障黑箱拆开,让平台和服务方承担更多解释责任。

Poolside 发布 Laguna 编码模型:小型 MoE 开放权重,能否挤进智能体核心牌桌
Poolside 发布 Laguna M.1 与 Laguna XS.2 两个面向长程智能体编码的 MoE 模型,并将 XS.2 权重以 Apache 2.0 许可开放。真正的看点不是它全面压过闭源大模型,而是 Poolside 用小激活参数、开放权重和自研训练栈,开始争夺 agentic coding 的开发者入口。

Claude.ai 不可用:比网页宕机更麻烦的是工作流被卡住
Anthropic 状态页显示,2026 年 4 月 28 日 17:41 UTC 开始调查 Claude.ai 无法访问,17:51 UTC 标记为已识别;同时 Anthropic API 出现 elevated errors,Claude Code 登录路径受影响。受影响对象包括 claude.ai、platform.claude.com、api.anthropic.com、Claude Code、Claude Cowork 和 Claude for Government。眼下不能夸大成系统性危机,但它提醒企业:AI 一旦进了开发和办公链路,可靠性就不再是配角。

OpenAI 接入 AWS:企业用 AI 少绕一套流程,但还没到全面开放
OpenAI 与 AWS 扩大战略合作,OpenAI models on AWS、Codex on AWS、Amazon Bedrock Managed Agents powered by OpenAI 今日以有限预览进入 AWS 生态。关键变化不是多了一个模型入口,而是企业可以把 OpenAI 能力接进 AWS 既有的安全、身份、计费、采购和合规流程。限制同样明确:三项能力都还是 limited preview,价格、区域、容量、延迟和真实生产效果还看不清。

NVIDIA 开源 Nemotron 3 Nano Omni:补上音视频和长上下文,但别急着神化
NVIDIA 在 Hugging Face 发布开源权重模型 Nemotron 3 Nano Omni 30B-A3B,覆盖长文档、图像、视频、音频和 GUI 代理任务。它更像是在把视觉语言模型补成企业多模态工作流底座,而不是单纯刷一个 30B 级榜单。官方成绩显示文档、视频、音频能力补强明显,但 GUI 细粒度定位、真实业务鲁棒性和许可边界仍要分开看。

Google Translate 开始纠发音,翻译工具正在偷走语言学习的边角时间
Google Translate 上线 AI 发音练习功能 pronunciation practice,可以分析用户朗读并给出即时纠音反馈,但目前只面向美国、印度 Android 用户,支持英语、西班牙语和印地语。它还不是完整语言学习产品,却很清楚地说明:Google 想把翻译入口继续推向“开口练习”入口,挤压的是轻量学习场景。

Anthropic 赞助 Blender:AI 公司开始给开源创作底座付钱
2026 年 4 月 28 日,Blender Foundation 宣布 Anthropic 以 Corporate Patron 身份加入 Blender Development Fund,资金用于 Blender 核心开发,并点名 Blender Python API。原文没有披露金额,也没有产品集成计划,更不是 Anthropic 接管 Blender。真正该看的,是 AI 公司开始补贴开源创作基础设施:钱能让 Blender 更稳,边界也会更难装作不存在。

Super Cruise跑过10亿英里:GM证明的是受限辅助驾驶,不是自动驾驶
GM称Super Cruise自2017年推出以来累计行驶超过10亿英里,覆盖美国和加拿大近75万辆车。这个里程碑说明,地理围栏、高清地图和驾驶员监控这条保守路线正在变得可用。它的边界也很清楚:hands-free不等于eyes-off,更不等于无人驾驶。

vibe coding 热闹之后,软件还是要有人负责
Simon Willison 转引了 Matthew Yglesias 的一句话:用了五个月后,他不想自己 vibe coding,而想买专业软件公司用 AI 辅助做出的更好、更便宜的软件。重点不是 AI 编程失灵,而是个人即兴造软件的叙事,正在撞上产品交付、维护责任和商业分工。开发者和产品团队接下来该看的,不是模型能写多少代码,而是这些代码能不能变成可售、可修、可持续的软件。

Tank OS 把 OpenClaw 装进 Podman:企业本地 AI agent 少了裸奔风险,但还没到省心
Red Hat 首席软件工程师、OpenClaw 维护者 Sally O’Malley 发布开源工具 Tank OS,用 Fedora、Podman 和 rootless 容器封装 OpenClaw。 它的重点不是给普通用户做“一键安全”,而是让企业 IT 能按容器方式管理本地 AI agent 的权限、凭据和实例。 但 Tank OS 仍是开源工具,不是 Red Hat 官方企业产品;它降低隔离和配置风险,不替企业承担密钥、审计和运维责任。

Neurable 要把脑机接口授权给耳机厂,读脑不远,数据账更近
Neurable 正在把 EEG 传感器、信号处理和 AI 打包授权给消费硬件厂商,目标是让耳机、帽子、眼镜、头带具备脑活动感知能力。 它还不是读取思想内容,更接近分析专注、疲劳、认知表现等状态。 真正该盯的不是设备多酷,而是脑数据进入消费电子后,授权、隐私、AI 训练和平台控制怎么定边界。

Zoox 的 robotaxi:真正的赌注不是外形,是城市运营
Zoox 正在拉斯维加斯、旧金山、奥斯汀推进 robotaxi 服务,迈阿密也在计划中。它和 Waymo 等改装量产车路线不同,选择从传感器、车身、转向、乘客舱重做一辆无人出租车。关键不在它像不像未来,而在这套专用车设计能不能压低城市运营里的感知、掉头、上下客和冗余成本。

Otter 接入 Gmail、Notion、Jira:AI 会议工具开始抢企业知识入口
Otter 推出基于 MCP 的企业搜索功能,可把 Gmail、Google Drive、Notion、Jira、Salesforce 等数据接入 Otter,并和会议记录一起查询、操作。 它还发布了 Windows 端无机器人录会应用,补齐去年 Mac 端已有的 botless meeting capture。 我的判断:Otter 不是在给会议纪要加小功能,而是在防守式扩张。转写和摘要越来越薄,会议工具必须去抢企业知识入口。

LingBot-Map 发布:机器人建图的硬问题,正在变成记忆管理
蚂蚁灵波科技发布 LingBot-Map,一套面向具身智能的流式 3D 重建方法,目标是在长视频序列里稳定输出相机位姿和深度。关键不在“又一个建图模型”,而在它把长期在线感知的瓶颈说清了:记忆怎么存、怎么压、怎么不拖垮系统。现在不能把它吹成 SLAM、NeRF 或 3DGS 的全面替代,但机器人、AR/VR、自动驾驶建图团队已经值得拿它做验证对象。

旧金山坐拥AI富矿,城市经济却没接住
旧金山聚集了OpenAI、Anthropic和91家AI独角兽,账面财富很热,城市经济却被《经济学人》称为落后者。关键不是AI公司弱,而是估值、就业、住房和治理之间没有顺畅传导。对创业者和城市管理者来说,接下来该看本地用工、住房承载和公共服务,而不是只看融资新闻。

talkie 发布:一台停在 1930 年的 13B 模型,真正考题是版权洁净训练
Nick Levine、David Duvenaud 与 Alec Radford 发布 talkie,一个用 1931 年前英文文本训练的 13B 复古语言模型,并开放 base 与指令微调版本。它的价值不在怀旧包装,而在给开源模型社区提供了一个罕见样本:只靠版权到期、时代隔离的数据,大模型能走多远。最大争议也在这里——base 模型相对“干净”,chat 版本仍被现代 LLM 的后训练流程影响。

当 AI 被默认打开,拒用就不再是矫情
Sean Boots 提出“生成式 AI 素食主义”:不全面反 AI,但尽量回避 ChatGPT、Copilot、Gemini、Claude 这类生成式 AI 工具。关键不在于 AI 有没有用,而在于它正被默认塞进办公软件、手机系统和搜索入口。对普通用户和组织来说,保留“不用”的权利,已经是一种现实防御。

NVIDIA把超声AI推到原始通道数据层,难点不只是模型
NVIDIA与Siemens Healthineers发布NV-Raw2Insights-US,输入不是B超图像,而是超声探头的raw ultrasound channel data。它首个应用是估计患者个体化声速,并用于自适应聚焦,不是自动诊断疾病。目前项目仍处研究开发阶段,未获美国或其他国家销售许可,真正门槛在原始数据链路、设备接入和监管定义。

微软 VibeVoice 不只是本地转写更快:真正变了的是开发者入口
VibeVoice 本地转写一小时播客可以跑到 8 分 45 秒,这个速度已经足够让内容团队心动;但新线索显示,微软更大的动作不是单点性能,而是把 VibeVoice-ASR 接入 Hugging Face Transformers,并用开源、vLLM、finetuning 和 MIT license 降低集成门槛。我的判断是:VibeVoice 的分水岭不在 demo 有多炫,而在它能不能从“能跑”变成“好接、好管、能进生产”。

YouTube 把 AI 塞进 Shorts:答案先到,素材也要被改写了
YouTube 一边测试 Ask YouTube 这类 AI 搜索,让用户先拿答案;一边在 Shorts 里上线 Gemini Omni 驱动的 reimagine 混剪,让用户直接改写别人的短视频。新变量不只是“AI 创作更方便”,而是创作者同时失去两件东西:流量入口和影像语境的控制权。