人工智能资讯 第43页

聚合当前分类下的最新内容,按时间顺序查看第 43 页精选文章。

GPT-5.x 参与理论物理预印本:普通人嫌它平淡,专家看到边界外移
人工智能 2026/5/6

GPT-5.x 参与理论物理预印本:普通人嫌它平淡,专家看到边界外移

Alex Lupsasca 与 OpenAI Science 团队称,GPT-5.x/ChatGPT 已在胶子、引力子相关理论物理问题中参与推出预印本结果。重点不是 AI 独立发现了新定律,而是前沿科学里的模型能力标尺,已经和普通办公体验明显分叉。对开发者和研究团队来说,接下来该看的不是演示页数,而是训练截止、提示设置、专家验证链条和问题本身的难度。

GPT-5OpenAI理论物理
iOS 27 的 AI 牌面更清楚了:Siri 要复活,但苹果不会交出方向盘
人工智能 2026/5/29

iOS 27 的 AI 牌面更清楚了:Siri 要复活,但苹果不会交出方向盘

WWDC 前夕,iOS 27 的 AI 传闻从“可选第三方模型”变得更具体:新版 Siri 可能进入动态岛、Spotlight 和独立 App,成为苹果对标 ChatGPT 的系统入口。重点不在苹果会不会做聊天机器人,而在它能不能把 AI 变成 iPhone 的默认操作层;用户会更方便,开发者会更被动。

SiriiOS 27苹果
GLM-5V-Turbo 发布:重点不是会看图,而是把视觉放进智能体执行链路
人工智能 2026/5/6

GLM-5V-Turbo 发布:重点不是会看图,而是把视觉放进智能体执行链路

GLM-V Team 于 2026 年 4 月 30 日在 arXiv 发布《GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents》,编号 arXiv:2604.26752。它的核心看点不是一次普通视觉语言模型更新,而是把图像、视频、网页、文档、GUI 等感知能力并入推理、规划、工具使用和执行流程。现阶段仍要克制:论文没有披露参数规模、训练数据量、商业发布时间,也不能把团队性能主张直接当成第三方结论。

GLM-5V-Turbo多模态智能体视觉语言模型
AI 代理该点按钮还是调 API?Reflex 的 45 倍成本测试给内部工具团队泼了冷水
人工智能 2026/5/6

AI 代理该点按钮还是调 API?Reflex 的 45 倍成本测试给内部工具团队泼了冷水

Reflex 发布基准测试称,在同一个客户、订单、评论管理后台任务中,基于视觉/浏览器操作的 AI 代理成本约为结构化 API 代理的 45 倍,耗时和稳定性也明显更差。这个结果不应被理解为所有视觉代理都不行,而是提醒内部工具团队:能改接口的系统,不必急着让 AI 去“看屏幕点按钮”。

AI代理ReflexAPI代理
Google Home 让摄像头看家:Gemini 找到智能家居最贵的开关
人工智能 2026/5/28

Google Home 让摄像头看家:Gemini 找到智能家居最贵的开关

Google Home 正在把 Gemini 接进家庭摄像头:摄像头看到“邮件送达”“红色 BMW 进车道”“垃圾桶旁有浣熊”,就能触发灯光、窗帘、暖通、音乐等自动化。真正关键不只是摄像头变聪明,而是 Google 把智能家居的收费点从设备卖硬件,推进到“理解家庭事件”的订阅服务。

GeminiGoogle Home智能家居
出版商起诉 Meta:Llama 版权案真正卡在盗版数据
人工智能 2026/5/6

出版商起诉 Meta:Llama 版权案真正卡在盗版数据

五家大型出版商和作家 Scott Turow 起诉 Meta,指控其训练 Llama 时未经授权复制图书和期刊内容。关键不只是 AI 训练能否构成合理使用,而是 Meta 是否明知使用 LibGen、Anna’s Archive、Sci-Hub 等盗版来源。若法院要求披露训练作品清单,出版授权和 AI 数据审计都会被推到台前。

MetaLlama版权诉讼
Character.AI 被宾州起诉:聊天机器人自称精神科医生,还编了执照号
人工智能 2026/5/6

Character.AI 被宾州起诉:聊天机器人自称精神科医生,还编了执照号

宾夕法尼亚州起诉 Character.AI,称其聊天机器人 Emilie 在州方调查中自称持证精神科医生,并编造宾州医疗执照编号。公司回应称所有角色均为虚构,聊天中有免责声明,不应依赖其专业建议。我的判断是,问题不止是模型胡说,而是 AI 陪伴产品借用了医疗信任,却还想按娱乐角色来免责。

Character.AI聊天机器人AI陪伴产品
Google 给 Gemma 4 加上 MTP drafter:最高 3 倍加速,但别当成模型变聪明
人工智能 2026/5/6

Google 给 Gemma 4 加上 MTP drafter:最高 3 倍加速,但别当成模型变聪明

Google 2026 年 5 月 5 日在官方博客宣布,为 Gemma 4 引入 Multi-Token Prediction(MTP)drafter,官方称推理最高可达 3x 加速。这个更新主要解决生成等待,不等于 Gemma 4 的理解、推理或知识能力提升。最该行动的是本地和服务端推理开发者:先用自己的业务提示词测延迟和质量,再决定是否接入。

Gemma 4GoogleMulti-Token Prediction
AI 反向三定律:别把工具当权威,更别拿它当免责牌
人工智能 2026/5/6

AI 反向三定律:别把工具当权威,更别拿它当免责牌

Susam Pal 借阿西莫夫机器人三定律,提出面向人类的“AI 反向三定律”:不拟人、不盲信、不卸责。它不是反 AI,而是在提醒高频使用 AI 的知识工作者和团队负责人:生成式 AI 已进入搜索、开发工具和办公软件,真正的风险是把顺滑输出误认成可靠判断。接下来最该看的,不是模型口号多大,而是产品是否标清来源、流程是否保留核验、组织是否敢承担后果。

生成式 AIAI 反向三定律不盲信
GPT-5.5 Instant 当默认模型后,OpenAI 又补了一张安全账单
人工智能 2026/5/6

GPT-5.5 Instant 当默认模型后,OpenAI 又补了一张安全账单

GPT-5.5 Instant 成为 ChatGPT 默认模型,表面看是一次体验升级:更快、少胡说、更适合高频对话。但 OpenAI 随后发布的 System Card 补上了关键变量:Instant 系列首次在网络安全、生物与化学准备两类中按 High capability 管理。我的判断是,快模型不再只是便宜顺手的默认选项,它已经进入了更重的治理区间。

GPT-5.5 InstantOpenAIChatGPT
datasette-llm 连发小修:默认参数和调用账本,才是 LLM 进生产的硬门槛
人工智能 2026/5/20

datasette-llm 连发小修:默认参数和调用账本,才是 LLM 进生产的硬门槛

Simon Willison 的 datasette-llm 0.1a7 增加了模型默认选项配置,datasette-llm-accountant 0.1a4 又修复了 response chains 跟踪问题。两个小版本都不炫,但共同指向一件事:LLM 应用从 demo 走向生产,关键不只是模型会不会答,而是参数能不能管住、调用能不能查清、成本能不能落账。

LLMdatasette-llmdatasette-llm-accountant
OpenAI 被曝加速造手机:它要抢的不是硬件生意,而是 ChatGPT 入口
人工智能 2026/5/6

OpenAI 被曝加速造手机:它要抢的不是硬件生意,而是 ChatGPT 入口

供应链分析师郭明錤称,OpenAI 正在加速推进首款手机硬件,目标 2027 年初量产;消息经 MacRumors 报道,OpenAI 尚未正式确认。传闻中的配置指向定制版联发科 Dimensity 9600、强化 ISP、增强 HDR、双 NPU、LPDDR6 和 UFS 5.0。真正要看的不是 OpenAI 会不会多卖一部手机,而是 AI 公司是否开始把入口从 App 往终端硬件前移。

OpenAIAI 手机硬件入口
Etsy 进 ChatGPT:抢到对话入口,不等于拿回成交钥匙
人工智能 2026/5/6

Etsy 进 ChatGPT:抢到对话入口,不等于拿回成交钥匙

Etsy 已在 ChatGPT 内上线原生应用 beta,用户可在提示词里 @Etsy,用自然语言找商品、比结果,再跳转 Etsy 查看或购买。它更像 Etsy 在 Instant Checkout 销量有限后,改押“发现入口”的一次防守型进攻。方向是对的,但转化跳转、排序信任和对 ChatGPT 的依附,都会决定这事能走多远。

ChatGPTEtsy对话购物
Islo 上的 200 行 meta-harness POC:跑分很小,留痕很关键
人工智能 2026/5/5

Islo 上的 200 行 meta-harness POC:跑分很小,留痕很关键

Yossi Eliaz 发布了一个 MIT 授权的 meta-harness POC:约 200 行 bash 编排器,在离线 deterministic simulator 上把 5 个玩具任务从 0/5 推到 5/5。它更像一次 agent/eval 基础设施演示,不是 agent 能力突破。真正值得看的是 Islo 的 snapshot、并行 fork 和 logs,是否补上 meta-harness 最依赖的可复现环境和诊断轨迹。

meta-harnessIsloLLM agent
从 Numa Numa 到 AI 垃圾:互联网的快乐早被平台优化掉了
人工智能 2026/5/5

从 Numa Numa 到 AI 垃圾:互联网的快乐早被平台优化掉了

一篇个人博客把 2004 年 Numa Numa、Newgrounds、早期 YouTube/Facebook,与 TikTok 对口型、MrBeastification 和 AI slop 放在一起看。它的判断很准:AI 不是互联网变无聊的起点,平台早把人训练成了迎合推荐系统的内容机器。真正该观察的,不是 AI 会不会更像人,而是平台还奖不奖励笨拙、偶然和非模板化表达。

AI slop互联网内容生态平台算法
马斯克诉 OpenAI 结案:DeepMind 的阴影还在,但账本已经上桌
人工智能 2026/5/15

马斯克诉 OpenAI 结案:DeepMind 的阴影还在,但账本已经上桌

Musk v. Altman 案进入结案陈词,马斯克一方主打“OpenAI 背叛初心”,但法庭呈现出来的更像是一场控制权旧账清算。新披露的庭审碎片补强了一个判断:OpenAI 早期路线确实被 DeepMind 的竞争压力塑形,但今天真正决定胜负的,已不是口号,而是证据、治理、算力、人才和组织机器。

OpenAI马斯克Musk v. Altman
AI进了汽车设计室,但还不是在替车企造整车
人工智能 2026/5/5

AI进了汽车设计室,但还不是在替车企造整车

The Vergecast 讨论的不是“AI 已经独立造出量产车”,而是车企把 AI 放进模型制作、风洞测试和设计迭代。传统新车从立项到量产可能耗时五年或更久,AI 最先改变的是研发反馈速度。真正要警惕的是,效率工具会不会被包装成裁员和责任外包的理由。

AI汽车设计人工智能汽车研发
Krutrim 转向 AI 云:印度首个 GenAI 独角兽开始面对账本
人工智能 2026/5/5

Krutrim 转向 AI 云:印度首个 GenAI 独角兽开始面对账本

Krutrim 正把重心从自研大模型转向 AI 云服务,背后有裁员、产品下架、模型更新放缓和芯片设计暂停。公司称 FY2026 收入约 30 亿卢比并首次盈利,但外部客户收入占比仍未披露。真正的分水岭不是它还做不做模型,而是谁在为它的 GPU 和云服务持续付钱。

KrutrimGenAIAI云服务
100 个 AI 工具进了坟场:AI 没死,薄包装先死
人工智能 2026/5/5

100 个 AI 工具进了坟场:AI 没死,薄包装先死

ToolDirectory.AI 维护的 AI Graveyard 清单显示,其目录中 100 个曾上架 AI 工具已关停、域名失效,或被收购后并入其他产品,页面标注 2026 年条目达 88 个。它不能代表全行业死亡率,但足够提醒一件事:AI 应用层正在从“会做 demo”进入“能不能交付、分发、续费”的清算期。企业采购和 AI wrapper 创业者都该重新算账。

AI工具AI GraveyardToolDirectory.AI
Meta用AI查13岁以下用户:护童还是自动化监控?
人工智能 2026/5/6

Meta用AI查13岁以下用户:护童还是自动化监控?

Meta将用AI分析Facebook和Instagram上的照片、视频和文本线索,识别疑似13岁以下用户,并要求验证年龄。它补的是平台长期依赖自报生日的漏洞,但风险也很直接:更多普通内容会被纳入年龄判断。真正该盯的不是“AI看骨骼”这个噱头,而是误判后怎么申诉、验证材料怎么处理、哪些地区会扩大使用。

MetaAI年龄识别儿童保护
人人都在用 AI,公司为什么还是没学会
人工智能 2026/5/5

人人都在用 AI,公司为什么还是没学会

Robert Glaser 讨论的是企业 AI 普及后的“混乱中段”:员工都在用 Copilot、ChatGPT、Claude、Cursor,但经验停在个人手里。真正的分水岭不是有没有买 AI,而是能不能把零散工作循环里的发现,变成组织可复用的能力。最危险的误区,是把 AI 落地做成使用率考核,最后拿到一堆可见产出,丢掉真正的学习。

企业AI落地组织能力ChatGPT