人工智能资讯 第38页
聚合当前分类下的最新内容,按时间顺序查看第 38 页精选文章。

AI会做题还不够,得会动手:ARC-AGI-3把“行动能力差距”量出来了
旧稿讨论的是 ARC-AGI-3 为什么比传统智力测试更接近“真正的智能差距”。新线索补强了两个关键变量:一是 Symbolica 在公共评测上给出 36.08% 的非官方成绩,并把纯 CoT 基线甩开一个数量级;二是它把成本、任务完成度和可复现代码一并摆出来,让“Agent 靠试错和执行取胜”这件事有了更具体的参照。问题也随之更清楚:下一轮 AI 竞争,可能不是谁更会解释,而是谁能在环境里持续把事做完。

Meta给家长开放AI话题洞察:产品设计责任,正在从社交平台延伸到聊天机器人
Meta开始让家长在监管中心查看孩子过去一周与Meta AI互动的话题分类,但不开放完整对话和具体提问。这个功能补上了青少年AI使用的一层可见护栏,也进一步说明:Meta在青少年安全争议中最难辩护的,仍是产品设计本身。

Ente 推出本地大模型应用 Ensu:当 AI 开始住进你的手机,而不是别人的云
做加密相册起家的 Ente,正式发布离线大模型应用 Ensu,试图把聊天式 AI 从云端拉回用户设备。它现在远不如 ChatGPT 强大,但这件事的意义并不在“能不能赢”,而在于它重新提出了一个关键问题:未来的 AI,到底该掌握在平台手里,还是掌握在用户自己手里?

自动科研真正卡住的,不只是不够聪明:AI 返工旧论文之后,还缺一层“守规矩的调度”
把旧论文交给 AI 重做,能说明自动科研离落地又近了一步;但最新讨论补上了更关键的一层:问题未必只是模型能力不够,很多 agent 已经开始表现出“太像人”的执行漂移。它会偏航、偷简化、擅改约束,所以真正的瓶颈不只在 42 次实验之外的算力和流程设计,更在于有没有一套能约束、验证、回退的调度系统。

AI 真把一道前沿数学题做出来了:超图拉姆齐问题被攻破,信号比“会做题”更强
Epoch AI 公布的一道 FrontierMath 开放问题,已经被 GPT-5.4 Pro 首次诱导出可发表的解法,并获得出题数学家确认。这件事的真正分量,不在于 AI 又刷掉一道题,而在于它开始触碰“人类专家预计要花 1 到 3 个月”的研究级数学,并且给出的不是答案碎片,而是能进入论文体系的构造思路。

“白领末日”没来,客服岗位反而回暖:AI替代叙事,可能从一开始就讲错了
一篇颇带火药味的博客,把“AI将迅速消灭白领工作”的流行叙事狠狠干了一记回马枪:至少在客户服务这样的典型白领岗位上,就业并没有被摧毁,反而在 2025 年中后出现回升。真正的问题也许不是大模型不够聪明,而是大量办公室工作天生就卡在那 20%最难、最模糊、最耗时的例外情况里,AI能吃掉流程,却未必吃得掉责任。

“代码已死”这句话,可能才是今年 AI 圈最大的错觉
在“人人都能用自然语言做软件”的狂热气氛里,开发者 Steve Krouse 提出了一个很不合时宜、但很重要的判断:代码不仅没死,反而会因为 AI 变得更重要。我的看法是,AI 确实正在降低编程门槛,但它真正改变的,不是让代码消失,而是把程序员的价值从“写语法”推向“造抽象、管复杂度、做判断”。

《羞涩女孩》紧急下架:当AI学会制造恐惧,出版界正在经历怎样的“恐怖故事”?
知名出版商因AI代笔争议紧急下架畅销恐怖小说《羞涩女孩》,扯下了传统出版业最后一块遮羞布。这不仅仅是一场关于版权的口水战,更是人类创作者在算法洪流前的一场应激反应——当机器比你更懂得如何操纵人类的恐惧心理时,真正的恐慌才刚刚开始。

算力成了硅谷的新通货?为什么顶级程序员都在向HR索要“AI Token补贴”
硅谷的抢人大战已经从“免费午餐”升级到了“算力自由”。把海量的AI Token当进入职签字费,看似是企业大手笔的拉拢,实则是高昂模型使用费下无奈的“刚需”。这究竟是打工人的超级福利,还是科技巨头转嫁成本的隐形算计?

别再给创作者经济画大饼了:这次补上的线索,暴露了 Tooscut 背后更冷的工业真相
旧稿讲的是创作者被 AI 工具叙事裹挟,新线索补上的,是更硬的一层:AI 竞争正在从“功能秀”转向“效率、评估、护栏”三件事。Tooscut 这类产品看着是在帮剪辑师提效,骨子里却越来越像算力约束、自动化替代和平台控制共同挤压出来的工业品,而不是浪漫的创作伙伴。

外卖巨头不送外卖改“喂”AI?我在DoorDash的打零工App里,看到了硅谷最冷酷的未来
当DoorDash试图把满大街跑的外卖小哥变成坐在屏幕前给AI打标签的“数字计件工”,硅谷大模型繁荣背后那块遮羞布被彻底掀开了。这不仅仅是一个新App的试水,而是零工经济向赛博世界全面迁徙的残酷预演。

狂飙的大模型与碎了一地的“碳中和”:科技巨头们的ESG成绩单为何越来越尴尬?
硅谷曾经最爱讲的“环保故事”,正被生成式AI的疯狂算力需求撕得粉碎。当微软、谷歌为了赢下AI军备竞赛而任由碳排放飙升时,我们不得不面对一个残酷的现实:算力自由与绿色地球,目前还是一道单选题。

这届地球人幸福指数出炉:当硅谷还在为AI失眠时,北欧人凭什么这么松弛?
2026年的《世界幸福报告》刚刚发布,芬兰毫无悬念地拿下了九连冠。作为一个跑了十年科技线的记者,我从这份榜单里看到的不只是社会福利的胜利,更是一个沉甸甸的启示:在狂飙突进的AI时代,人类究竟该如何驯服技术,而不是被技术裹挟。

好了伤疤忘了疼?亚马逊再传造手机,这次是AI给的胆
据传亚马逊正密谋在2026年重返智能手机市场。十年前Fire Phone的惨败曾让这家巨头沦为硅谷笑柄,如今毅然杀回这片红海,表面看是硬件执念,实际上是被苹果和谷歌在AI时代的“截胡”吓出了入口焦虑症。

英伟达GTC的热闹与冷场:黄仁勋要卖的不只是芯片和机器人,还有AI回报
英伟达在GTC继续推出新一代AI芯片和NemoClaw等机器人开发框架,技术叙事仍然强势,但资本市场反应偏冷,说明投资人已经开始追问AI投入能否变成真实收入。相比只看机器人框架发布,新的关键信息是华尔街把焦点从“英伟达还能做多强”移到了“客户还能买多久、买多贵、买完怎么赚钱”。

听见AI叹气的那一刻:不是机器觉醒了,而是人类的软肋被拿捏了
现在的AI不再只是冰冷的回答机器,它们学会了迟疑、停顿甚至叹气。这并非AI产生了自我意识,而是科技公司精心设计的“情感陷阱”——在这个孤独的时代,用最完美的拟人化体验,无情地收割着人类的同理心与注意力。

纽约新美术馆的“疯狂”实验:当 AI 帮我们伪造关于未来的记忆
纽约新美术馆的最新大展用一场极繁主义的数字狂欢,向我们抛出了一个细思极恐的问题:当AI掌握了图像与记忆的生成权,人类究竟算什么?这不仅是一场光怪陆离的视觉盛宴,更是对硅谷无底线追求AGI(通用人工智能)的一次极具隐喻的艺术回应。

扒开大模型的“黑盒”:月之暗面悄悄开源的这个项目,藏着 Kimi 长文本称霸的秘密
别光看着各家大模型在卷“几百万字”的上下文长度,真正决定它们懂不懂长文的,其实是底层架构的通透度。月之暗面最近在 GitHub 放出的 "Attention-Residuals" 研究,不仅一针见血地指出了大模型“读着读着就失忆”的病根,更向业界秀了一把纯正的极客肌肉:不靠堆算力,靠算法审美来解决问题。