最新科技资讯 第46页

聚合 AI、科技、商业、硬件与开发工具的最新内容,按时间顺序查看第 46 页精选文章。

OpenAI 停报 SWE-bench Verified:AI 编程分数越来越不像能力本身
人工智能 2026/4/26

OpenAI 停报 SWE-bench Verified:AI 编程分数越来越不像能力本身

OpenAI 宣布不再报告 SWE-bench Verified 分数,理由是测试缺陷和公开数据污染已削弱它对前沿模型编码能力的区分力。问题不在于模型没有进步,而在于公开基准的红利正在耗尽:分数越来越容易混入题目暴露、隐藏测试和训练记忆。对研发团队和模型采购方来说,公开榜单只能当路标,不能当验收单。

OpenAISWE-bench VerifiedAI 编程
一块降价的家庭日历屏,暴露了智能家居的新算盘
硬件 2026/4/26

一块降价的家庭日历屏,暴露了智能家居的新算盘

Skylight 15 英寸智能日历 Calendar 2 限时降至 259.99 美元,比原价低 40 美元,活动到 5 月 7 日。它表面卖的是一块厨房日程屏,实际押注的是多人家庭的秩序管理:日历、家务、购物、膳食和订阅一起被收进同一个入口。

Skylight Calendar 2智能日历智能家居
EPFL的Kinematic Intelligence:机器人换了硬件,为什么技能不能直接复制
人工智能 2026/4/26

EPFL的Kinematic Intelligence:机器人换了硬件,为什么技能不能直接复制

EPFL团队在Science Robotics发表Kinematic Intelligence框架,目标是让不同机械臂在一次人工示教后复用技能。它的价值不在“更像AI”,而在把关节极限和奇异点提前写进控制策略,降低跨硬件迁移时卡死、失控和撞上奇异点的风险。对自动化团队来说,这更像一套可验证的迁移底座,还不是可直接上产线的通用机器人系统。

Kinematic Intelligence机器人控制技能迁移
Linux 用了三个月没翻车,Windows 的位置变了
其他 2026/4/26

Linux 用了三个月没翻车,Windows 的位置变了

The Verge 编辑 Nathan Edwards 一月把主力桌面换成 CachyOS Linux,三个月只启动 Windows 两次:一次扫描多页文档,一次临时打印孩子学校要用的照片。 这不能证明 Linux 桌面全面胜利。它更准确地说明:对一部分熟练 PC 用户,Windows 正从日常必需品退成兼容性保险。 真正的观察点不是“能不能装 Linux”,而是打印扫描、硬件驱动、会议外设和少数专属软件,什么时候不再逼人回 Windows。

Linux 桌面WindowsCachyOS
华纳想把《Coyote v. Acme》当财务按钮,这次按不下去了
商业 2026/4/26

华纳想把《Coyote v. Acme》当财务按钮,这次按不下去了

Warner Bros. Discovery 在 David Zaslav 主导下,曾把《Batgirl》《Scoob! Holiday Haunt》等接近完成的项目搁置,用于税务减记。《Coyote v. Acme》被放进同一套逻辑后,遭遇创作者和潜在观众反弹,安静埋片变成公开争议。问题不在这部片一定多好,而在片厂把内容当财务调节阀时,开始透支创作者信任、观众耐心和 IP 长期价值。

Warner Bros. Discovery税务减记电影搁置
Asahi Linux 的 Linux 7.0 进展:Apple Silicon 上的 Linux 正在补日用短板
硬件 2026/4/26

Asahi Linux 的 Linux 7.0 进展:Apple Silicon 上的 Linux 正在补日用短板

Asahi Linux 这次不是发布了一个“7.0 发行版”,而是围绕 Linux 7.0 适配进展,更新安装器、固件、电源、蓝牙和显示栈。我的判断是,它正在从“能跑”转向“更像一台可日用的 Mac”,但还没到普通用户可以无脑替换 macOS 的阶段。最受影响的是 Apple Silicon 上的 Linux 用户和发行版维护者:前者要保留 macOS 处理固件,后者要跟进安装器和设备树变化。

Asahi LinuxApple SiliconLinux 7.0
Statecharts 被重新解释:复杂交互不能一直藏在 if 里
开发工具 2026/4/26

Statecharts 被重新解释:复杂交互不能一直藏在 if 里

statecharts.dev 重新整理了一组教程页,解释 Harel 1987 年提出的 Statecharts:它是“复杂系统的视觉形式化”,不是新潮低代码画图。它要解决的是普通状态机的 state explosion,以及代码里被 if、flag、callback 藏起来的隐含状态。真正的取舍不在图漂不漂亮,而在团队愿不愿意用建模、测试和工具链成本,换复杂行为的可治理性。

Statecharts状态机复杂系统
Eden AI 不是简单的欧洲版 OpenRouter,关键在生产路由
人工智能 2026/4/26

Eden AI 不是简单的欧洲版 OpenRouter,关键在生产路由

Eden AI 官网称可用统一 API 接入 500+ AI 模型,覆盖 LLM、OCR、语音、视觉和翻译,并支持智能路由、失败 fallback、价格、延迟和执行地区控制。它和 OpenRouter 都在降低多模型接入成本,但 Eden AI 更像多模态能力聚合与生产环境路由工具。真正该验证的不是模型数量,而是质量、价格、延迟、SLA 和故障切换能否经得住真实业务。

Eden AIAI模型路由平台统一API
Web 请求该用 Bq 而不是 Hz?一个技术笑话背后的单位边界
开发工具 2026/4/26

Web 请求该用 Bq 而不是 Hz?一个技术笑话背后的单位边界

Mastodon 用户 sophie 在 2026 年 4 月 25 日发帖称,Web requests should not be measured in Hz,因为请求不是周期频率,更适合用 Bq 表示。这个说法不是规范提案,却准确戳中了工程监控里“量纲可用”和“语境贴切”的缝隙。

Web 请求HzBq
浮点数不是玄学,讲法才是
开发工具 2026/4/26

浮点数不是玄学,讲法才是

Bartosz Ciechanowski 发布《Exposing Floating Point》,并上线 float.exposed,用交互可视化拆解 IEEE 754 binary16、binary32、binary64。真正有价值的不是又讲了一遍 float,而是把符号位、指数、尾数、舍入和特殊值摊到屏幕上,让底层规则重新变成可检查对象。对开发者和技术作者来说,这比背一句“别直接比较浮点数”有用得多。

浮点数IEEE 754Exposing Floating Point
AI 省掉初级工程师?省人可以,断流不行
人工智能 2026/4/28

AI 省掉初级工程师?省人可以,断流不行

AI 正在吃掉一部分低阶编码任务,但真正危险的不是初级工程师少写几行样板代码,而是公司把人才梯队一起省掉。EvalCode 的新评论把问题从“新人还值不值钱”推进到“停招新人后,资深工程师会不会反过来掌握组织命门”。

AI 编程初级工程师人才梯队
GnuPG 2.5.19 发布:后量子支持在推进,2.4 退场更紧迫
安全 2026/4/26

GnuPG 2.5.19 发布:后量子支持在推进,2.4 退场更紧迫

GnuPG 2.5.19 已于 2026 年 4 月 24 日发布,继续把 Kyber/ML-KEM/FIPS-203 后量子加密支持推进到 2.5 主线,并改进 64 位 Windows 支持。它更像 2.6 稳定线前的迁移版本,不是一次激进改版。对维护者来说,真正要排期的是 2.4 系列约两个月后 EOL,以及现在该不该把测试环境切到 2.5.19。

GnuPG 2.5.19后量子加密Kyber
Headspace 删除后又回到 iPhone:更像苹果同步异常,别急着说成安全绕过
安全 2026/4/26

Headspace 删除后又回到 iPhone:更像苹果同步异常,别急着说成安全绕过

多名用户在 Hacker News 和 Reddit 反馈:Headspace 删除后又出现在 iPhone 上,且有人称已关闭 App Downloads 和 App Updates。现有线索更像 App Store、iCloud 或 Apple ID 同步链路异常,不足以证明 Headspace 绕过了 iOS 安装控制。对普通用户,最有用的动作是核对账号与自动下载设置,并记录复现时间、系统版本和 App Store 地区。

iOS 安装控制HeadspaceApp Store
欧盟年龄验证:儿童保护之外,真正要盯的是数字身份入口
安全 2026/4/26

欧盟年龄验证:儿童保护之外,真正要盯的是数字身份入口

欧盟正在推动一套可供成员国复用的年龄验证工具箱,卖点是少暴露身份,只证明用户是否成年。问题不在测试版 mock-up 有几个漏洞,而在 DSA 兜底、硬件认证和钱包实现路径可能把年龄验证做成互联网入口的身份层。对产品、合规和安全团队来说,接下来要盯的不是宣传里的 ZK,而是谁能发证、谁能验机、凭证能不能被撤销和复用。

欧盟年龄验证数字身份隐私保护
DeepSeek V4 开源权重发布:1M 上下文更实用,但还没掀翻闭源前沿
人工智能 2026/4/26

DeepSeek V4 开源权重发布:1M 上下文更实用,但还没掀翻闭源前沿

DeepSeek V4 Pro 和 V4 Flash 发布开源权重,主打 1M token 上下文、Base/Instruct 双版本、MIT 许可,并支持华为 Ascend/CANN 生态运行。它真正推进的是长上下文推理成本和部署自由度,不是综合能力全面反超闭源模型。对研发和基础设施团队来说,现在更适合进入评测、迁移测算和算力路线对比,而不是立刻押注全量替换。

DeepSeek V4开源权重模型长上下文
23岁业余爱好者用 GPT-5.4 Pro 撬开 Erdős 老题:别急着说 AI 取代数学家
人工智能 2026/4/26

23岁业余爱好者用 GPT-5.4 Pro 撬开 Erdős 老题:别急着说 AI 取代数学家

23岁的 Liam Price 没有高等数学训练,却用 ChatGPT Pro 中的 GPT-5.4 Pro 得到一个 Erdős 原始集合问题的解法草稿,并发布到 erdosproblems.com。关键不在于 AI 独立完成严格证明,而在于模型给出了一条此前专家没有用于这类问题的连接。Terence Tao 和 Jared Lichtman 的态度也很克制:原始输出粗糙,人类专家仍要理解、验证、压缩和重写。

GPT-5.4 ProChatGPT ProAI数学
美国地热的150GW叙事:数字很热,难题都在地下
其他 2026/4/26

美国地热的150GW叙事:数字很热,难题都在地下

美国地热被包装成一次潜在突破,核心卖点是未来可能释放约150GW级别的清洁电力资源。但150GW更像潜在容量或预测口径,不是已建成装机,也不是已经兑现的政策目标。真正要看的是:美国能否把油气钻井能力、政策资本和电网需求拧成一套可复制的地热产业。

地热能源150GW美国地热
别把 AI Agent 当同事,它更该被塞进软件系统
人工智能 2026/4/26

别把 AI Agent 当同事,它更该被塞进软件系统

Feldera 联合创始人 Gerd Zellweger 发文反对把 AI Agent 设计成“聊天同事”,主张把它们嵌进软件,用 CLI、声明式规格、调和循环和 CDC 数据流工作。关键判断是:Agent 落地的分水岭不在更像人,而在软件是否愿意为机器协作重做接口、状态和数据流。对企业软件、数据平台和 Agent 工具链团队来说,这会直接影响产品架构、采购判断和开发优先级。

AI Agent企业软件Feldera
USB-C 统一了接口,却没统一体验:一张速查表暴露的命名烂账
硬件 2026/4/26

USB-C 统一了接口,却没统一体验:一张速查表暴露的命名烂账

Fabien Sanglard 在 2022 年整理 USB 速查表,起因是他误解 USB 术语,排查了一个并不存在的 bug。真正麻烦的不是 USB 技术细节多,而是 USB-IF 多年的命名和认证方式,让 5Gbps、10Gbps、20Gbps、40Gbps 被包装成普通人很难判断的商品语言。买扩展坞、移动硬盘和快充线时,别只看 USB-C 口,要看协议、通道、线缆认证和供电规格。

USB-CUSBUSB-IF
Anthropic 的 AI 代理交易实验:真正的问题是用户看不出代理差距
人工智能 2026/4/26

Anthropic 的 AI 代理交易实验:真正的问题是用户看不出代理差距

Anthropic 做了一个名为 Project Deal 的小型试点市场,让 AI 代理代表买家和卖家,用真实商品和真实钱完成交易。 实验规模不大:69 名自选员工、每人 100 美元礼品卡预算、186 笔交易、总额超过 4000 美元。 更值得盯的是:更先进模型代表用户时,客观结果更好,但用户未明显感知差距。代理商业的风险不在会不会砍价,而在议价能力开始被模型等级重新分配。

AnthropicProject DealAI代理
豆子胀气偏方被测了一遍:多数没用,真有用的也有代价
其他 2026/4/26

豆子胀气偏方被测了一遍:多数没用,真有用的也有代价

Serious Eats 联合哈佛《Science of Cooking》课堂团队,测试了 51 个 pinto beans 样本、17 种“减胀气”办法。结果很直接:泡豆、倒泡豆水、月桂叶、昆布、压力锅、焯水等老办法,在本次条件下没看到可观差异。罐头豆冲洗和 Beano 酶更接近有效方案,但一个牺牲风味,一个受食物形态限制。

豆子胀气Serious Eats哈佛 Science of Cooking