2026-03-25

24 篇热帖

Wine 11 rewrites how Linux runs Windows games at kernel with massive speed gains

Wine 11:Linux 游戏体验的重大升级

简介:

Adam Conway,XDA 的首席技术编辑,在文章中介绍了 Wine 11 的发布,并强调了它对 Linux 游戏体验的重大改进。Wine 11 不仅仅是常规的年度更新,它代表了 Wine 项目的巨大进步,为 Linux 游戏带来了显著的性能提升和兼容性增强。

主要改进:

  • NTSYNC 支持: 这是 Wine 11 的核心特性,代表了 Wine 处理线程同步方式的根本性改变。以往 Wine 使用了不理想的 workaround 机制(esync 和 fsync),而 NTSYNC 则通过在内核中添加新的驱动程序,直接模拟 Windows NT 同步对象 API,消除了性能瓶颈,大幅提升了游戏性能。据开发者测试,某些游戏性能提升高达 678%。NTSYNC 已经集成到 Linux 内核 6.14 中,Valve 也在 SteamOS 3.7.20 beta 中默认加载了该驱动,这意味着 Steam Deck 用户将自动受益。
  • WoW64 架构完成: WoW64 是 Windows 中让 32 位应用程序在 64 位系统上运行的子系统。Wine 11 完成了对 WoW64 架构的实现,用户不再需要安装 32 位系统库,Wine 能够内部处理 32 位和 64 位可执行文件的转换,简化了依赖管理,并支持 16 位应用程序。
  • Wayland 驱动改进: Wine 11 显著改进了 Wayland 驱动,实现了 Wine 和 Wayland 应用之间的双向剪贴板支持、拖放功能,以及更准确的显示模式切换。
  • 其他优化:
    • OpenGL 渲染后端变为 EGL (X11)。
    • Vulkan 支持升级到 API 1.4,并初步支持硬件加速的 H.264 视频解码。
    • 改进了赛车轮和飞行摇杆的力反馈支持。
    • 改进了蓝牙支持,以及 MIDI 音源处理。
    • 优化了线程优先级管理和 ARM64 设备的兼容性。

总结:

Wine 11 带来了多项重大改进,特别是 NTSYNC 和 WoW64 的完成,这些改进将显著提升 Linux 游戏的性能和兼容性。虽然并非所有游戏都能看到显著变化,但对于那些受线程同步和 32 位依赖影响的游戏,提升将非常明显。Wine 11 的发布标志着 Linux 游戏体验迈出了重要一步。

Is anybody else bored of talking about AI?

关于人工智能讨论的疲惫:一个观点总结

这篇文章表达了作者对当前过度关注人工智能的讨论感到疲惫的观点。以下是文章的主要内容:

核心观点:

  • 作者认为,虽然人工智能很棒,并且对工作流程产生了积极影响,但围绕人工智能的讨论已经变得过于频繁和重复,缺乏新意。
  • 作者希望人们能够减少对工具本身的关注,转而关注构建的实际项目和它们所创造的价值。

具体论述:

  • 互联网社区的变化: 原本充满有趣项目和问题的互联网社区 (例如 Hacker News) 如今被大量关于使用 Claude 代码工具的帖子所淹没,甚至出现了用 AI 工具控制宠物并玩游戏的案例,这让作者感觉有些自满。
  • “AI工程师”的兴起: 作者回忆起 2023 年“产品工程师”的概念,强调工程师应该关注产品价值而非代码本身。然而,目前似乎又回到了对代码工具的过度关注,特别是对自动补全功能的痴迷。
  • 管理层的参与: 管理层开始过度干预软件开发生命周期 (SDLC),并引入了“使用更多 AI”的指标,将注意力集中在 tokens 的使用数量上,这与以往关注部署速度和响应时间等输出指标不同,并无实际意义。
  • 类比: 作者用木工爱好者只讨论锤子而不是展示他们制作的家具进行类比,强调了工具本身与最终产品之间的区别。

总结:

作者希望人们能够回归到关注实际项目和创造价值,而不是过度关注人工智能工具本身。文章承认了其表达观点的讽刺性,但也强调了技术的核心价值在于为他人创造价值,即使这个“他人”只是自己。文章呼吁分享更多关于“酷炫的项目”而不是仅仅是“使用的工具”。

Goodbye to Sora

总结:关于x.com的隐私扩展问题

主要内容:

由于一些问题,x.com(原Twitter)目前可能无法正常使用。

关键信息:

  • 问题原因: 某些隐私相关的浏览器扩展程序可能导致x.com出现问题。
  • 解决方案: 用户应禁用这些隐私扩展程序,然后再次尝试访问x.com。

总结:

x.com用户在使用时遇到问题,可能原因是浏览器中安装了某些隐私扩展。建议用户禁用这些扩展以解决问题。

GitHub is once again down

GitHub 服务中断事件总结 (GitHub Service Interruption Summary)

事件概况 (Incident Overview):

2026年3月24日,GitHub 出现服务中断事件,影响了多个 GitHub 服务,包括 Actions、Issues、Pull Requests、Webhooks 和登录功能。部分用户在使用这些功能时遇到了错误。

事件时间线 (Timeline of Events):

  • 20:18 UTC: GitHub 开始调查 Actions 服务性能下降的报告。
  • 20:20 UTC: Webhooks 服务出现性能下降,调查仍在进行中。
  • 20:23 UTC: Pull Requests 服务出现性能下降,调查仍在进行中。
  • 20:23 UTC: Issues 服务出现性能下降,调查仍在进行中。
  • 20:38 UTC: GitHub 确认多个 GitHub 服务出现错误率上升,包括 Actions、Issues、Pull Requests、Webhooks 和登录功能。大部分服务开始出现恢复迹象。预计在 21:00 UTC 发布后续更新。
  • 20:56 UTC: 事件已解决。感谢用户的耐心和理解。将尽快分享详细的根本原因分析报告。

受影响的服务 (Affected Services):

  • Actions
  • Issues
  • Pull Requests
  • Webhooks
  • 登录功能 (Login Functionality)

当前状态 (Current Status):

事件已解决。

后续行动 (Follow-up Actions):

将发布详细的根本原因分析报告。

Arm AGI CPU

Arm AGI CPU 发布:面向人工智能基础设施的新型芯片 (Arm AGI CPU Launch: A New Chip for AI Infrastructure)

以下是关于 Arm AGI CPU 发布的重要信息概要:

核心内容:

Arm 正式发布 Arm AGI CPU,这是一类面向生产环境的硅芯片,基于 Arm Neoverse 平台构建,旨在为下一代人工智能基础设施提供动力。这是 Arm 首次发布其自身硅产品,标志着 Arm 在数据中心领域的重要战略拓展。

背景 & 需求:

  • 随着人工智能系统在全球范围内持续运行,且工作负载日益复杂,CPU 成为现代基础设施的关键瓶颈。
  • Agentic AI (代理式人工智能) 的兴起进一步加剧了对 CPU 的需求,因为软件代理能够协调任务、与多个模型交互并实时做出决策,消除了人类交互的瓶颈。
  • Arm Neoverse 已经支持了包括 AWS Graviton、Google Axion、Microsoft Azure Cobalt 和 NVIDIA Vera 等领先的超大规模和 AI 平台。

Arm AGI CPU 的特点:

  • 设计目标: 为大规模的 Agentic AI 工作负载提供持续的高性能,在现代数据中心的功率和散热限制内实现数千个核心并行运行。
  • 关键优势:
    • 卓越的内存带宽: 提高每个机架的有效线程执行。
    • 高性能内核: 基于 Arm Neoverse V3 CPU 核心,单线程性能优异。
    • 高密度部署: 参考服务器配置为 1OU,双节点设计,每个刀片包含 272 个核心。
    • 性能提升: 与最新的 x86 系统相比,Arm AGI CPU 在每个机架上可提供超过 2 倍的性能。
  • 硬件配置示例:
    • Arm 参照服务器配置:1OU,双节点,每个刀片 272 个核心。
    • Supermicro 液体冷却设计:可容纳 336 个 Arm AGI CPU,超过 45,000 个核心。

合作伙伴 & 商业进展:

  • Meta 是领先的合作伙伴和客户,与 Arm 共同开发 Arm AGI CPU,以优化其大规模基础设施。
  • 其他合作伙伴包括:Cerebras、Cloudflare、F5、OpenAI、Positron、Rebellions、SAP 和 SK Telecom。
  • 商业系统已可供从 ASRockRack、Lenovo 和 Supermicro 订购。

生态系统支持:

  • 超过 50 家领先公司(包括超大规模、云、硅、内存、网络、软件、系统设计和制造公司)支持 Arm 计算平台的扩展。
  • Arm 计划发布 Arm AGI CPU 1OU 双节点参考服务器,并将其贡献给 Open Compute Project (OCP)。

未来展望:

  • Arm AGI CPU 是 Arm 新数据中心硅产品线的首款产品,未来将推出更多产品,致力于提供一流的性能、可扩展性和效率。
  • Arm 将继续与 Neoverse CSS 产品路线图保持一致,确保平台架构和软件兼容性。

主要结论:

Arm AGI CPU 的发布标志着 Arm 在人工智能基础设施领域的重要一步,旨在满足 Agentic AI 的需求,并为未来的计算创新奠定基础。 它代表着 Arm 在数据中心领域的持续领导地位。

TurboQuant: Redefining AI efficiency with extreme compression

TurboQuant:AI向量压缩的新突破 (TurboQuant: A New Breakthrough in AI Vector Compression)

本文介绍了TurboQuant,一种新的压缩算法,旨在解决人工智能(AI)模型中高维向量带来的内存瓶颈问题,尤其是在关键-值缓存(Key-Value Cache)和向量搜索方面。该算法及其相关技术Quantized Johnson-Lindenstrauss (QJL) 和 PolarQuant 展现出在不牺牲模型性能的前提下显著降低内存占用,对搜索和AI领域具有潜在的深远影响。

核心问题与传统方法:

  • 高维向量的挑战: AI模型使用高维向量来理解和处理复杂信息,但这些向量占用大量内存,限制了模型性能。
  • 向量量化: 向量量化是一种数据压缩技术,旨在减少高维向量的大小,提高向量搜索速度并缓解关键-值缓存的压力。
  • 传统量化的局限: 传统的向量量化方法通常会引入额外的内存开销,因为需要计算和存储量化常数,抵消了压缩带来的好处。

TurboQuant 的工作原理:

TurboQuant通过两步方法实现高效压缩:

  1. 高质量压缩 (PolarQuant): 首先,TurboQuant通过随机旋转数据向量,简化数据几何结构。然后,使用标准量化器对向量的每个部分进行量化,捕获原始向量的主要特征。
  2. 消除隐藏误差 (QJL): TurboQuant利用QJL算法对第一阶段留下的少量误差进行处理,消除偏差,提高注意力分数(Attention Score)的准确性。

关键技术:

  • QJL (Quantized Johnson-Lindenstrauss): 使用Johnson-Lindenstrauss Transform将高维数据压缩到单符号位 (+1 或 -1),几乎不增加内存开销。
  • PolarQuant: 将向量转换到极坐标系,利用角度模式的集中性,消除传统量化方法所需的内存开销。

实验结果:

  • 在LongBench、Needle In A Haystack、ZeroSCROLLS、RULER和L-Eval等基准测试中,使用Gemma和Mistral等开源LLM进行评估。
  • TurboQuant在保持模型性能的同时,显著降低了关键-值内存占用。
  • 在“needle-in-haystack”任务中,TurboQuant实现了完美的下游结果,关键值内存大小减少了至少 6 倍。
  • TurboQuant能够将关键-值缓存量化到仅 3 位,无需训练或微调,且运行时速度比原始 LLM 更快,在H100 GPU加速器上可实现高达 8 倍的性能提升。
  • 在向量搜索中,TurboQuant与PQ和RabbiQ等先进方法相比,实现了更高的召回率,即便后者使用了数据集相关的优化。

总结与展望:

TurboQuant、QJL和PolarQuant不仅是工程解决方案,更具有坚实的理论基础,为AI领域带来了效率提升。 该技术将加速语义搜索,并为更广泛的AI应用提供支持,尤其是在需要高效处理大规模向量数据的场景中。该研究团队与谷歌、KAIST、NYU等机构的研究人员合作完成。

关键词: 向量压缩, 向量搜索, 关键-值缓存, TurboQuant, QJL, PolarQuant, 量化, 人工智能。

Meta told to pay $375M for misleading users over child safety

Meta 被判罚 3.75 亿美元,因误导用户关于儿童安全问题

摘要:

Meta(Facebook、Instagram 和 WhatsApp 的母公司)近日在新墨西哥州的一项诉讼中被判罚 3.75 亿美元(约 279 英镑),原因是该公司涉嫌误导用户,声称其平台对儿童是安全的。陪审团认定 Meta 的平台存在危害儿童的风险,并使他们暴露于露骨内容和性掠食者接触之中。

主要内容:

  • 诉讼背景: 新墨西哥州总检察长 Raul Torrez 于 2023 年起诉 Meta,指控该公司通过推荐算法将年轻用户引导至包含露骨内容、儿童性虐待内容,甚至是性侵犯和贩卖人口等内容的平台。
  • 陪审团裁决: 陪审团认定 Meta 违反了新墨西哥州的《不公平行为法》,因其对平台儿童安全性的宣传具有误导性。总罚款由数千项违规行为构成,每项最高罚款为 5000 美元。
  • 证据与证词: 审判过程中,州检察官提供了 Meta 内部文件,并听取了前员工的证词,包括前工程主管 Arturo Béjar(已成为吹哨人)。Béjar 提供了关于他在 Instagram 上进行的实验的证据,这些实验表明未成年用户被推送了性暗示内容,并且他自己的女儿也收到陌生人的性暗示信息。Meta 内部研究显示,在某个时间点,16% 的 Instagram 用户报告说在一周内看到了不想要的裸露或性活动内容。
  • Meta 的回应: Meta 否认指控,表示公司致力于保障用户安全,并持续努力识别和移除不良行为者和有害内容。公司计划对该裁决提出上诉,并强调其在保护青少年在线安全方面的记录。Meta 近期推出了“青少年账户”和提醒家长孩子搜索自残内容的功能。
  • 其他诉讼: Meta 还面临着在洛杉矶举行的另一项诉讼,该诉讼指控 Meta 和 Google 的平台故意设计成容易让儿童成瘾。此外,美国各地还有数千起类似的诉讼正在进行中。
  • 总检察长的观点: Torrez 表示,Meta 的高管们知道他们的产品会伤害儿童,无视了员工的警告,并向公众谎报了他们所知道的情况。

关键词: Meta, Facebook, Instagram, WhatsApp, 儿童安全, 诉讼, 罚款, 推荐算法, 误导, 吹哨人.

Show HN: I took back Video.js after 16 years and we rewrote it to be 88% smaller

好的,以下是对原文内容的总结,用中文写成,且字数控制在800字以内:

Video.js v10.0.0 Beta 发布:全新架构,更轻量,更灵活

Video.js 团队宣布发布 Video.js v10.0.0 Beta 版本,这是一个基于全新的架构进行的重大重写,同时也借鉴了 Plyr、Vidstack 和 Media Chrome 等开源项目的经验。该项目汇集了来自多个开源社区的开发者,拥有 7.5 万 GitHub 星标和每月数十亿次的视频播放量。

重写背景与目标:

Video.js 最初是为了帮助从 Flash 过渡到 HTML5 视频而创建。随着时间的推移,代码库和 API 逐渐落后于现代 Web 开发趋势。此次重写旨在:

  • 大幅减小包体积: 默认包体积减少了 88%,即使不移除自适应码率 (ABR) 支持,也比之前的版本小 66%。
  • 提升可定制性: 更好地适应开发者常用的框架开发模式,提供对 React、TypeScript 和 Tailwind CSS 的原生支持。
  • 优化默认外观和性能: 默认样式和性能都得到了显著提升。
  • 为 AI 集成做准备: 代码库和文档的设计便于 AI 代理参与开发。

主要改进:

  1. 包体积优化:

    • 默认情况下,Video.js v10 的包体积比 v8.x.x 小 88%。
    • 通过解耦自适应码率 (ABR) 支持,进一步减小体积。
    • 新推出的 Streaming Processor Framework (SPF) 允许构建更小的、专门用于特定需求的流媒体引擎。
    • 使用 SPF 构建的简单 HLS 引擎的体积仅为 Video.js v8 加上 ABR 的 19%。
  2. Streaming Processor Framework (SPF): SPF 是一个基于函数组件的新引擎框架,可以构建轻量级的流媒体引擎。它可以根据需求定制,例如,短视频应用不需要 DRM 和广告支持,SPF 可以省略这些代码,从而进一步减小体积。

  3. 组件化与预设:

    • 将状态、UI 和媒体层分离成独立的组件,通过 API 交互。
    • 提供了默认视频、音频和背景视频预设,简化了开发流程。
    • 开发者可以轻松地替换或配置这些组件,实现高度定制化的播放器。
  4. UI 定制:

    • 提供了经过打磨的默认皮肤,并允许开发者轻松地“解耦”皮肤,获取完整的源代码进行修改。
    • UI 组件基于无样式化 UI 原语,灵感来自 Base UI 和 Radix,方便开发者进行定制。
  5. AI 支持:

    • 为了方便 AI 代理参与开发,提供了更抽象的组件、无样式化 UI 原语、LLM 文档和 AI 技能。

未来展望:

  • 目标于 2026 年中期发布正式版本 (GA)。
  • 在 GA 之前,将实现与 Plyr、Vidstack 和 Media Chrome 的功能对齐。
  • 提供迁移指南,帮助开发者升级到 v10。
  • 增加更多预设,支持各种常见的用例。

如何参与:

  • 在 GitHub 上提交问题和反馈。
  • 加入 Discord 社区进行讨论。
  • 前往 videojs.org 了解更多信息和安装指南。

Video.js v10 Beta 的发布标志着该项目的一次重大升级,旨在为开发者提供更轻量、更灵活和更易于定制的视频播放器解决方案。

Show HN: Email.md – Markdown to responsive, email-safe HTML

确认您的电子邮件地址 - 摘要

This document is a confirmation email designed to verify a user's email address. Here's a summary:

主要内容 (Main Content):

  • 目的 (Purpose): 邮件旨在确认用户提供的电子邮件地址。
  • 确认码 (Confirmation Code): 邮件中包含一个确认码,用户需要在浏览器窗口中输入该码以完成登录流程。 确认码为 DFY-X7U
  • 安全提示 (Safety Note): 如果用户未请求此邮件,可以忽略此邮件,无需担心。

结构 (Structure):

  • 头部 (Header): 包含公司Logo (图片链接: https://...logo.png)。
  • 正文 (Body): 包含确认码和安全提示。
  • 页脚 (Footer): 包含公司信息 (Acme Inc. | 123 Main St) 和退订链接 (Unsubscribe: https://example.com/unsub)。

关键功能 (Key Functionality):

  • 验证电子邮件地址,允许用户完成登录流程。
  • 提供安全提示,告知用户如果未请求该邮件,可以忽略。
  • 提供退订链接,允许用户取消订阅未来邮件。

主题 (Theme): 深色主题 (dark).

I wanted to build vertical SaaS for pest control, so I took a technician job

蓝领转型:从咨询到虫害防治,再到创业之路

本文讲述了一位白领销售顾问的职业转型经历,从对传统行业咨询的兴趣,到最终决定投身蓝领虫害防治行业并最终开始创业的故事。

转型的契机

作者原本从事白领销售咨询工作,发现企业越来越不愿意参与行业调研。在帮助一家装修公司进行市场咨询的过程中,作者接触到了一位成功卖掉虫害防治公司的客户。这位客户在20年间打造了公司,并从一开始就采用了垂直SaaS软件,这成为公司成功的关键因素。虫害防治行业具有潜在的巨大市场(美国市场规模300亿美元)、重复性收入、专业化、碎片化以及受监管等特点,吸引了作者。

入职与挑战

作者迅速投递了大量求职申请,通过亲自拜访,很快获得了两家公司的职位,并选择了其中一家,该公司是全国最大的虫害防治集团旗下的子公司。入职后,作者发现招聘只是开始,公司在招聘流程上存在诸多问题,反应迟缓,效率低下。

快速学习与认证

为了尽快成为一名合格的虫害防治技术员,作者利用自学和自制的GPT训练模型,仅用13天就通过了考试,创造了公司记录。

工作中的问题

入职后的实际工作也面临着不少挑战:

  • 车辆问题: 入职后车辆配备迟迟未到,第一天就遇到了电池没电的情况。
  • 报销流程: 燃料卡迟迟未到,报销流程繁琐,需要等待数周。
  • 系统与工具: 公司使用的Salesforce系统经过了大量定制,臃肿且不便于使用,需要注册十多个应用程序才能完成工作。
  • 监控: 公司对车辆怠速、GPS位置、每次拜访时间、电话活动等进行监控,虽然技术员有规避方法,但公司对表现不佳的员工容忍度为零。

销售机会与突破

在跟随一名资深技术员进行工作时,作者主动与客户沟通,成功进行了一次小额追加销售。随后,作者被公司录用了销售职位。作者迅速对辖区内的潜在客户进行了地图绘制,并建立了联系方案。

业绩与瓶颈

在短短21天内,作者通过外联活动,成功签订了一份价值2.4万美元的购物中心年度合同,并完成了其他一些小额追加销售,总计创造了3万美元的年度经常性收入 (ARR)。 然而,内部报价流程繁琐,险些导致大额合同流失。销售培训仅限于Zoominfo的线上研讨会。尽管公司业务蒸蒸日上,但员工缺乏积极性,不愿主动提出改进建议,更倾向于维持现状。作者认为,这种文化阻碍了公司进一步发展。

创业决定与未来规划

离开公司后,作者的经理建议他自己创业。最终,作者决定创办自己的公司,计划收购一家小型住宅虫害防治公司,为其打造工具,并以此为基础构建一个可扩展的平台。 作者正在寻找对家庭服务业务进行收购、投资或整合的合作伙伴。

VitruvianOS – Desktop Linux Inspired by the BeOS

V\OS 操作系统简介

V\OS (VitruvianOS) 是一个基于 Linux 的操作系统,旨在复兴 BeOS 的优雅与简洁,并将其融入现代操作系统中。 它结合了 Linux 的强大功能与 BeOS 的用户友好性,提供性能和易用性的独特结合。

主要特点:

  • 快速、响应和易用: V\OS 致力于提供低延迟和直观导航的用户体验,强调用户体验、工作流程和舒适度。
  • 免费且开源: V\OS 遵循 KISS (Keep It Simple, Stupid) 原则,完全免费且开源,建立在 Linux 基础上,并受到 Haiku 和 BeOS 的启发。
  • 自主控制: V\OS 强调用户自主权,不收集用户数据,用户拥有对操作系统的控制权。
  • 社区驱动: V\OS 的开发团队与社区之间保持紧密的联系,并积极采纳用户反馈来改进系统。
  • 开箱即用 (OOTB): V\OS 默认配置良好,无需额外配置或安装应用程序即可立即使用。
  • Nexus 内核桥接: Nexus 是 Vitruvian 的自定义 Linux 内核子系统,它将 BeOS 风格的节点监控、设备跟踪和消息传递引入 Linux,使得可以在标准 Linux 内核上运行 Haiku 应用程序。
  • 支持 BeOS/Haiku 运行时: V\OS 通过集成定制的内核模块和实时补丁,支持 BeOS/Haiku 运行时,在 Linux 上实现最小化的 API 更改。

技术细节:

  • 文件系统支持: 支持 XFS 和 SquashFS 文件系统,包括对扩展属性的支持。
  • 内核: 默认情况下,系统包含实时补丁的 Linux 内核,同时支持非实时 Linux 内核。
  • 未来计划: 未来版本计划支持文件系统索引、实时查询和图形化登录的多用户支持。

参与方式:

版权信息:

版权所有 (c) 2018 - 2025, The Vitruvian Project;保留所有权利。

Disney Exits OpenAI Deal After AI Giant Shutters Sora

OpenAI Sora 应用关闭及相关影响总结

以下是对文章内容的总结:

OpenAI 宣布将关闭其 Sora AI 视频应用,尽管该应用仅于去年秋季发布。OpenAI 在声明中感谢了用户,并表示将分享关于应用和 API 的时间线以及如何保存用户作品的进一步信息。

主要事件和细节:

  • Sora 应用关闭: OpenAI 突然决定关闭 Sora 应用,尽管它曾因其免费使用现有知识产权和演员形象而引起好莱坞的震撼。
  • 迪士尼退出投资: 迪士尼也已退出与 OpenAI 去年签署的投资协议,该协议包括迪士尼承诺投资 10 亿美元并授权部分角色用于 Sora。
  • OpenAI 未放弃 AI 视频业务: OpenAI 计划继续发展 AI 视频技术,并将其整合到 ChatGPT 等其他应用中,但不再以独立的 Sora 应用形式存在。
  • 知识产权调整: Sora 曾因其对知识产权的处理方式而受到批评,OpenAI 随后允许工作室和人才对他们在平台上的知识产权和肖像拥有更多控制权。
  • 迪士尼的声明: 迪士尼表示尊重 OpenAI 的决定,并表示将继续探索与 AI 平台的合作,以负责任地利用新技术,同时尊重知识产权和创作者的权利。
  • 谷歌的地位: Sora 应用关闭使谷歌在 AI 视频生成领域占据主导地位,尽管目前谷歌尚未与知识产权持有者达成协议,并且正在面临一些诉讼。
  • 未来展望: 尽管生成式 AI 正在改变视频开发和制作,但 Sora 最终可能只成为一个脚注,而非改变游戏规则的软件。

总而言之,OpenAI 的这一举动表明其 AI 视频战略正在发生变化,Sora 应用的关闭以及迪士尼的退出都对 AI 视频领域的格局产生了影响,并提升了谷歌在该领域的地位。

Hypura – A storage-tier-aware LLM inference scheduler for Apple Silicon

Hypura: 运行超出 Mac 内存限制的大型语言模型

Hypura 是一个为 Apple Silicon 设计的存储分层感知 LLM 推理调度器。它根据访问模式、带宽成本和硬件能力,将模型张量分布在 GPU、RAM 和 NVMe 层级之间,从而允许超出物理内存的模型运行,而不会导致系统崩溃。

主要功能:

  • 支持大型模型: 允许在内存有限的 Mac 设备(如 32GB Mac Mini)上运行高达 31GB 的 Mixtral 8x7B 和 40GB 的 Llama 70B 模型,而这些模型在传统方式下会因内存不足而崩溃。
  • 智能张量放置:
    • GPU: 将需要快速访问的张量(如 Norms 和 Embeddings)放置在 GPU 上。
    • RAM: 将不适合 GPU 的张量放置在 RAM 中。
    • NVMe: 将剩余的张量按需从 NVMe 加载,并进行预取。
  • MoE 优化: 针对 MoE 模型(如 Mixtral),利用稀疏性,仅加载和运行所需的专家,显著减少 I/O 操作(I/O 减少 75%)。
  • 自动模式选择: 根据模型大小、架构和可用内存自动选择最佳推理模式:
    • Full-resident: 模型完全装载在 GPU 和 RAM 中,实现全 Metal GPU 速度。
    • Expert-streaming: 仅将非专家张量保留在 GPU 上,专家张量通过 NVMe 流式传输,拥有 99.5% 的神经元缓存命中率。
    • Dense FFN-streaming: 针对 GPU 内存不足的密集模型,将注意力层和 Norms 保留在 GPU 上,FFN 张量通过 NVMe 流式传输。
  • 零开销: 对于完全装载在内存中的模型,Hypura 不会引入额外的性能开销。

技术细节:

  • 读取 GGUF 文件: Hypura 读取 GGUF 文件,分析模型结构。
  • 硬件分析: 评估 GPU 工作集大小、RAM 和 NVMe 带宽。
  • 张量放置优化: 解决张量放置优化问题,将每个张量分配到相应的层级。
  • 高效 I/O: 使用 pread()F_NOCACHE 标志进行直接 I/O,进行预取。

性能:

在 M1 Max (32GB 统一内存, ~5.1 GB/s NVMe 顺序读) 上进行的基准测试表明:

  • Qwen 2.5 14B (8.4 GB) 在 GPU 上运行,速度为 21 tok/s,无性能开销。
  • Mixtral 8x7B (30.9 GB) 使用专家流式传输,速度为 2.2 tok/s,比 llama.cpp (OOM) 快得多。
  • Llama 3.3 70B (39.6 GB) 使用密集 FFN 流式传输,速度为 0.3 tok/s,比 llama.cpp (OOM) 快得多。

安装与使用:

  • 安装: 从源代码使用 Cargo 构建。
  • 快速启动:
    • hypura profile:分析硬件配置。
    • hypura run ./model.gguf --prompt "Hello, world":运行推理。
    • hypura serve ./model.gguf:启动 Ollama 兼容的服务器。

Ollama 兼容性:

Hypura 暴露了一个 Ollama 兼容的 HTTP API,可作为任何与 Ollama 通信的工具的替代品,例如 OpenClaw。

架构:

Hypura 是一个 Cargo 工作区,包含两个 crate:

  • hypura: 主二进制文件和库。
  • hypura-sys: FFI 绑定到 llama.cpp。

安全注意事项:

  • 在未经验证的模型上,始终从 --max-tokens 10 开始。
  • 避免强制运行超出 RAM 限制的模型。

免责声明: 项目作者声明代码并非由其本人编写,而是通过 LLM 辅助完成。

In Edison’s Revenge, Data Centers Are Transitioning From AC to DC

人工智能时代数据中心电力基础设施的转型

摘要:

随着Nvidia GTC大会上新芯片架构的发布,人工智能(AI)对电力需求日益增长,传统数据中心基础设施面临挑战。为了应对这一趋势,电力行业正在积极响应,Delta、Eaton和Vertiv等公司纷纷推出新的设计方案。文章重点关注了从传统的交流(AC)电力系统向高压直流(DC)电力系统的转变,以及由此带来的好处和挑战。

主要要点:

  • AC-to-DC转换的挑战: 传统数据中心使用AC电力,需要经过多次转换才能为计算芯片供电。这种转换过程效率低下,会产生能量损耗,并且随着AI应用对电力需求的增加,转换器的尺寸和铜缆需求也变得难以承受。1MW的机架可能需要高达200公斤的铜排,对于1GW的数据中心,则可能需要高达20万公斤的铜。
  • 高压直流电力的优势: 通过将13.8kV的AC电网电力直接转换为800V DC,可以显著减少中间转换步骤,提高系统可靠性,降低散热,提高能源效率并缩小设备占地面积。 800V DC相较于415V AC,在相同导线尺寸下可传输85%更多的功率,可减少45%的铜缆需求,并带来5%的效率提升和30%的总拥有成本降低。
  • 行业创新:
    • Vertiv正在开发与Nvidia Vera Rubin Ultra Kyber平台集成的800V DC生态系统,预计将于2026年下半年上市。
    • Eaton正在利用固态变压器(SST)技术,开发800V DC电力系统。
    • Delta推出了800V DC的660kW并列电源 racks,内置480kW的电池备用单元。
    • SolarEdge正在研发99%效率的SST,并将其与原生DC UPS和DC电力分配层配对。
  • 行业现状与未来展望: 尽管高压DC数据中心已经在中国出现,并且Mt. Diablo Initiative(Meta、Microsoft和Open Compute Project的合作)也在进行400V DC的实验,但大多数行业仍处于起步阶段。行业需要一个完整的、协调的生态系统,包括电力电子、保护、连接器、传感和安全组件。 供应链建设的关键在于稳定标准和安全框架,以便供应商能够自信地设计、认证、制造和安装设备。

总结:

随着人工智能的快速发展,数据中心电力基础设施正面临转型。高压直流电力系统凭借其更高的效率和更低的成本,有望成为未来数据中心的主流选择。然而,要实现这一转变,需要行业各方的共同努力,包括制定标准、完善供应链和进行大规模投资。

Why I forked httpx

httpxyz: 关于 httpx 分叉的说明 (httpxyz: Explanation for Forking httpx)

这篇文章解释了作者为何分叉了流行的 Python HTTP 客户端库 httpx,并创建了名为 httpxyz 的新分支。

分叉原因:

作者指出,尽管 httpx 非常受欢迎,但其维护方面存在以下问题:

  • 缺乏维护和版本发布: 自 2024 年 11 月以来,httpx 几乎没有发布新版本,即使包含了作者修复的 zstd 解码错误也未被发布。作者多次请求发布包含修复的版本,但未果。
  • 社区沟通受限: GitHub 仓库中的 issue 被隐藏,讨论被关闭,这阻碍了社区的贡献和使用。
  • 长期存在的 1.0 版本计划: httpx 已经计划 1.0 版本超过两年,而且 1.0 版本可能会与当前版本有很大差异。
  • 依赖项目的应对措施: OpenAI 和 Anthropic 等依赖 httpx 的项目已经开始在 pyproject.toml 文件中添加保护机制,以避免安装 1.0 版本。
  • 破坏性小版本更新: httpx 在过去的小版本更新中引入了破坏性更改,给依赖该库的用户带来了不便。
  • 其他项目维护模式: 作者还指出,其创建的其他项目(Django REST framework 和 MkDocs)也出现了类似关闭 issue 和讨论的情况,这表明存在重复的模式。

httpxyz 的目标:

作者认为分叉是提供一个稳定 httpx 发展路径的最佳方式。 httpxyz 的目标是:

  • 保持稳定: 不进行重大重写或破坏性更改。
  • 加速迭代:httpx 更快地发布版本,但避免破坏现有功能。
  • 社区合作: 与 Sander Wegter 合作维护,分担工作量。

代码托管平台:

httpxyz 的代码托管在 Codeberg 上,作者认为这有助于避免技术社区过度依赖 GitHub,并支持非营利性的代码托管平台。

迁移建议:

作者建议,如果现有代码使用 httpx 正常工作,则无需立即迁移。如果需要,用户可以选择迁移到 httpxyz 或其他替代方案,如基于 requestsniquests

插件兼容性:

作者承认,某些复杂的插件和扩展可能需要调整才能与 httpxyz 兼容。

总而言之,httpxyz 的分叉是为了解决 httpx 维护方面的不足,并为用户提供一个稳定、可维护的替代方案。

The AI Industry Is Lying to You

人工智能泡沫的破裂:数据中心、GPU 供应和软件工程的危机

本文总结了对人工智能行业现状的分析,揭示了其潜在的危机。核心观点如下:

1. 数据中心建设停滞:

  • 尽管宣布了大量的数据中心计划(241GW),但实际建设中的数据中心仅占 79.5GW,其中只有 5GW 正在建设中。
  • 美国的数据中心容量新增量在 2025 年仅有 3GW,远低于 NVIDIA 的 GPU 销售量。
  • 数据中心电力供应不足,PJM 地区面临严重的电力缺口。
  • 数据中心建设周期过长,如 OpenAI 的 Stargate Abilene 项目,延期数年。

2. NVIDIA GPU 供应与需求失衡:

  • NVIDIA 预计 2025-2027 年间销售 1 万亿美元的 GPU,但实际供应受限于数据中心建设进度。
  • 安装一个季度销售的 GPU 需要 6 个月的时间,这表明需求和供应之间的巨大差距。
  • 大量 GPU 正在被运往中国,这引发了关于合规性和潜在风险的担忧。

3. 人工智能工具对软件工程的影响:

  • 大型科技公司鼓励员工使用人工智能工具,并将其与绩效考核挂钩。
  • 这种做法导致了代码质量下降,维护成本增加,以及软件工程师技能退化。
  • 一些人工智能工具的滥用甚至导致了安全漏洞和系统故障。

4. 盈利模式的脆弱性:

  • 尽管人工智能行业声称能够带来巨额利润,但实际盈利情况不佳。
  • 主要人工智能公司,如 OpenAI 和 Anthropic,在巨额投资后仍面临亏损。
  • 依赖人工智能降低成本的策略,可能导致未来利润率下降。

5. 行业风险与挑战:

  • 大量资金涌入人工智能领域,但实际回报却不确定。
  • 数据中心建设的延迟和电力供应的不足,可能导致人工智能发展受阻。
  • 人工智能工具的滥用可能导致软件质量下降和系统安全问题。
  • 人工智能泡沫的破裂,将对整个科技行业产生重大影响。

总结: 人工智能行业目前正面临着诸多挑战,包括数据中心建设停滞、GPU 供应与需求失衡、人工智能工具对软件工程的影响以及盈利模式的脆弱性。 整个行业可能正处于一个泡沫的边缘,需要对现状进行深刻反思和调整。

Jury finds Meta liable in case over child sexual exploitation on its platforms

新墨西哥州判决 Meta 违反法律,判处罚款 3.75 亿美元

核心内容:

新墨西哥州陪审团裁定 Meta(Facebook 和 Instagram 的母公司)违反了新墨西哥州法律,未能有效警告用户平台存在的风险,未能保护儿童免受性掠夺者的侵害。

主要细节:

  • 判决结果: 陪审团判定 Meta 在所有指控中负有责任,包括“不公平和欺骗性”以及“无耻”的商业行为,并判处 Meta 支付 3.75 亿美元的损害赔偿金。
  • 起诉原因: 新墨西哥州总检察长 Raúl Torrez 指控 Meta 的平台成为了性掠夺者的“滋生地”。Meta 否认这些指控。
  • 法律压力: 此案是 Meta 和其他社交媒体平台面临的一系列法律诉讼中的一部分,这些诉讼主要关注年轻用户在平台上的安全问题。洛杉矶目前也有类似的案件正在审理中,指控 Meta 和 YouTube 通过设计成瘾功能损害年轻人的心理健康。
  • 调查过程: 新墨西哥州总检察长办公室通过创建虚假儿童 Facebook 和 Instagram 账户,进行了秘密调查。这些账户接触到了性暗示内容和要求分享色情内容的请求,并导致了三名成年男性的逮捕。
  • Meta 的辩护: Meta 辩称公司一直在努力确保平台安全,并投入大量资源保护年轻用户。公司律师认为,40,000 名员工负责维护 Facebook 和 Instagram 的安全。
  • 内部证词: 多名 Meta 前员工,包括前工程总监 Arturo Bejar 和前合作伙伴副总裁 Brian Boland,出庭作证。Bejar 称自己的 14 岁女儿在 Instagram 上收到了性骚扰信息,并认为 Meta 的算法可能有助于性掠夺者寻找目标。Boland 则表示,他离开公司时,他并不认为安全是 Mark Zuckerberg 和 Sheryl Sandberg 的优先事项。
  • 加密问题: 案件还涉及 Meta 计划停止在 Instagram 上支持端到端加密的消息传递功能,担心这会阻碍执法部门打击性掠夺者。
  • Meta 的回应: Meta 表示“尊重但不认同”这一裁决,并计划上诉。公司强调其致力于保护青少年在线安全,并与执法部门合作打击儿童性剥削。
  • 总检察长的观点: Torrez 称此判决是“对所有为 Meta 牺牲了孩子安全的家庭和儿童的又一次历史性胜利”。

后续发展:

  • 此案的后续部分将由法官直接裁决,可能导致 Meta 进一步承担责任并修改其平台。
  • Meta 律师 Kevin Huff 辩称,公司已经向用户明确表示,一些不良行为者和不当内容可能会逃过安全过滤。
  • 新墨西哥州总检察长办公室对 Meta 的调查方法受到质疑,Meta 指责其使用了被盗账户和照片。Torrez 则称这些批评是“转移视线”的手段。
Country that put backdoors in Cisco routers to spy on world bans foreign routers

美国联邦通信委员会禁止进口外国制造的消费级路由器,以应对国家安全担忧 (美国联邦通信委员会禁止进口外国制造的消费级路由器,以应对国家安全担忧)

美国联邦通信委员会 (FCC) 近期更新了“覆盖列表”,实际上禁止了所有外国制造的消费级网络路由器的新型号获得批准。此举旨在应对国家安全担忧,是特朗普政府推动国内制造业投资的又一项举措。

主要内容:

  • 禁止新型号: FCC 禁止批准任何新的外国制造的消费级路由器。目前已获得批准的现有型号不受影响,可以继续进口、销售和使用。
  • 国家安全风险: 这一决定由一个由白宫领导的跨部门机构评估后做出的,认为外国生产的路由器存在供应链漏洞,可能导致关键基础设施和国家安全受到威胁,并构成严重的网络安全风险。
  • 历史事件: 文章提到了“Volt”、“Flax”和“Salt Typhoon”等网络攻击事件,以及路由器在这些事件中扮演的角色。同时,也指出了美国情报机构过去曾拦截并修改思科路由器固件的讽刺性,用于间谍活动。
  • 制造现状: 实际上,绝大多数路由器都是在国外生产的,即使是思科和网件等美国公司销售的路由器也是如此。目前,星链 Wi-Fi 路由器是少数例外之一,该公司表示其在美国德克萨斯州进行生产。
  • 市场干预: 此政策被认为是对市场的过度干预,旨在鼓励 IT 公司在美国本土建立生产线。
  • 潜在影响: 评论者指出,建立新的美国制造能力需要数年时间,这意味着消费者可能需要使用较旧的路由器型号。
  • 例外情况: 国防部或国土安全部已授予“有条件批准”的设备,如果被认定为不构成不可接受的风险,则可免受限制。路由器制造商可以向 FCC 申请加入批准名单。
  • FCC 委员的表态: FCC 主席 Brendan Carr 表示欢迎这一行政部门的国家安全评估结果,并对将外国制造的路由器列入“覆盖列表”表示满意。

关键细节:

  • “覆盖列表”详细列出了受到《安全网络法》第二条规定的设备和服务,这些设备和服务被认为对美国国家安全构成不可接受的风险。
  • 此政策是特朗普政府国家安全战略的一部分,旨在减少美国对其他国家在核心组件上的依赖。

总而言之,FCC 的新政策旨在通过限制外国制造的消费级路由器,提高美国的网络安全和国家安全,但同时也面临着市场干预和潜在供应短缺的批评。

Flighty Airports

航班信息摘要 (Flight Information Summary)

以下是根据提供的航班信息进行的摘要:

数据来源: Flighty 应用机场数据

覆盖地区: 北美及加勒比地区

主要内容: 该数据展示了北美及加勒比地区主要机场的航班延误和取消情况。

关键信息:

  • 延误 (Delays): 大部分机场都存在航班延误,延误时间从几分钟到数小时不等。
  • 取消 (Cancellations): 多个机场报告了“高取消率” (High Cancellations),表明有大量航班被取消。
  • 地延 (Ground Delay): 少数机场报告了地延,这意味着飞机已在机场,但由于空中交通管制或其他因素,无法起飞。
  • 强风 (Strong Winds): 旧金山机场 (SFO) 报告强风影响。
  • 具体机场情况 (Examples):
    • 卡尔加里国际机场 (YYC): 出发延误 3 小时 19 分钟,延误率 6%。
    • 拉瓜迪亚机场 (LGA): 出发延误 1 小时 43 分钟,延误率 13%。
    • 迈阿密国际机场 (MIA): 出发延误 11 分钟,延误率 83%。
    • 洛杉矶国际机场 (LAX): 出发延误 4 分钟,延误率 90%。
    • 圣地亚哥国际机场 (SAN): 出发延误 9 分钟,延误率 67%。
    • 加勒比地区机场如坎昆 (CUN)、圣何塞卡波 (SJD) 报告100%延误。

总体趋势: 整体航班运行受到一定程度的干扰,延误和取消是普遍现象。

应用: 该数据可用于旅客实时了解航班状况,以便做出相应的出行安排。

Miscellanea: The War in Iran

关于伊朗战争的观察与战略思考

以下是我对当前伊朗战争的一些观察和对更广泛战略影响的思考。声明:我并非该地区专家,也无法获得任何特殊信息,因此我对所有情况都持高度不确定态度。但我对军事历史有相当的研究和经验,尤其擅长分析战略问题,无论古今。我希望本文能从这个角度出发。

我之所以在非周五的常规更新中发布这篇文章,是因为这是一个不寻常的话题,并且希望明确表示,即使世界各地的事件仍在发生——它们必须发生——我的博客不应变成政治新闻通讯。我没有时间将这些想法进行打磨和提炼以便发表到其他渠道,很多写作的艰辛工作在于将3500字(或7500字)的想法浓缩成一篇1500字的评论文章。不过,我需要将这些想法从脑海中释放出来。当然,这篇文章不可避免地会带有“政治性”,因为作为美国的公民,就战争发表评论意味着对发起这场战争的总统发表声明,他未经充分公众讨论,也未咨询国会就单方面且非法地发动了这场战争。

这场战争简直愚蠢透顶。

接下来,我将分析当前局势的战略影响,但我的总体论点是:对于美国而言,这场战争是一场不明智的赌博,赔率极低;这场赌博(即政权会迅速倒台)已经失败,结果只会带来负面影响。即使政权在未来几周内倒台或突然寻求和平,所有可能的结果都会使美国陷入比开始时更不利的战略地位。

在继续讨论之前,我想澄清几点。首先,这并非为伊朗政权辩护(这个政权令人憎恶)。然而,世界上存在许多令人憎恶的政权,但我们并非与所有政权都开战。其次,这篇文章的核心是关于美国的战略,或者说缺乏战略,而非关于以色列的战略。就我个人而言,我认为本杰明·内塔尼亚胡为了政治和个人利益而采取了短视行为,并且(虽然并非确定)以色列可能会为此付出代价。我将稍作提及,但这不是我的重点。同样,这篇文章也不是关于海湾国家战略的文章,这些国家——正如许多小国的命运一样——的命运很大程度上掌握在更强大的国家手中。

此外,我们必须记住,这不是一个学术练习:因为这些决策,许多、许多人将遭受苦难,他们既是该地区暴力冲突的受害者,也是经济波及的后果。

但以上只是引言。我希望在这里讨论的是,首先是政府所做的极其不明智的赌博,然后是政府现在陷入的陷阱,从中没有舒适的逃脱方式。

现状

我们需要先了解一些关于伊朗这个国家的基本事实。

首先,伊朗是一个大国。它的人口超过9000万(略多于德国,与土耳其相当),国土面积超过60万平方公里(是德国的四倍以上)。换句话说,伊朗的面积是得克萨斯州的二倍多,人口大约是三倍

更重要的是,伊朗的面积是伊拉克的3.5倍,人口大约是两倍。这很重要,因为我们知道伊拉克战争需要多少资源:在入侵期间,联军兵力达到50万。伊朗更大,因此需要更大的军队,这意味着需要投入巨额的兵力、资金,以及根本上需要_大量_的生命来征服。

(图片链接:https://i0.wp.com/acoup.blog/wp-content/uploads/2026/03/image-3.png?resize=960%2C829&ssl=1)

(图片来源:维基百科,伊朗地图) 这是一片非常大的国家。它还拥有许多具有挑战性的地形:大片干旱地区、高山和高原。这是一个难以入侵和更难以占领的国家。

事实上,鉴于伊朗从未对美国构成生存威胁(伊朗渴望成为像朝鲜那样的核威胁,只能模糊地梦想成为像俄罗斯那样的常规威胁),这意味着地面入侵伊朗在功能上是不可能的。虽然美国拥有原始资源可以做到这一点,但政治意愿并不存在,也很难存在。

同样重要的是,伊朗并非主要的战略重点。这是美国政策讨论中经常被忽视的一点,尤其是在右翼,因为伊朗是一个“敌人”,每个人都喜欢对敌人表态。但是,中东主要由贫穷、战略上不重要的国家组成。请理解我:

FCC has banned the import of all new foreign-made routers here's what you can do

美国联邦通信委员会禁止进口中国制造的家用路由器 (美国联邦通信委员会禁止进口中国制造的家用路由器)

概述:

2026年3月24日,美国联邦通信委员会(FCC)宣布禁止进口所有新的外国制造的家用路由器,理由是国家安全风险。此举对消费者路由器市场造成了重大影响。

主要内容:

  • 禁令: FCC将所有新的外国制造路由器添加到“受限清单”,这意味着这些路由器无法获得FCC授权,因此不能进口或在美国销售。
  • 原因: FCC声称,恶意网络攻击者利用外国制造的家用路由器漏洞对美国平民家庭发起直接攻击。 具体提及了Volt、Flax和Salt Typhoon等网络攻击活动。
  • 市场占比: 中国控制了美国约60%的家用路由器市场。
  • 相关诉讼: 德克萨斯州总检察长肯·帕克斯特已起诉TP-Link Systems,指控该公司允许北京访问美国消费者的设备。TP-Link否认这些指控。
  • 现状: 目前,美国境内没有完全由美国制造的家用路由器。
  • 应对措施:
    • 企业: 可以申请美国国防部或国土安全部(DOD/DHS)的“有条件批准”。
    • 现有设备: 现有设备的固件更新将在2027年3月1日之前允许。
  • 批评: 安全研究人员指出,与Salt Typhoon等攻击活动相关的漏洞也存在于美国品牌路由器中。 批评者认为,禁止外国制造并不能解决漏洞问题,反而造成了市场选择的限制。
  • 建议: 对于希望控制自己网络基础设施的用户,建议采取以下措施:
    • 刷入OpenWrt等开源固件。
    • 使用单板计算机(如树莓派)自建路由器。
    • 审计现有路由器的行为。
    • 购买已获得授权的路由器型号。
    • 支持开源网络项目。

其他信息:

  • FCC此前已于2025年12月对外国无人机采取了类似措施,DJI已提起诉讼。
  • 预计TP-Link也将对FCC的禁令提起诉讼。
  • 文章还提及了Adafruit提供的各种资源,包括电子产品展示、工程师问答、社区论坛以及CircuitPython等项目。

ARM AGI CPU: Specs and SKUs

ARM AGI CPU 总结

ARM AGI CPU 是 Arm 公司首次自主生产的硅芯片,于 2026 年 3 月 24 日在 Arm Everywhere 开发者大会上发布。它专为大规模 AI 基础设施设计,旨在为数据中心提供高性能和高密度支持,以应对 agentic AI 的需求。

主要特点:

  • **架构:**基于 Armv9.2 架构,支持 bfloat16 和 INT8 AI 指令,优化了 AI 运算性能。
  • **核心数量:**最高可达 136 个 Neoverse V3 核心,每个核心配备 2MB L2 缓存。
  • **时钟速度:**最高可达 3.7GHz 的加速频率。
  • PCIe & CXL: 96 线的 PCIe Gen6 以及 CXL 3.0 Type 3 接口,提供高带宽连接。
  • **制程工艺:**采用 3nm 制程工艺。
  • **功耗:**最高 TDP 为 420W。
  • **内存:**支持高达 6 Terabyte 的 DDR5-8800 内存,拥有 12 个 DDR5 通道。
  • **设计:**采用双 Chiplet 设计。

型号 (SKUs):

Arm AGI CPU 提供三种型号:

  • SP113012: 旗舰型号,拥有 136 个核心,提供最大核心数。
  • SP113012S: 128 核心型号,针对总拥有成本 (TCO) 进行优化。
  • SP113012A: 64 核心型号,针对每个核心的最大内存带宽进行优化。

服务器配置:

  • 参考配置: Arm 的参考服务器配置为 10U,双节点设计,每个节点包含两个芯片,拥有独立的内存和 I/O,总共 272 个核心。
  • 高密度配置: 与 Supermicro 合作推出液冷 200kW 设计,能够容纳 336 个 Arm AGI CPU,总共超过 45,000 个核心。
  • 标准机架: 30 个这样的 blade 可以完全填充一个标准的风冷 36kW 机架,总共提供 8160 个核心。

更多信息: