2025-11-07

34 篇热帖

FBI tries to unmask owner of archive.is

Archive.today 面临 FBI 调查:数据被要求提供,运营商身份成谜

Archive.today,一个以保存网页快照而闻名的网站,近日面临美国联邦调查局(FBI)的调查。据报道,FBI 已获得法院命令,要求加拿大服务提供商 Tucows 提供 Archive.today 客户的详细数据,包括地址、连接信息和支付信息。Tucows 未提供数据将面临处罚。

主要内容:

  • 网站简介: Archive.today 与互联网档案中的 Wayback Machine 类似,允许用户访问网页的历史快照。它以宽松的规则和匿名性著称,经常被用于绕过付费墙,这引起了媒体行业的反感。
  • 运营状况: 该网站运营资金主要来自捐款和自有资金。过去曾遇到过一些小问题,例如顶级域名运营商拒绝继续提供其服务。
  • FBI 调查: FBI 正在调查 Archive.today 的原因尚不明确,可能的调查方向包括版权问题、资金来源不明、运营商身份以及技术手段等。
  • 运营商身份之谜: 关于 Archive.today 运营商的身份存在多种说法。
    • 芬兰博主 Janni Patokallio 的研究表明,Archive.today 使用不断变化的 IP 地址的机器人网络来规避反抓取措施,并且可能基于俄罗斯。
    • 2024 年的一项私人调查则指出,该网站的运营商可能是一名来自纽约的软件开发人员,而之前的指向东欧的线索可能是错误的。
  • 网站反应: 近期 Archive.today 的运营者变得较为沉默,官方 X 账号发布了一条信息,使用“金丝雀”的比喻,暗示面临潜在的危险,并附带了包含法院命令的 PDF 链接。

总结:

Archive.today 网站正面临来自 FBI 的调查,其运营商身份和调查原因尚不明确。该事件引发了对网站匿名性、数据安全以及互联网档案服务面临的法律挑战的关注。

Meta projected 10% of 2024 revenue came from scams

最新新闻摘要

以下是近期新闻的总结:

1. Meta 因诈骗广告和违禁品销售获利丰厚:

内部文件显示,Meta (Facebook) 因其平台上的诈骗广告和销售违禁品,每年获得数十亿美元的利润。据报道,Meta 预计 2024 年 10% 的总收入(约 160 亿美元)将来自这些渠道。Meta 承认面临因未能阻止欺诈行为而可能遭受的巨额罚款,并优先在处罚最严厉的地区加强监管。公司在衡量打击诈骗可能造成的收入损失与罚款成本时进行了权衡。虽然 Meta 试图减少欺诈行为,但由于裁减了审核团队,导致大部分用户举报的违规行为被忽略或拒绝。Meta 方面表示,这些文件只是对其执法工作的“选择性呈现”。

2. Anduril 武器系统测试失败:

由 Palmer Luckey 创立的国防科技公司 Anduril 的自主无人机、水上无人船和人工智能支持的战斗机等未来战争系统,在实际测试中屡次失败。例如,Altius 无人机在乌克兰部署时易受俄罗斯干扰,已被撤回;水上无人船在海军测试中多次瘫痪;反无人机系统在加州机场测试中坠毁,引发 22 英亩的火灾。 Anduril 解释说,这些失败是其快速迭代开发过程的一部分。

3. OpenAI 合作伙伴承担巨额债务:

OpenAI 的基础设施项目,如 Stargate AI 数据中心,需要数十亿美元的资金,但这些债务主要由 OpenAI 的合作伙伴承担,包括 Oracle、SoftBank、CoreWeave、Crusoe 和 Blue Owl Capital。这些公司通过发行债券、贷款和信用协议来满足与 OpenAI 的基础设施和计算资源需求。OpenAI 内部人士承认,公司策略是利用其他公司的资产负债表。

4. Alibaba 和 ByteDance 在东南亚培训 AI 模型:

由于美国出口限制,Alibaba 和 ByteDance 等科技巨头正在东南亚(特别是新加坡和马来西亚)的数据中心培训其最新的大型语言模型。DeepSeek 是一家例外,它继续在国内进行模型训练,并在美国出口禁令生效前囤积了 Nvidia 芯片。

5. Alibaba 推出的 AI 智能眼镜:

零售和科技巨头 Alibaba 推出了其首款面向消费者的 AI 智能眼镜“Quark AI Glasses”,直接与 Meta 的 Ray-Ban Display 眼镜竞争。Quark AI 眼镜有两种版本,价格分别为 3,799 元(约 536 美元)和 1,899 元(约 268 美元),远低于 Meta 的 799 美元。

6. Tesla Robotaxi 规模缓慢增长:

Elon Musk 表示,奥斯汀的 Tesla Robotaxi 车队下个月将翻倍,但目前该地区仅有 29 辆车在运营。此前 Musk 曾表示,今年底计划在奥斯汀地区拥有 500 辆或更多的 Robotaxi。与此相比,Google 的 Waymo 在奥斯汀拥有超过 100 辆自动驾驶出租车,在旧金山湾区拥有 1000 辆。

7. Sherwood Media 声明:

Sherwood Media, LLC 是一家 Robinhood Markets, Inc. 的全资子公司,其观点不一定代表 Robinhood 及其附属公司的观点。

ICC ditches Microsoft 365 for openDesk

Please provide the content you want me to summarize. I need the text to be able to fulfill your request. Paste the content into our chat, and I will generate a concise, accurate summary in markdown format and Chinese language, adhering to your specifications (less than 800 words, no personal opinions, focus on purpose/structure/functionality for technical content).

Leaving Meta and PyTorch

Soumith Choksi 离开 Meta 和 PyTorch:总结

以下是对 Soumith Choksi 博客文章的总结,概述了他离开 Meta 和 PyTorch 的决定,以及他在 Meta 和 PyTorch 期间的经历。

主要内容:

  • 离开 Meta 和 PyTorch: Soumith Choksi 宣布于 2025 年 11 月 6 日离开 Meta,结束了他在 Meta 的 11 年职业生涯,以及大约 8 年的 PyTorch 领导工作。
  • PyTorch 的现状: 他认为 PyTorch 已经取得了显著成就,包括支持 exascale 训练、驱动基础模型、广泛应用于行业以及被全球各地的教育机构采用。他相信 PyTorch 已能独立发展,并拥有强大的团队和文化。
  • 未来计划: Soumith 计划追求一些“小而新”的事物,探索未知领域,并尝试一些让他感到不适的事情。他将继续关注 AI 领域,并可能参与 PyTorch 的开发。
  • 对 PyTorch 团队的感谢: Soumith 对所有参与 PyTorch 开发和维护的人表示感谢,强调了团队合作的重要性,并称 PyTorch 的成功归功于其社区和贡献者。他特别感谢了 Greg Chanan, Alban Desmaison, Ed Yang, Jason Ansel, Joe Spisak 等核心团队成员。

在 Meta 的经历:

  • 早期 FAIR 的黄金时代: Soumith 回忆了在 FAIR 的早期岁月,那时 FAIR 是一个小型、充满活力的研究团队,致力于开源 AI 研究。他与 Remi Denton, Arthur Szlam, Leon Bottou 等人合作,并参与了 Starcraft 机器人和 PyTorch 的早期开发。
  • 克服挑战: 他坦诚地承认,刚加入 FAIR 时曾经历严重的冒名顶替综合症,并感谢 Andrew Tulloch 的指导和帮助。

对 PyTorch 的贡献:

  • 全方位参与: Soumith 描述了他对 PyTorch 的全方位参与,包括设计、管理、产品管理、技术领导、沟通、文档编写、发布工程和 bug 修复等。
  • 社区的重要性: 他强调了 PyTorch 社区的重要性,并分享了他与用户互动时感受到的喜悦和成就感。他特别提到了一位研究生因使用 PyTorch 而取得突破性进展的故事。

感谢与认可:

  • 感谢 Meta 领导: Soumith 感谢 Mark Zuckerberg 和 Mike Schroepfer 对开源的坚定支持,以及 Yann LeCun 和 Rob Fergus 为 FAIR 奠定的基础。
  • 感谢团队和管理者: 他还感谢了 Meta 的团队成员和管理者,包括 Aparna Ramani 和其他支持过他的领导者。

总结:

Soumith Choksi 离开 Meta 和 PyTorch 标志着一个时代的结束,但他也相信 PyTorch 已经准备好迎接未来的挑战。他离开是为了追求新的机会,同时也表达了对 PyTorch 社区和 AI 领域的持续关注和支持。

Two billion email addresses were exposed

好的,以下是根据您提供的英文内容生成的中文摘要,字数控制在800字以内,不包含个人观点和未提及的信息,并使用Markdown格式:

20 亿电子邮件地址和 13 亿密码泄露:Have I Been Pwned 的应对

最近,Have I Been Pwned 网站处理了一笔规模空前的数据,包含 19.57 亿(约 20 亿)个独特的电子邮件地址和 13 亿个密码,其中 6.25 亿个密码是此前从未见过的。这笔数据来源于网络犯罪分子公开泄露的资料,由名为 Synthient 的公司索引并提供给 Have I Been Pwned,用于通知受害者。

Synthient 的角色及数据来源

Synthient 是一家由大学生 Ben 创办的公司,其主要任务是索引网络犯罪公开的数据,并将其提供给 Have I Been Pwned 用于通知受害者,是“照亮黑暗面”的好人。这些数据并非来自 Google 或其他平台的直接泄露,而是来自其他数据泄露事件,泄露的电子邮件地址和密码被收集、出售、重新分发,并用于“密码填充”攻击。攻击者利用已泄露的凭据尝试登录其他网站,因为用户经常在不同网站上重复使用密码,导致一个泄露事件可能影响多个平台。

数据验证过程

Have I Been Pwned 对数据的真实性进行了验证。创始人 Troy Hunt 率先验证了自己的数据,发现一个老邮箱地址和相关的密码出现在泄露清单中。随后,他联系了部分 HIBP 的订阅者,让他们协助验证。验证结果显示,部分用户确认了泄露的密码,其中一个用户使用了两个感叹号来修改密码,说明了密码重用的普遍现象。 另有用户确认使用过该密码,并已通知公司 IT 部门进行调查。

Pwned Passwords 的作用及安全措施

Have I Been Pwned 网站使用 Pwned Passwords 服务来存储密码,且不关联电子邮件地址,以降低数据泄露的风险。用户可以通过多种方式查询 Pwned Passwords,包括网页搜索、API 调用和 1Password Watchtower。

重要澄清:并非 Gmail 泄露

Troy Hunt 强调,这次泄露并非 Gmail 平台本身的漏洞,而是由于感染恶意软件的用户的凭据被泄露。尽管 Gmail 是最大的电子邮件服务提供商,但此次泄露的数据中只有 20% 与 Gmail 相关,其余 80% 与其他邮件服务提供商有关。

技术挑战

处理如此大规模的数据给 Have I Been Pwned 带来了巨大的技术挑战。 为了高效地处理数据,他们使用了 Azure SQL Hyperscale,并对索引、数据插入和查询进行了优化。同时,为了避免被邮件服务提供商限制,他们采用了逐步递增的邮件发送策略,每天增加 45% 的发送量。

结论与建议

Have I Been Pwned 已经将此次泄露的数据添加到 Synthient Credential Stuffing Threat Data 中,用户可以搜索自己的数据。 Troy Hunt 呼吁用户积极采取安全措施,例如使用密码管理器、创建强密码并启用多因素身份验证。

总而言之,此次泄露事件突显了密码安全的重要性,以及持续关注数据泄露风险并采取预防措施的必要性。

You should write an agent

LLM代理:简单易上手,潜力无限 (LLM Agents: Surprisingly Easy, Immense Potential)

作者: Thomas Ptacek (@tqbf)

这篇文章探讨了LLM代理 (LLM agents) 的概念,强调其简单易上手以及由此带来的巨大潜力,并鼓励读者亲自实践。作者认为,虽然人们对LLM和代理持有各种观点,但理解和掌握它们至关重要。

核心观点:

  • LLM代理如同“烧水”: 类似于理解烧水原理,LLM代理的构建也相对简单,不需要过多的理论基础,动手实践才能真正理解。
  • 惊人的易用性: 代理的构建比想象中简单,只需几行代码即可实现基本功能。
  • 核心在于上下文管理: LLM本身是无状态的,代理的实现主要依赖于维护和传递上下文信息,模拟对话过程。
  • 工具集成轻松: 集成工具(例如 ping 命令)非常简单,只需定义工具接口,并将其传递给LLM即可。LLM本身可以自动决定何时以及如何使用这些工具。
  • 上下文工程是关键: “提示工程”不再是重点,而是“上下文工程”,即合理分配token,优化上下文结构,例如利用子代理等方法,以提升代理的性能和解决问题的能力。
  • 未来充满可能: LLM代理在漏洞扫描等领域展现出巨大的潜力,个人开发者也能参与其中。 这也意味着,在LLM代理设计中存在许多尚未解决的开源工程问题,例如如何平衡不可预测性与结构化编程,如何连接代理并确保其获取真实信息等。

代码示例:

文章提供了Python代码示例,展示了如何构建一个简单的LLM代理:

  • 基本框架: 使用 OpenAI Responses API 实现,包含 call (调用LLM) 和 process (处理用户输入并更新上下文) 两个核心函数。
  • 上下文管理: 上下文被表示为一个字符串列表,包含用户和助手之间的对话历史。
  • 多重人格: 通过维护多个上下文列表,可以模拟代理的多重人格,例如让代理同时扮演说真话和说假话的角色。
  • 工具集成: 定义工具(例如 ping 命令)的接口,并将其传递给LLM,LLM可以根据需要调用这些工具。

总结:

作者鼓励读者积极尝试构建LLM代理,认为这是一种令人惊喜的编程体验,能够加深对LLM技术的理解。即使对LLM持怀疑态度,亲自实践也能帮助更好地评估其价值。LLM代理的未来充满可能,而现在正是参与其中的最佳时机。

I Love OCaml

OCaml 的魅力:一个程序员的思考 (OCaml's Charm: A Programmer's Thoughts)

这篇文章表达了作者对 OCaml 语言的喜爱,并探讨了其与其他编程语言(Haskell, Go)的对比,总结了作者认为优秀的编程语言应该具备的特性。

作者的编程背景与偏好:

作者的编程之旅始于函数式编程 (Haskell),并受益于其解决复杂问题、降低思考负担的能力。然而,Haskell 的复杂性和编译速度成为了瓶颈。随后,作者尝试了 Go,欣赏其简洁、快速的编译和良好的文档,但对 Go 的保守设计、冗余错误处理和缺乏函数式编程特性感到失望。

优秀的编程语言的特性:

通过对 Haskell 和 Go 的体验,作者总结出了一套“优秀编程语言”的标准:

  • 快速编译时间
  • 较少的抽象,易于理解的运行时
  • 强大的静态保证
  • 函数式编程特性,尤其是模式匹配和代数数据类型(sum types)
  • 良好的性能
  • 良好的文档

OCaml 的优势:

作者认为 OCaml 完美地满足了这些标准:

  • 强大的静态保证: 具有代数数据类型、多态变体和模式匹配等特性。
  • 简单的运行时: 尽管是垃圾回收语言,但其运行时语义相对简单,经验丰富的 OCaml 程序员可以推断出编译后的汇编代码。
  • 快速编译时间: 借助 Dune 工具,OCaml 的编译速度非常快,甚至可能比 Go 更快。
  • 易于部署: 可以编译成单个静态二进制文件。
  • 优秀的文档和工具: 拥有 odig (离线文档浏览), utop (REPL) 以及接口/实现文件分离等工具,让代码浏览和探索更加便捷。
  • 自动类型推断: 作者认为,当对语言更加熟悉后,自动类型推断可以提高开发效率。

总结:

作者总结认为 OCaml 具有“简单与表达之间的恰当平衡”,并且拥有良好的文档和工具支持,因此是一门非常优秀的语言。尽管 OCaml 存在一些历史遗留问题(例如 OOP 相关特性)和生态系统中的过度复杂化现象,但总体而言,作者对 OCaml 的设计理念表示赞赏,并对 OCaml 的低普及率感到困惑。


(中文翻译结束)

A Fond Farewell

《农夫文集》宣布停刊:2026年将是最后一期

《农夫文集》(Farmers' Almanac) 宣布,其历史将画上句号,2026年将是该刊物的最后一期。 这项出版物拥有超过200年的历史,以其独特的“天气、机智和智慧”而闻名。

核心要点:

  • 停刊决定: 《农夫文集》将于2026年停止出版,包括纸质版和在线版。
  • 历史与传承: 该刊物拥有超过200年的历史,许多家庭都曾将其作为传统,代代相传。
  • 读者参与: 读者曾利用《农夫文集》中的信息进行种植(例如根据月相种植豌豆)、指导生活(如如厕训练、断奶、钓鱼)等。
  • 感谢与期望: 编辑Sandi Duncan和Peter Geiger对忠实读者、贡献者和合作伙伴表示感谢,并希望读者能够继续传承《农夫文集》的精神,例如分享天气预报、种植技巧等。
  • 购买信息: 2026年《农夫文集》已经售罄,但可能可以在当地商店找到。
  • 网站访问: 用户将失去对网站的访问权限,直到2025年12月1日。 会员请查收邮箱获取更多订阅信息。
  • 联系方式: 如有疑问,请联系 [email protected]

总而言之,《农夫文集》虽然即将停刊,但其精神和知识将继续通过读者传承下去。

OpenMW 0.50.0 Released – open-source Morrowind reimplementation

OpenMW 0.50.0 发布!

OpenMW 团队宣布发布开源引擎的 0.50.0 版本。下载地址:https://openmw.org/downloads/,支持所有操作系统。

主要更新:

  • 游戏手柄体验优化: 大幅改进了游戏手柄支持,引入了新的控制器菜单界面。
  • 战斗系统解耦: 在战斗系统解耦方面取得初步进展。
  • Lua 脚本 API 扩展: 进一步扩展了 Lua 脚本 API。
  • 用户界面改进: 修复了大量用户界面问题,并增加了备受期待的快速物品转移功能(Alt-键)。
  • 波兰语翻译: OpenMW 引擎已翻译成波兰语。

已知问题:

  • macOS: 从 OpenMW-CS 启动 OpenMW 需要 “OpenMW.app” 和 “OpenMW-CS.app” 位于同一个目录下。
  • Windows: 引擎启动时间过长可能导致程序冻结。
  • AMD GPU: RX 6000 和 7000 系列显卡可能出现驱动超时问题,AMD 尚未解决。
  • Intel GPU: 游戏可能在视觉上冻结,但仍能响应输入。建议安装旧版本的驱动。
  • Linux/macOS: OpenMW-CS 运行期间可能随机崩溃,尤其是在全局搜索或保存时。
  • Apple Silicon: 着色渲染出现红色色调,启用逐像素光照可解决。

详细功能更新:

1. AI 和寻路:

  • NPC 将会忽略无法到达的路径点,避免在岩石中迷路。
  • 潜行机制改进:更新 NPC 对玩家的感知时,会缓存骰子结果,降低潜行难度。

2. 配置和 VFS:

  • 设置文件现在在关闭设置窗口时保存,而非仅在退出游戏时保存。
  • 改善了对使用原生编码的非 ASCII 路径的 BSA 支持。
  • 提高了 BSA 档案读取的稳定性。

3. ESM 格式和存档游戏:

  • 存档游戏格式未更改,理论上可以回退到 0.49.0 版本。

4. 游戏玩法:

  • 修复了监狱时间对技能提升的影响,使其能计入等级进度。
  • 修复了 Next/Previous Spell 快捷键在处理堆叠物品时卡住的问题。
  • 调整了盗窃系统,避免重复犯罪指控。
  • 修复了各种小游戏机制不一致的问题。

5. 画面:

  • 改进了对模组资产的兼容性,修复了船帆等模型显示问题。
  • 修正了地形法线贴图的垂直方向错误。
  • 修复了魔力光照影响下视差失效的问题。

6. 脚本 (mwscript):

  • GetSpellEffects 函数现在可以检测附魔。
  • 新增了 FillJournal 调试指令。

7. 脚本 (OpenMW-Lua):

  • 允许脚本拦截攻击命中目标后发生的事件,例如应用护甲和难度,生成血液等。
  • 新增了天气和地形 API。
  • 允许脚本访问玩家的日志并创建自定义 NPC。
  • 暂停帧的处理方式发生变化,需要更新相关脚本。

8. 音效:

  • 启用 3D 音频的 Doppler 效应。

9. 用户界面:

  • 引入了新的控制器菜单界面。
  • 容器菜单支持 Alt-键快速物品转移。
  • 修复了各种用户界面问题。

10. OpenMW-CS, Launcher 和工具:

  • Launcher 和 Wizard 翻译成波兰语。
  • 改进了编辑器中的实例选择标记。

11. Beyond Morrowind (超越 Morrowind):

  • 实现了地形纹理渲染和初始的远距离物体渲染。
  • 加快了 zlib 压缩文件的解压速度。

总而言之,OpenMW 0.50.0 版本带来了大量的改进和修复,为玩家提供了更好的游戏体验,并为 Modder 提供了更强大的工具。

Show HN: What Is Hacker News Working On?

Okay, I'm ready. Please provide the content you want me to summarize. I will do my best to provide a concise and accurate summary in Markdown format and Chinese language, adhering to your specified constraints. I'm awaiting your input!

Analysis indicates that the universe’s expansion is not accelerating

新研究表明宇宙膨胀可能已开始减速,而非加速

一项新的研究表明,宇宙的膨胀可能已经开始减速,而非像之前认为的那样,以越来越快的速度加速。这项研究结果发表在《皇家天文学会月刊》上,对长期存在的“暗能量”理论提出了质疑。暗能量被认为是一种神秘的力量,它驱动着遥远星系以越来越快的速度远离我们。

研究的主要发现:

  • 膨胀减速的迹象: 研究表明,宇宙可能已经进入膨胀减速的阶段,并且暗能量随时间变化的速度比之前认为的更快。
  • 对ΛCDM模型的挑战: 在修正了超新星年龄偏差后,超新星数据不再符合标准的ΛCDM宇宙学模型(即包含宇宙学常数的模型)。相反,它与由音速波动(BAO)和宇宙微波背景辐射(CMB)数据分析得出的、暗能量随时间变化的模式更加吻合。
  • 暗能量的削弱: 修正后的超新星数据,以及仅使用BAO和CMB数据的结果都表明,暗能量正在减弱并随时间发生显著变化。
  • 宇宙不再加速: 最令人惊讶的是,综合分析表明,宇宙今天并非加速膨胀,而是已经过渡到减速膨胀的状态。
  • 年龄偏差修正的重要性: 研究人员发现,由于超新星的祖先恒星年龄的影响,之前的距离测量存在系统性偏差。通过修正这种偏差,研究结果与BAO和CMB数据相符。

研究背景:

  • 过去三十年来,天文学家普遍认为宇宙以越来越快的速度膨胀,这归功于暗能量的作用。
  • 1998年,通过对Ia型超新星的观测,科学家们发现了宇宙加速膨胀的现象,并因此获得了2011年的诺贝尔物理学奖。
  • Ia型超新星长期以来被认为是“宇宙的标准烛光”,但此次研究表明,它们可能受到祖先恒星年龄的影响。

未来展望:

  • 研究团队正在进行“无演化测试”,使用来自年轻、同时代的星系的主体星系中的超新星,以进一步确认他们的研究结果。
  • 随着Vera C. Rubin天文台在未来五年内发现超过2万个新的超新星主星系,精确的年龄测量将允许对超新星宇宙学进行更强大和更确定的测试。
  • 科学家们希望借助这些新的工具,能够更好地了解暗能量的本质以及它对宇宙的影响。

关键工具和项目:

  • Ia型超新星: 用于测量宇宙膨胀速度的“标准烛光”。
  • 音速波动 (BAO): 相当于大爆炸的声音,用于测量宇宙的距离和膨胀速度。
  • 宇宙微波背景辐射 (CMB): 宇宙大爆炸的余辉,提供了关于宇宙早期状态的重要信息。
  • 暗能量光谱学仪器 (DESI): 一种先进的仪器,用于绘制遥远天体的图像,以研究暗能量。
  • Vera C. Rubin天文台: 配备世界上最强大的数字相机的天文台,有望回答关于太阳系和更广阔宇宙的重要问题。

总而言之,这项研究对我们对宇宙膨胀和暗能量的理解提出了挑战,并可能开启宇宙学研究的新篇章。

A Note on Fil-C

Fil-C 项目总结

Fil-C 是 Filip Pizlo 近期发布的一个项目,旨在为 C 语言提供内存安全保障。该项目主要包含以下几个部分:

  • Clang 内存安全仪器化 Pass: Fil-C 针对 Clang 编译器开发了一个 pass,用于进行空间安全检查(防止越界访问)。
  • 运行时支持库: 提供运行时支持,配合仪器化 pass 工作。
  • 并发 GC (Fugc): 用于时间安全检查(防止使用释放后的内存)。

主要特点与优势:

  • 高度兼容现有代码: Fil-C 的设计目标是尽可能兼容现有的 C 代码,通过少量的修改就能构建完整的 Linux 用户空间,这使得其在现有代码库中部署具有吸引力。
  • 性能开销可接受: Dan Bernstein 的测量表明,Fil-C 带来的性能开销大约在 1-4 个周期。尽管作者的初步测试显示范围略宽,但对于 IO 密集型或对性能要求不高的工作负载来说,这种开销通常是可以接受的。
  • 指针操作安全性增强: Fil-C 插入的边界检查甚至可能使得原本不安全的 C 代码中的指针操作更加安全,甚至超越了某些情况下 unsafe Rust 代码的安全性。

局限性与考量:

  • 动态检查: Fil-C 是一种动态检查工具,无法在编译时防止内存错误,程序仍然可能因内存错误而崩溃。
  • 空间开销: GC 需要保留垃圾数据一段时间,直到确定其不可达,这会导致一定的空间开销。初步测量显示空间开销可能在 3-6 倍左右。
  • 无法解决数据竞争和局部正确性问题: Fil-C 仅关注内存安全,不能解决数据竞争或局部正确性问题。
  • 开关控制: 用户可以手动关闭 Fil-C 以提高性能和降低内存占用,这可能受到性能压力的影响。

项目意义:

Fil-C 建立在之前学术界和工业界大量研究的基础上,包括作者本人在 Apple 的多年迭代工作。该项目为那些无法或不愿重写现有 C/C++ 代码库,或者在性能和内存使用方面有严格要求的开发者提供了一种内存安全解决方案。如果未来能够出现基于 Fil-C 构建的易于安装的 Debian 系统,将极大地推动 C 语言的安全性。

总结:

Fil-C 是一个有前景的项目,它在 C 语言中引入了内存安全机制,为那些寻求在现有 C/C++ 代码库中实现安全性的开发者提供了一种可行的选择。虽然存在一些局限性,但其高度兼容性和可接受的性能开销使其具有吸引力。作者认为,允许程序在内存错误中更安全地失败,对人类文明来说是一件好事。

A file format uncracked for 20 years

好的,以下是对您提供的 Splinter Cell (2002) 内容的总结,中文呈现,并控制在 800 字以内:

Splinter Cell (2002) 数据挖掘与文件格式研究

本文记录了作者对 Xbox 游戏《潜行者》(Splinter Cell)的数据挖掘和文件格式研究过程。作者最初对游戏感兴趣,并希望找到被剪切的内容,例如关卡、武器概念等。

研究背景

  • 游戏引擎: 《潜行者》使用 Unreal Engine 2,该引擎由 Epic Games 开发并授权。
  • 现有信息: 尽管游戏已发布多年,但关于其剪切内容的挖掘信息相对匮乏,仅有早期 Xbox 预览版包含两关被删除的记录。
  • 研究目标: 深入分析游戏数据,寻找剪切内容,并最终实现游戏的完整体验。

文件格式分析

作者通过备份游戏光盘,对游戏文件进行研究,重点关注 .lin 文件。该文件格式将地图划分为多个部分,每个部分由 .lin 文件表示。

  • .lin 结构:
    • 包含文件表,记录了每个文件的名称、偏移量和长度。
    • 包含一个名为 common.lin 的文件,其中包含所有地图共享的数据,以减少文件大小。
    • 后续的文件都是 Unreal Engine Package 文件 (Linker 文件),以 0x9E2A83C1 为魔术值。
  • 关键发现:
    • 文件表中的偏移量和文件数量存在不一致,表明文件表的描述不完全准确。
    • 文件读取必须按顺序进行,不支持寻址,因为游戏引擎内部存在一种绕过寻址的机制。
    • 游戏引擎采用延迟加载机制,导出对象按需加载,导致文件格式的复杂性。
  • 文件格式结构: 作者总结出.lin文件包含标准数据(如魔术值、文件名、导出/导入计数等)和Linker文件序列。

技术挑战与解决方案

  • 文件读取顺序: 由于无法寻址,作者需要确定正确的加载顺序才能正确读取文件。
  • 导出数据: 导出数据可能相互依赖,需要按正确的顺序加载和解析。
  • 工具开发: 作者编写工具来解压缩存档,并分析文件结构。
  • 调试技术: 使用 Xbox 模拟器 xemu,作者通过设置断点和分析内存读写,追踪文件加载过程。
  • 静态编译与动态加载: 作者尝试静态编译文件,但由于文件依赖关系和动态加载机制,最终选择动态加载,通过修改游戏二进制文件,在游戏运行时将文件内容导出到硬盘。

研究成果与未来展望

  • 成功导出文件: 作者通过修改游戏二进制文件,成功将游戏文件导出到硬盘。
  • 初步移植: 在UE Explorer中成功加载导出文件,并在PC上运行了游戏的第一关。
  • 未来方向:
    • 继续完善数据挖掘工具,实现更全面的文件导出。
    • 探索静态编译的可能性,方便后续分析和移植。
    • 与社区合作,将研究成果贡献给 Unreal Engine Library 项目,促进对该文件格式的理解。

总结

作者通过深入的数据挖掘和逆向工程,对《潜行者》的文件格式进行了详细分析,并成功实现了部分文件的导出。研究结果为游戏内容挖掘和移植提供了宝贵的经验,也为游戏引擎的研究提供了新的视角。

When did people favor composition over inheritance?

软件设计原则:关于“优先组合于继承”的反思

本文探讨了软件设计中广为流传的原则“优先组合于继承”,并对其起源、意义以及局限性进行了深入分析。

起源与背景:

该原则源自“Gang of Four”(Gamma、Helm、Johnson、Vlissides)的《设计模式》一书,出现在讨论继承(“白盒”复用,子类可访问父类的实现细节)和组合(“黑盒”复用,仅通过接口交互)的章节中。

继承与组合的对比:

  • 继承: 在编译时静态定义,语言提供支持,使用方便,但难以更改。依赖于继承树,而非运行时对象间的关系。
  • 组合: 程序员手动安排对象间的关系,通过赋值和方法调用实现。更灵活,可在运行时更改行为,但实现工作量更大。

Liskov的贡献:

在“优先组合于继承”原则提出前一年,Barbara Liskov 和 Jeanette Wing 提出了关于子类型关系的定义:子类型对象应该像超类型对象一样表现,任何使用超类型对象的程序都无法区分它们。 Liskov 强调,如果类型关系在设计初期就明确,则采用继承是合适的;反之,采用“分组方法”(允许模块使用任何提供所需操作的类型,无需建立类型关系)或将过程作为参数传递可能更合适。

“优先组合于继承”的局限性:

文章指出,“优先组合于继承” 过于简单化。如果语言支持将过程作为一等公民(例如 Smalltalk 中的 block 或许多语言中的 lambda),那么优先选择过程或组合或继承可能更为合适。

总结:

“优先组合于继承”原则并非绝对真理,需要结合具体的设计场景和语言特性进行考量。在设计时,应该避免盲目遵循该原则,并考虑其他可行的方案,例如使用过程或分组方法。 继承在关系在设计初期明确时仍然是一种有效的方法。

Swift on FreeBSD Preview

Swift on FreeBSD Preview 总结

本文宣布了 Swift 工具链在 FreeBSD 平台上的初步可用性。

核心要点:

总结: Swift 团队正在积极努力将 Swift 工具链移植到 FreeBSD 平台,并发布了第一个预览版本供用户试用和测试。

Unix v4 Tape Found

摘要:发现罕见的 UNIX v4 磁带

Rob Ricci (@ricci@discuss.systems) 在社交媒体上分享了一条消息,内容是其团队在清理储藏室时,发现了一盘来自贝尔实验室(Bell Labs)的 UNIX v4 磁带,年代约为 1973 年。

关键信息:

  • 发现内容: 一盘 UNIX v4 的磁带。
  • 来源: 贝尔实验室 (Bell Labs),约 1973 年。
  • 稀有性: 据称目前没有其他已知的完整副本。 详情请参考:https://gunkies.org/wiki/UNIX_Fourth_Edition
  • 后续处理: 已安排将该磁带交付给计算机历史博物馆 (Computer History Museum)。
  • 标签: #UNIX 和 #retrocomputing。
  • 磁带描述: 磁带上贴有标签,上面写着 Jay Lepreau 的笔迹,表明它是“贝尔实验室的 UNIX 原版 v4 (有关 fmt,请参阅手册)”。

摘要:发现罕见的 UNIX v4 磁带 (中文)

Rob Ricci (@ricci@discuss.systems) 在社交媒体上分享了一条消息,内容是其团队在清理储藏室时,意外发现了一盘来自贝尔实验室(Bell Labs)的 UNIX v4 磁带,时间可以追溯到 1973 年。

主要内容:

  • 发现的物品: 一盘保存着 UNIX v4 系统的磁带。
  • 制造者和年代: 由贝尔实验室制造,大约是 1973 年。
  • 重要性: 据信这是目前已知的唯一一份完整的 UNIX v4 磁带副本。 更多信息请查阅:https://gunkies.org/wiki/UNIX_Fourth_Edition
  • 下一步行动: 已经安排将这盘磁带送至计算机历史博物馆进行保存和研究。
  • 相关标签: #UNIX 和 #复古计算 (retrocomputing)。
  • 磁带信息: 磁带上贴有标签,手写字迹为 Jay Lepreau,标注为“贝尔实验室的 UNIX 原版 v4 (有关 fmt,请参阅手册)”。
The R47: A new physical RPN calculator

R47:一款强大的 RPN 科学计算器总结

R47 是一款功能强大的 RPN (Reverse Polish Notation) 科学计算器,由社区开发并由 SwissMicros 制造。其设计理念源于一个由工程师和数学家组成的团队的“梦想计算器”愿景,经过多年精炼,软件功能与 C47 保持一致,后者可以通过专用按键覆盖将 DM42n 转换成功能丰富的 RPN 计算器。R47 的固件起源于 WP43 项目(本身基于 WP34S),并采用了 Mike Cowlishaw 的 decNumber 库,该库也用于 GCC 中的精确十进制算术。R47 的设计灵感来自于 HP‑41C 和 HP‑42S,并采用了重新设计的按键布局,保留了熟悉的手感。

主要特点:

  • 高级数学功能: 能够求解方程和方程组、进行定积分和不定积分、执行矩阵和向量运算、处理复数、支持 n 进制算术。具有 34 位精度,指数范围为 ±6144,支持高达 1000 个命名的变量。 包含三角函数、双曲函数、对数和反对数等科学计算器函数,以及 2 变量统计功能,包括最佳拟合建模和基本绘图。
  • 编程与编辑: 支持多行编辑器进行程序创建,并提供按键可编程、测试、标志、循环和分支等功能。
  • 工程与实用工具: 包含金融和基于日期的计算功能,如时间价值金计算;内置单位转换和常量库;支持日期和时间数学运算以及内置时钟;提供方程编辑器,可用于求解、数值积分、求导和基本绘图。
  • 显示与用户界面: 配备高分辨率显示屏,显示 4 个堆栈级别、3 行菜单和始终可见的状态栏。 用户可以自定义键盘和基于软键的菜单。
  • 数据管理: 支持通过内置闪存或 USB 进行 I/O,用于备份和恢复状态、程序和配置。

硬件规格:

  • 外壳: 不锈钢,黑色 PVD 涂层,激光雕刻。
  • 操作系统: SwissMicros DMCP 操作系统 (非模拟)。
  • 处理器: ultra-low-power ARM® Cortex-M33®, 最高 160 MHz。
  • 闪存: 64 MBit。
  • 浮点标准: IEEE 754-2008 128 位 BCD 浮点格式的数学库。
  • 显示屏: 单色高对比度 (14:1) 透射式内存 LCD 显示屏,分辨率为 400 × 240 像素,有效显示区域为 58.8 mm × 35.28 mm,点距为 147 µm × 147 µm。
  • 连接性: USB-C,作为 USB 大容量存储设备连接。
  • 电池: 1 × CR2032 3V 锂纽扣电池。
  • 尺寸: 77 mm × 144 mm × 12 mm。
  • 重量: 180 g。
  • 保修: 5 年。
  • 文档: R47 文档

重要说明:

  • R47 的硬件由 SwissMicros 提供,软件由 C47/R47 团队提供。
  • 软件更新和文档请联系 C47/R47 团队:https://47calc.com/
  • 固件目前处于测试版阶段。
  • SwissMicros 不编写、分发或维护 R47 固件,任何固件支持问题应通过电子邮件 [[email protected]](/cdn-cgi/l/email-protection#780b0d0808170a0c384c4f1b19141b561b1715) 联系 R47 团队。
Lessons from Growing a Piracy Streaming Site

HeheStreams 项目运营经验总结:以非法流媒体为鉴,洞察 B2C 增长之道

本文讲述了作者运营非法流媒体服务 HeheStreams 的经历,并从中总结出了一系列宝贵的 B2C 增长和运营经验,这些经验后来也被成功应用于墨西哥生态旅游业务。作者避开了广告营销,而是专注于口碑传播,并凭借一个巧妙的增长黑客策略实现了用户增长。最终,该项目被电影协会收购。

核心内容概要:

  • 营销策略: 作者选择避免广告投放,而是依赖口碑营销。其原因在于对广告营销效果的担忧以及希望吸引高质量用户的需求。
  • 用户体验至上: 作者强调建立与用户的信任关系是关键,并通过以下方式实现:
    • 积极沟通: 鼓励用户直接回复邮件,避免使用 noreply@ 邮箱。
    • 周到入职引导: 通过一系列邮件引导新用户使用,并根据使用情况提供帮助或退款。
    • 幽默风趣的文案: 邮件内容充满个性,避免虚伪,将每次邮件都视为建立信任的机会。
    • 坦诚面对问题: 诚实地告知服务中断情况,避免使用模糊的“维护窗口”说法。
    • 无条件退款: 即使用户用完订阅时间后仍申请退款,也给予支持,体现诚意。
    • 直面流失: 主动联系未续订的用户,询问原因并寻求改进。
    • 推荐竞争对手: 若用户不适合 HeheStreams,主动推荐其他选择,建立信任。
  • 产品定位: 作者选择较高定价,过滤掉对价格敏感的用户,吸引更注重体验和技术的用户。专注于体育内容,保证服务质量。
  • 用户管理: 坚决说“不”,对于不合理的客户要求保持原则性。
  • 增长黑客: 利用 Reddit API 抓取提及“NBA League Pass”等关键词的帖子,鼓励用户在相关帖子中分享 HeheStreams 的体验,并提供推荐链接。推荐人获得 $10 奖励,新用户享受 $10 折扣。
  • 通用性原则: 这些经验适用于小型、诚实的团队,即使不能大规模应用,也能带来积极效果。
  • 信任的重要性: 强调信任机制应真实可信,否则用户会识破。

总结:

HeheStreams 项目的成功并非偶然,而是建立在对用户体验的极致追求和对口碑营销的重视之上。作者的经验表明,即使在非法的商业环境中,真诚、坦率和以用户为中心的服务理念同样适用。这些经验对于任何希望建立可持续增长的 B2C 业务都具有借鉴意义。

Scientists find ways to boost memory in aging brains

记忆衰退与分子机制:弗吉尼亚理工大学研究新发现 (Memory Decline and Molecular Mechanisms: New Findings from Virginia Tech)

弗吉尼亚理工大学的研究表明,记忆衰退并非单纯的衰老症状,而是与大脑中特定的分子变化有关,并且可以通过调整这些过程来改善记忆。两项互补研究由动物科学学院的 Timothy Jarome 副教授及其研究生使用基因编辑工具,针对与年龄相关的变化,从而改善老年鼠的记忆性能。该研究基于大鼠模型,这是一种研究记忆随年龄变化的标准方法。

研究背景与意义:

研究指出,超过70%的人群会面临记忆力下降的问题,这与阿尔茨海默病等疾病的风险密切相关。这些研究旨在揭示导致记忆衰退的分子机制,为理解痴呆症并开发新的治疗方法提供基础。

主要发现:

研究主要集中在两个关键的脑区:海马体和杏仁核。

  • K63 聚合泛素化 (K63 Polyubiquitination):

    • 第一项研究发表在《神经科学》杂志上,表明K63聚合泛素化是一种分子“标签”系统,影响蛋白质的行为,并对大脑细胞的通讯和记忆形成至关重要。
    • 研究发现,随着年龄增长,海马体的K63聚合泛素化水平升高,而杏仁核的水平降低。
    • 通过使用CRISPR-dCas13 RNA编辑系统降低海马体中的K63聚合泛素化水平,研究人员成功改善了老年鼠的记忆力。同时,进一步降低杏仁核中的水平也提升了记忆。
  • IGF2 基因的再激活 (Reactivation of IGF2 Gene):

    • 第二项研究发表在《脑研究公告》杂志上,关注 IGF2 基因,该基因是一种支持记忆形成的生长因子。
    • 研究发现,随着大脑衰老,IGF2基因活性下降,因为该基因被化学沉默。
    • 研究人员使用CRISPR-dCas9基因编辑工具,移除了基因上的化学标记,从而重新激活了该基因。结果表明,这提高了老年鼠的记忆力。值得注意的是,这种干预只对已经出现记忆问题的年老鼠有效,对没有记忆问题的中年鼠没有影响,说明时机非常重要。

研究结论与展望:

  • 两项研究表明,记忆衰退并非单一分子或通路造成的,而是多种分子系统共同作用的结果。
  • 研究强调了在研究大脑衰老和阿尔茨海默病时,需要关注更广泛的分子图景,而不仅仅是单个分子。
  • 研究人员表示,这些发现表明大脑中的某些分子变化是可以纠正的,为潜在的治疗方法提供了希望。

研究团队与资助:

  • 研究由 Timothy Jarome 教授的实验室研究生主导,并得到了罗莎琳·富兰克林大学、印第安纳大学和宾夕法尼亚州立大学科学家的合作支持。
  • Yeeun Bae 博士生主导了关于 K63 聚合泛素化的研究,Shannon Kincaid 博士生主导了关于 IGF2 基因的研究。
  • 该研究获得了美国国家卫生研究院和美国衰老研究基金会的资助。

参考文献:

We chose OCaml to write Stategraph

OCaml 选择原因:基础设施的类型安全与可靠性 (Why We Chose OCaml: Type Safety and Reliability for Infrastructure)

本文介绍了 Terrateam 如何选择 OCaml 来构建 Stategraph,一个用于管理 Terraform 状态的系统。Stategraph 存储 Terraform 状态为 PostgreSQL 中的依赖图,并需要保证并发操作不会导致状态损坏,数据库模式变更不会影响生产环境,并且 JSON 转换正确。

核心观点:

  • 状态管理的关键: Terraform 状态的正确性至关重要,任何状态损坏都可能造成严重问题。
  • OCaml 的优势: OCaml 的类型系统能够在编译时捕获其他语言中需要大量测试才能发现的错误,从而提高系统的可靠性。

关键特性与优势:

  • 类型安全的数据结构: 使用强类型记录定义资源、输出和实例,编译器可以在编译时检测到字段访问错误、类型错误和缺少空值检查等问题。
  • 类型安全 SQL 查询: 强制使用类型化的 SQL 查询,当查询类型签名发生变化时,所有调用该查询的地方都需要更新,编译器会强制执行。
  • 自动 JSON 序列化: 通过 PPX (预处理器扩展) 自动生成 JSON 序列化代码,并利用 exhaustiveness checking 确保序列化正确性。
  • 默认的不可变性: OCaml 默认提供不可变性,有效避免了并发操作中的数据竞争问题。
  • 严格的错误处理: 将错误编码为 variants,并强制对所有错误情况进行匹配,确保在添加新的错误时编译器能够提示未处理的情况。

Stategraph 的具体实现:

  • 数据存储: 使用 PostgreSQL 存储 Terraform 状态,并使用资源级别的锁进行并发控制。
  • 状态转换: 通过强类型定义所有 Terraform 资源类型、状态转换和数据库记录,从而在编译时捕获错误。
  • JSON 转换: 利用 PPX 自动生成 JSON 序列化代码,并使用类型系统保证序列化正确性。

与其他语言的对比:

  • 许多系统使用运行时验证和锁来处理并发问题,但这些难以测试,并且错误通常在生产环境出现。
  • OCaml 通过编译时类型检查和默认不可变性来避免这些问题。

总结:

Stategraph 选择 OCaml 是因为其类型系统能够有效防止各种错误,并提供可靠的并发处理能力。虽然 OCaml 开发者相对较少,但其代码库的稳定性以及减少调试和测试工作量等优势,使其成为构建关键基础设施的理想选择。 最终,OCaml 将正确性作为一种特性,保证了 Stategraph 系统的可靠性。

OpenAI probably can't make ends meet. That's where you come in

OpenAI 寻求美国政府财政支持的总结

以下是对原文内容的总结:

OpenAI 的财务压力与 Altman 的回应

OpenAI 首席执行官 Sam Altman 最近对投资者 Brad Gerstner 质疑 OpenAI 如何承担 1.4 万亿美元的义务,同时仅有 130 亿美元的收入表示不满。 Altman 在回应中,引用了尚未公布的收入数据,并暗示未来收入将大幅增长,包括 ChatGPT 的持续增长、AI 云服务发展以及自动化科学的潜在价值。他还表示,OpenAI 正在承担风险,如果无法获得足够的计算资源,将无法生成模型。

CFO 透露寻求政府支持的计划

OpenAI 的首席财务官在华尔街日报的一次会议上,公开暗示 OpenAI 计划寻求美国政府的财政支持。 CFO 认为人工智能几乎是一种国家战略资产,并将其与中国竞争联系起来,以此来为可能的政府补贴进行辩护。

与 Nvidia 的类似策略

OpenAI 的这一举动与 Nvidia 采取的策略类似,Nvidia 也似乎正在寻求政府支持,以在人工智能领域保持竞争力。

潜在的税务负担

原文指出,OpenAI 寻求政府支持的计划,实质上意味着美国纳税人将间接承担 OpenAI 的财务负担。作者呼吁公众联系国会议员,反对将税款用于救助被过度炒作且经济不稳定的 AI 公司,并强调这会对已经受到裁员影响的工人造成负担。

总结

OpenAI 正在寻求美国政府的财政支持,以应对其高昂的运营成本和投资需求。这引发了关于政府补贴、竞争以及纳税人负担的担忧。 Nvidia 也在采取类似的策略,进一步加剧了这一问题。

Man who threw sandwich at US border agent not guilty of assault

华盛顿抗议者投掷三明治案宣判无罪:总结

以下是对华盛顿抗议者投掷三明治案的总结:

事件经过:

  • 2023年8月10日,名叫Sean Dunn(37岁)的华盛顿特区抗议者被指控向美国边境巡逻警官Gregory Lairmore投掷了三明治。
  • 该事件的视频在网上迅速传播,Sean Dunn因反对唐纳德·特朗普总统将联邦特工和国民警卫队部署到华盛顿特区而成为象征。

审判结果:

  • Sean Dunn被指控犯有轻罪袭击罪。
  • 经过为期两天的审判,陪审团最终裁定Sean Dunn无罪。
  • 他的律师Julia Gatto辩称,投掷三明治的行为并非犯罪行为,并指出Lairmore警官的同事们都认为这件事情很有趣。

证人证词:

  • 边境巡逻警官Gregory Lairmore作证称,三明治“爆炸性地溅到他身上”,并留下了洋葱和芥末的味道。他还在法庭上重现了该事件,并表示即使穿了防弹背心也能感受到冲击。
  • Lairmore警官还表示,同事们经常拿他开玩笑,甚至送给他一个玩具三明治,上面贴着“重罪巨无霸”的标签。

背景信息:

  • 唐纳德·特朗普总统将国民警卫队部署到华盛顿特区的行为引发了一些居民的强烈抗议,他们认为这是一种军事政治化。白宫则辩称,这些力量是必要的,以打击犯罪。
  • 据称,Sean Dunn在投掷三明治前,接近一群警官,称他们为“法西斯”,并高喊:“你们为什么在这里?我不想你们在我所在的城市!”
  • Sean Dunn在事件发生后,被他在司法部担任的律师助理工作解雇。

Sean Dunn的反应:

  • 在被判无罪后,Sean Dunn表示“如释重负,并期待着继续生活”。

检察方的尝试:

  • 政府检察官最初试图对Sean Dunn提出重罪指控,但大陪审团拒绝起诉。最终,检察官将他指控为轻罪袭击罪。
The Learning Loop and LLMs

软件开发与 LLM:学习循环的重要性 (软件开发与大型语言模型:学习循环的重要性)

本文探讨了软件开发中学习的重要性,以及大型语言模型 (LLM) 如何影响这一过程。文章指出,将软件开发视为流水线式的生产模式是错误的,因为软件开发本质上是一个学习的过程,需要持续的迭代、反馈和互动。

核心观点:

  • 软件开发并非流水线: 传统的工程领域依赖于设计和执行的分工,但在软件开发中,设计往往随着代码的实现而逐渐形成。代码是反馈的重要来源,开发者需要不断学习和调整。
  • LLM 重新引发了流水线谬误: 虽然 LLM 能够生成代码,但它们并不能取代开发者学习和理解的过程。将 LLM 视为独立的构建者,而忽略了软件开发的本质,可能会导致问题。
  • LLM 作为辅助工具: 作者的经验表明,LLM 擅长头脑风暴、命名和生成样板代码,但生成的代码可能存在细微错误。因此,LLM 应该被视为开发者的合作伙伴,而不是自动化的构建者。
  • 学习循环是关键: 软件开发的成功依赖于一个持续的学习循环,包括:
    • 观察与理解 (Observe and Understand): 学习新的信息和概念。
    • 实验与尝试 (Experiment and Try): 通过编写代码进行实践,并尝试打破和改进代码。
    • 回忆与应用 (Recall and Apply): 在新的挑战中应用所学知识,并进行调整。
  • AI 无法取代学习: AI 可以生成解决方案,但无法提供开发者在解决问题过程中获得的经验和洞察力。
  • 高层代码复用面临挑战: 由于软件挑战通常与具体的业务环境紧密相关,高层代码复用一直难以实现。
  • 低代码平台的局限性: 低代码平台虽然能提供快速的开发速度,但缺乏对底层原理的学习,可能导致维护成本增加和生产力下降。
  • LLM 带来的潜在风险: LLM 可能会夸大这种快速开发的错觉,并削弱开发者建立专业知识的能力。它们提供看似完美的解决方案,却绕过了必要的学习过程,最终可能导致“维护悬崖”的困境。
  • LLM 的优势: LLM 能够充当各种软件工具和语言之间的翻译器,降低了入门门槛,提高了效率。 然而,这种翻译能力不能取代对每个语言和工具的深入理解。

总结:

文章强调了软件开发中持续学习的重要性,并指出 LLM 应该被视为辅助工具,而不是取代开发者学习和理解的替代品。 真正的专业知识来自于对系统的深入理解,而不是仅仅依靠快速生成代码的能力。 开发者需要关注学习循环,才能构建出稳定、可维护的软件系统。

The secret campaign to silence critics of a hospital real estate empire

医疗房产信托(MPT)的危机公关与质疑:一份调查报告

本文主要讲述了美国房地产公司医疗房产信托(Medical Properties Trust,简称MPT)因其独特的商业模式和与最大租户 Steward Health Care 的财务关系而面临的危机,以及该公司如何应对由此引发的公众质疑和股价下跌。

公司背景与商业模式:

MPT 是一家大型房地产公司,通过购买医院和其他医疗设施并将其出租给运营者(如 Steward Health Care)来获取利润。

质疑与危机:

  • 《华尔街日报》的报道: 2022 年春季,MPT 面临来自《华尔街日报》一系列报道的压力,这些报道揭露了该公司财务状况以及与 Steward Health Care 之间密切的财务关系,引发了对 Steward 是否面临财务困境的担忧。
  • Steward Health Care 的问题: 调查显示,Steward Health Care 的财务管理不善导致患者死亡、医疗事故诉讼以及联邦医院检查中发现的患者护理问题。
  • 股价下跌: 媒体报道和投资者担忧导致 MPT 股价下跌。

MPT 的危机公关应对:

面对质疑,MPT 采取了一系列积极的危机公关措施:

  • 聘请危机公关团队: MPT 聘请了多家公关公司(Joele Frank)、律师事务所(Clare Locke)和情报公司,组建了一个“危机应对团队”,旨在控制舆论。
  • 攻击批评者: 通过匿名社交媒体账号攻击记者、投资分析师和做空者,试图抹黑其声誉。
  • 监控批评者: 聘请英国情报公司 Audere International 监控批评者,包括记者和投资分析师,甚至跟踪并录像其日常生活。
  • 威胁诉讼: 律师事务所 Clare Locke 向《华尔街日报》发出威胁诉讼信函,要求其透露记者消息来源。
  • 试图控制叙事: 试图通过积极的公关活动塑造公司形象,并掩盖 Steward Health Care 的财务问题。
  • 寻求政治支持: 聘请前消费者金融保护局局长 Mick Mulvaney 及其公司 Actum,以影响监管机构。

关键人物与事件:

  • Ed Aldag: MPT 首席执行官,积极参与危机公关活动,并表达了对批评者的强烈不满。
  • Brian Spegele: 《华尔街日报》记者,其报道引发了对 MPT 的广泛关注。
  • Rob Simone: Hedgeye 投资分析师,通过研究揭露了 MPT 的问题,并建议投资者做空该公司股票。
  • Fraser Perring: Viceroy Research 投资人,发布的报告指控 MPT 存在“圆融交易”等财务违规行为。
  • Sungida Rashid: 在 Steward 医院去世的母亲,她的悲剧突显了 Steward 医院的医疗问题。

现状与未来:

  • 立法行动: 美国民主党参议员提议通过“停止医疗盈利和盗窃(MPT)法案”,以限制 MPT 的业务。
  • 诉讼与和解: MPT 与 Viceroy Research 之间的诽谤诉讼已达成和解。
  • 持续的质疑: 尽管 MPT 采取了各种措施,但其商业模式和财务关系仍面临持续的质疑。

总结:

本文揭示了 MPT 如何应对对其商业模式和财务关系的质疑,以及该公司采取的积极公关措施。然而,这些措施未能完全消除公众的担忧,反而引发了对公司透明度和道德责任的进一步质疑。

Transpiler, a Meaningless Word (2023)

总结:关于“转译器”的六个误解

本文探讨了关于“转译器”(transpiler)的常见误解,并指出其与编译器之间的界限模糊。作者认为,对语言的理解应该侧重于语义而非仅仅关注语法。

以下是文章中提出的六个误解:

  1. 转译器没有前端: 即使是简单的 Python 到 C 的转译器(例如 Nuitka 和 Mojo)也需要前端处理 Python 代码。处理更复杂的语法结构和语义,例如 range 函数的生成器特性,需要更复杂的逻辑。
  2. 转译器很简单: BabelJS,一个用于将现代 JavaScript 特性转换为旧版本 JavaScript 的转译器,实际上是一个非常复杂的工具。例如,它将 JavaScript 生成器转换为等效的 JavaScript 代码,这需要进行整个程序的转换,并涉及复杂的优化技术。
  3. 转译器目标抽象级别相同: 即使输入和输出语言都使用 JavaScript 语法,但如果编译单个特性需要进行整个程序的转换,这表明它们实际上不是同一语言。
  4. 转译器没有后端: BabelJS 拥有不同的 “presets”,可以针对不同的 JavaScript 版本进行编译,这与 LLVM 的多个后端类似。
  5. 编译器只生成机器码: 编译器还可以生成字节码,例如 Java 编译器生成的 JVM 字节码,或者 JavaScript 引擎中的多层编译方案。
  6. 转译器不是编译器: 许多开发者试图避免使用“编译器”一词,认为转译器更简单。然而,作者认为这种想法是错误的,因为构建一个有效的转译器不可避免地会变得复杂,并且可能因为忽视语义而导致工具维护不佳。

核心观点:

作者强调,编程语言不仅仅是语法,还有语义。忽视语义,只关注语法操作,会导致构建出低质量的工具。 编译器和转译器都涉及复杂的语言转换,而编译器通常能够更好地处理语义问题,因为它们建立在对语言语义的理解之上。 简单地将工具贴上“转译器”的标签,并认为它比编译器简单是一种误解。

The Parallel Search API

平行搜索:专为人工智能打造的全新搜索技术

核心要点: 平行搜索 (Parallel Search) 是一种全新的搜索引擎,从底层架构开始设计,专门服务于人工智能 (AI) 代理。它与传统的以人类用户为中心的搜索引擎不同,旨在提供最相关、最节省 token 且成本最低的网络数据,从而提高 AI 代理的准确性、效率和降低成本。

传统搜索与 AI 搜索的区别:

  • 传统搜索: 针对人类用户设计,优化关键词搜索、点击率和页面布局,旨在提供链接让用户浏览。
  • AI 搜索: 目标是为 AI 代理的上下文窗口提供最佳 token,优化上下文和 token 用于模型推理,而非针对人类点击进行排名。

平行搜索的优势:

  • 语义目标: 理解用户意图,超越关键词匹配。
  • Token 相关性排名: 优先考虑与目标直接相关的网页,而非针对人类参与度指标优化的页面。
  • 信息密集的摘录: 压缩和优先考虑高质量的推理内容,确保 LLM 上下文窗口包含最有效的 token。
  • 单次调用解析: 能够处理通常需要多次搜索才能解决的复杂查询。

性能表现:

  • 复杂搜索: 在处理多主题、需要深入理解难以抓取的网页内容或需要跨多个来源进行综合分析的复杂查询时,平行搜索的准确率更高,成本更低,通常能以传统搜索 API 的 50% 成本实现同等或更高的准确度。
  • 简单搜索: 在处理简单事实性查询时,平行搜索的准确率与领先替代方案相当,但成本更低。

技术架构:

平行搜索的卓越性能得益于其垂直整合的搜索堆栈和专有网络索引:

  • 抓取 (Crawl): 优先抓取难以抓取的网络内容,例如多模态、长篇 PDF 和 JavaScript 密集型网站,并优化重新抓取以保持快速变化数据的最新状态。
  • 索引 (Index): 拥有一个快速增长、更新鲜、更深入且最大的网络索引,每天添加或刷新 10 亿多页面。
  • 排名 (Ranking): 采用不同的优化目标进行检索和排名,而非针对人类点击进行排名。它识别最相关和权威的 token,用于 LLM 推理,基于 token 相关性、页面和域名权威性、上下文窗口效率和跨源验证进行评分。

应用:

平行搜索 API 已被领先的 AI 团队采用,并被 Parallel 公司自身用于驱动 Web 代理,例如 Parallel Task API。

总结:

平行搜索代表了网络搜索技术的一次重大飞跃,为 AI 代理提供了更高效、更准确、更经济的解决方案,从而推动了 AI 应用的进一步发展。

Mark Zuckerberg Had Illegal School at His Palo Alto Compound. Neighbors Revolted

好的,以下是根据您提供的文章内容生成的中文摘要,字数控制在800字以内,不包含个人观点和未提及的信息,并采用Markdown格式:

马克·扎克伯格在帕洛阿尔托的住宅争议:非法学校与邻里不满

事件背景:

自2016年起,马克·扎克伯格及其家人不断扩张位于加利福尼亚州帕洛阿尔托市克里森特公园社区的住宅。如今,该住宅已扩展到11个先前独立的房产,五者相邻。这种扩张引发了邻居们的担忧,最初是市场价格上涨的恐惧,随后是住宅内出现非法学校的争议。

非法学校“Bicken Ben School”:

邻居们于五年前发现扎克伯格住宅内可能存在学校。WIRED通过公开记录请求获得了1665页相关文件,包括311投诉记录、法律文件、建筑计划和电子邮件。文件显示,该学校“Bicken Ben School”(以扎克伯格家宠物鸡命名)可能自2021年起未获得许可运营。学校最早招收9名学生,到2025年已增长到14-30名学生不等。尽管如此,学校在加州教育部门的目录中声称于2022年10月5日开学,且Sara Berge自2022年起担任该学校的“蒙特梭利学园负责人”。

邻居的投诉与城市回应:

邻居们长期以来对扎克伯格住宅的噪音、私人安保人员的存在以及相关人员造成的交通拥堵问题表示不满。他们认为城市对这些问题处理不力,甚至怀疑存在对扎克伯格的特殊优待。邻居们通过邮件向城市规划与发展服务部门表达了不满,质疑城市是否真正重视社区的利益。

帕洛阿尔托市发言人Meghan Horrigan-Taylor否认了邻居的指控,称城市对所有房产都一视同仁地执行法规。她表示,城市与居民进行了沟通,并对建筑项目进行了审批。

城市与扎克伯格的沟通:

2025年3月,城市官员告知与扎克伯格家合作的律师,必须在6月30日前关闭住宅内的学校。然而,学校在加州教育部门的记录显示其运营至8月18日。扎克伯格家发言人Brian Baker表示,学校并未关闭,而是搬迁了,但具体地点和学校名称尚不清楚。

更广泛的问题:

除了学校问题外,邻居们还长期抱怨扎克伯格住宅的建设噪音、安保人员的干扰以及相关人员造成的交通问题。2020年,建筑检查员在试图检查住宅时,被一群SUV内的男子监视,并发生了一场紧张的对话。

邻居提出的要求:

2024年秋季,邻居们达到崩溃边缘。他们向城市提出了14项要求,包括限制安保人员、承包商等人员的停车,提前通知大型施工和聚会,以及停止进一步扩张住宅。

城市的回应与争议:

城市规划部门负责人Jonathan Lait曾提议对扎克伯格家提供“细致入微的解决方案”,但邻居们认为这无法解决问题。最终,城市告知扎克伯格家需要获得“有条件使用许可”才能在住宅区运营学校。

目前状况:

尽管扎克伯格家声称采取措施避免对社区造成干扰,但邻居们仍然对现状表示不满,并质疑城市是否真正维护了社区的利益。目前,Bicken Ben School的具体位置和运营状况不明。扎克伯格家似乎正在寻求在其他地方建立学校,但具体细节尚未公开。

总结:

扎克伯格在帕洛阿尔托住宅的扩张及其住宅内非法运营的学校,引发了邻里之间的长期冲突和对城市管理机制的质疑。该事件凸显了科技巨头与社区之间的复杂关系,以及在追求个人隐私和便利的同时,如何平衡社区利益的重要性。

SanDisk launches dongle-like Extreme Fit USB-C flash drive with up to 1 TB

Sandisk Extreme Fit USB-C 闪存盘介绍

以下是对 Sandisk Extreme Fit USB-C 闪存盘的总结:

产品概述:

Sandisk 推出了 Extreme Fit USB-C 闪存盘,这是一种类似无线鼠标或键盘适配器的紧凑型存储解决方案。 其主要特点是连接到设备后,不会从端口中突出太多。

存储容量和性能:

  • 容量: 最高可达 1TB。
  • 性能: 支持 USB 3.2 Gen 1 速度。
    • 128GB 及以上型号:读取速度最高可达 400MB/s。
    • 64GB 型号:读取速度最高可达 300MB/s。

设计和兼容性:

  • 设计: 采用轻巧设计,重量仅为 3 克。
  • 兼容性: 兼容多种平台,包括 iPadOS。
  • 特点: 被 Sandisk 称为“即插即用”和“即插即留”存储解决方案。

可用选项及价格:

目前有以下型号及价格(均为当前价格,原价在括号内):

  • 64GB:$14.99 (原价 $15.99)
  • 128GB:$19.99 (原价 $21.99)
  • 256GB:$27.99 (原价 $29.99)
  • 512GB:$54.99 (原价 $59.99)
  • 1TB:$109.99 (原价 $117.99)

其他:

Please stop asking me to provide feedback #8036

Claude Code 反馈提示问题总结

问题描述: 用户反馈 Claude Code 会周期性弹出提示,询问当前会话体验如何,用户希望能够禁用此反馈提示。

主要内容:

  • 问题类型: 这是一个bug报告,用户认为该提示功能过于打扰,影响工作效率。
  • 期望行为: 用户希望能够彻底禁用 Claude Code 的会话体验反馈功能。
  • 问题版本: 该问题发生在 Claude Code 版本 1.0.120。
  • 回归问题: 用户指出该功能在之前的版本中可以正常工作,现在出现了问题。
  • 平台: 问题出现在 Anthropic API 平台。
  • 操作系统: macOS
  • 终端/Shell: Cursor
  • 无错误信息/日志: 报告中未提供错误信息或日志。
  • 重现步骤: 在使用 Claude Code 时,会周期性弹出反馈提示。

总结:

用户希望禁用 Claude Code 的会话体验反馈提示,因为该提示干扰了工作流程。此功能在之前的版本中可用,但当前版本 (1.0.120) 出现了问题。用户请求提供禁用反馈提示的选项。

LLMs encode how difficult problems are

大型语言模型问题难度编码研究:人类判断与强化学习的视角 (Research on Problem Difficulty Encoding in Large Language Models: A Human Judgement and Reinforcement Learning Perspective)

本文研究了大型语言模型 (LLM) 在解决问题时表现出的一个矛盾现象:它们能够解决复杂问题,却经常在看似简单的题目上失败。研究旨在探究 LLM 是否在内部编码问题难度,并且这种编码是否与人类的判断一致,以及这种表示是否能在强化学习 (RL) 训练后跟踪泛化能力。

主要发现:

  • 人类标注的难度可线性解码: 研究人员在 60 个模型的不同层和位置训练了线性探测器,使用 Easy2HardBench 的数学和编程子集进行评估。结果显示,人类标注的问题难度可以被模型强有力地线性解码 (AMC: ρ ≈ 0.88),并且与模型规模呈现明显的规模效应。
  • LLM 驱动的难度较弱且规模效应差: 通过 LLM 自身表现评估的问题难度,其解码效果明显较弱,且缺乏良好的规模效应。
  • 难度方向引导可以提升性能: 通过沿着难度方向“引导”模型,将模型推向“更容易”的表示,可以减少幻觉并提高准确率。
  • 强化学习训练中难度信号的变化: 在 Qwen2.5-Math-1.5B 上进行 GRPO 强化学习训练时,人类标注的难度探测器变得更强,并且与测试准确率呈正相关。相反,LLM 驱动的难度探测器则逐渐退化,并且与性能呈负相关。这表明人类标注提供了一个稳定的难度信号,并且 RL 训练会强化这个信号。而基于模型表现自动评估的难度估计,则随着模型改进而变得不准确。

研究方法:

  • 线性探测器: 研究人员使用线性探测器来提取模型内部的难度表示。
  • Easy2HardBench: 使用 Easy2HardBench 数据集,评估模型在不同难度级别上的表现。
  • GRPO 强化学习: 使用 GRPO 算法对 Qwen2.5-Math-1.5B 模型进行强化学习训练。

结论:

研究结果表明,人类标注提供了一个更稳定、更可靠的问题难度信号,并且 RL 训练会强化这个信号。而基于模型表现自动评估的难度估计,则随着模型改进而变得不准确。这些发现对于理解 LLM 的内部工作机制以及如何有效地训练它们具有重要意义。

代码与数据:

研究人员发布了探测器代码和评估脚本,以便于其他研究人员的复现。

关键词: 大型语言模型 (LLM), 问题难度, 强化学习 (RL), 线性探测器, 人类标注, 幻觉, 泛化能力。

Game design is simple

游戏设计理解十二步法 (十二步游戏设计理解法)

本文概述了理解游戏设计的十二个关键步骤,强调游戏设计的核心在于解决问题,而非单纯的娱乐。

一:乐趣 (Fun)

真正的游戏乐趣并非简单的感官刺激,而是“问题解决”的愉悦感。这种乐趣通常出现在活动结束后,是对自身能力和进步的肯定。游戏系统设计应聚焦于问题解决,而非其他元素。

二:问题与玩具 (Problems and Toys)

游戏问题可以是任何需要思考和努力才能解决的事物,例如电影中引人深思的情节。问题由规则和目标构成,而规则本身没有目标时,则可以视为“玩具”。 构建玩具比设计问题更具挑战性,但将玩具转化为游戏只需添加目标即可。

三:预测与不确定性 (Prediction and Uncertainty)

游戏是建立在不确定性基础上的机制,最终目标是将不确定结果转化为确定结果。 优秀游戏和故事都具有可预测性和不可预测性之间的平衡。 好的游戏问题具有深度、不确定性和广泛适用性。

四:循环 (Loops)

循环是游戏中反复出现的问题。 核心循环包括玩家与问题互动 (操作循环) 和玩家不断进步 (螺旋循环)。 螺旋循环并非简单的重复,而是随着玩家学习而不断变化,带来新的情况和挑战。

五:反馈 (Feedback)

玩家需要及时获得反馈,了解自己的行动、行动的影响以及是否朝着目标前进。 良好的反馈能带来惊喜、刺激和深刻的情感体验。 反馈不足会导致玩家无法学习,反馈不良则会阻碍玩家的理解和进步。

六:变化与升级 (Variation and Escalation)

游戏设计应避免固定的场景,而是通过不断变化的情况来挑战玩家。 逐渐增加问题的复杂程度,让玩家不断学习、调整和放弃策略。

七:节奏与平衡 (Pacing and Balance)

借鉴训练和学习领域的知识,合理安排游戏的节奏和难度,让玩家在挑战中获得乐趣。 游戏应提供足够的练习机会和被考验的机会,并允许玩家根据自身情况调整难度。

八:游戏由游戏构成 (Games are made of games)

复杂游戏通常由多个小型循环嵌套而成,形成一个相互关联的网络。 游戏的核心问题可以分解成更小的、更基本的问题。

九:实际系统设计 (Actual systems design)

游戏系统设计需要对问题类型有深入的理解,并能够将它们组合起来。 游戏设计者应该借鉴其他领域的研究成果,例如数学、心理学和人机交互等。

十:装饰与体验 (Dressing and Experience)

游戏的外观、故事、音效和艺术风格等,对玩家的体验至关重要。 游戏设计者需要将问题与合适的视觉和叙事元素结合起来,创造出引人入胜的游戏世界。

十一:动机 (Motivations)

不同玩家对游戏的需求和偏好不同。 游戏设计者需要了解玩家的动机,并根据这些动机来设计游戏内容和机制。

十二:简单却不简单 (It’s simple, but not)

游戏设计涉及多个领域的知识,需要设计师具备广泛的技能和经验。 游戏设计者需要不断学习和尝试,才能创造出真正有趣的游戏。 游戏设计的乐趣在于挑战自身知识的边界,并为玩家带来全新的体验。

OpenDesk – a flexible all-in-one office suite for the public sector

openDesk 概要总结 (Summary of openDesk)

openDesk 是一个专为公共管理部门设计的、可定制的办公和协作套件。其核心目标是提供数字主权、安全性和流畅协作。

主要特点与功能:

  • 一体化办公平台: openDesk 整合了所有必要的办公应用程序到一个用户友好的界面中,方便用户日常工作。
  • 数字主权与安全: 强调数字主权和安全性,满足公共管理部门对数据安全和自主性的需求。
  • 基于开源技术: 集成经过验证的开源解决方案,并采用开放标准和接口。
  • 模块化与可定制性: openDesk 具有模块化设计,可以根据需要进行扩展和定制。
  • 移动端优化: 采用现代 Web 应用程序,针对移动设备进行了优化。
  • 运营商独立性: openDesk 不依赖于特定的运营商,增强了灵活性和自主性。

发展背景:

  • “主权工作场所”计划: openDesk 是德国联邦内政部“主权工作场所”计划的成果。
  • 持续开发: 自 2024 年 1 月起,由联邦政府下属的数字化主权中心 (ZenDiS GmbH) 继续开发。
  • 合作关系: openDesk 的开发团队与德国公共管理部门、成熟的开源公司以及欧洲合作伙伴紧密合作。

简而言之, openDesk 提供了一个安全、灵活且可定制的办公解决方案,旨在支持公共管理部门实现高效工作和数字主权。 欲了解更多信息或安排演示,请访问 https://www.opendesk.eu/de/demotermin

Dead Framework Theory

LLM 和框架的未来:React 成为平台 (LLMs and Frameworks: React as the Platform)

这篇文章探讨了大型语言模型 (LLM) 对 Web 开发的影响,并对框架的未来做出了预测。以下是文章的主要观点:

核心论点:React 已经成为平台

  • 作者最初预测 LLM 会抽象掉框架选择,但发现现实更复杂:React 已经超越了竞争,成为了一个平台。
  • 这意味着新框架、库和浏览器功能需要与 LLM 训练数据、系统提示和开发者输出之间的自我强化反馈循环竞争,这使得取代 React 在功能上几乎不可能。

工具和 LLM 的现状

  • 工具如 Replit 和 Bolt 正在明确地将 React 编码硬编码到系统提示中,以提供开发者可维护的代码。
  • 统计数据显示,React 在过去 12 个月内新增网站数量巨大(超过 1300 万),但 HTTP Archive 数据显示移动端使用量增长停滞。
  • LLM 工具的 token 使用量激增,与 React 部署增长趋势高度一致,表明 LLM 倾向于输出 React 代码。

反馈循环

文章提出两个反馈循环:

  1. React 统治 Web: React 占据主导地位,推动了大量新网站的部署。
  2. LLM 训练与输出: LLM 基于现有的 Web 内容进行训练,并默认输出 React 代码,从而进一步推动 React 的采用。
  3. IDE 和工具的偏好: 开发者工具和 IDE 倾向于输出 React 代码,进一步强化了这种循环。

新框架和平台功能面临的挑战

  • 要成功,新框架、库或平台功能必须克服以下障碍:
    • 进入 LLM 训练数据(通常需要 12-18 个月的时间)
    • 说服工具创建者修改系统提示(需要现有采用度)
    • 构建一个全面的库生态系统(需要多年的开发)
    • 克服开发者的惯性,让他们选择你的框架
  • 除非新功能是用户空间无法实现的,否则很难被采用,因为 LLM 倾向于输出已有的、训练数据充足的模式(如 React 库)。

对各方的影响

  • 框架作者: 除非能够进入 LLM 训练数据并获得广泛采用,否则构建新框架将面临巨大挑战。
  • 平台开发者: 关注能够改善用户体验的根本性能力,而不是用户空间可以实现的特性。
  • 工具创建者: 如果不默认输出 React,将会限制潜在用户群。

未来展望

  • 作者认为,Web 的未来可能是一个由 LLM 使用 React 构建的统一环境。
  • 竞争将从框架选择转向输出质量,从而推动整个生态系统优化用户体验。
  • 最终,框架可能变得无关紧要,因为 LLM 能够直接通过语言操控网站,并产生最佳结果。

总结

文章强调了 LLM 对 Web 开发的巨大影响,以及 React 成为事实上的 Web 平台。新框架和平台功能需要适应这种新现实,并专注于进入 LLM 训练数据、获得开发者采用和提供卓越的用户体验。