2025-11-25

32 篇热帖

Claude Opus 4.5

好的,以下是根据原文生成的摘要,中文,Markdown 格式,字数控制在 800 字以内:

Anthropic Claude Opus 4.5 发布:更智能、更高效的 AI 模型

Anthropic 发布了其最新模型 Claude Opus 4.5,宣称它是目前全球在编码、代理和计算机使用方面表现最佳的模型。该模型在深度研究、处理幻灯片和电子表格等日常任务中也表现出显著提升。Claude Opus 4.5 被视为 AI 系统发展的重要一步,预示着未来工作方式的变革。

核心优势:

  • 卓越的软件工程能力: Claude Opus 4.5 在软件工程测试中表现出色,超越了其他模型,如上图所示。
  • 更低的成本: Opus 级别的能力现在以 $5/$25 每百万 tokens 的价格提供,使其更加普及。
  • 更高效的性能: 测试表明,Claude Opus 4.5 在解决问题时比之前的 Sonnet 4.5 使用更少的 tokens,在长任务中更高效。
  • 强大的问题解决能力: Anthropic 的测试人员反馈,Opus 4.5 能够处理歧义、权衡利弊,并能自主解决复杂的 bug。
  • 突破性的自改进 AI 代理: Opus 4.5 在办公自动化领域展现出自主提升能力的潜力,仅需 4 次迭代就能达到最佳性能。

客户反馈:

早期用户反馈积极,他们认为:

  • Opus 模型一直是“真正的 SOTA”(状态最先进),而 Opus 4.5 的定价使其成为大多数任务的首选模型。
  • Claude Opus 4.5 在代码生成和代理工作流程中表现卓越,并能有效降低 token 使用量。
  • 在内部基准测试中,Claude Opus 4.5 优于 Sonnet 4.5 和其他竞争模型。
  • 在规划和代码生成方面,Claude Opus 4.5 的推理深度得到了显著提升。
  • Claude Opus 4.5 在处理长范围、自主任务方面表现出色,并减少了失败的可能性。
  • 在企业任务方面,Claude Opus 4.5 表现出更强的多步骤推理能力。
  • Claude Opus 4.5 在设计 3D 可视化方面表现出色,速度更快。
  • 在代码审查中,Claude Opus 4.5 能够更准确地发现问题。
  • Claude Opus 4.5 在解释用户意图和生成可分享内容方面表现出色。
  • Claude Opus 4.5 在长篇故事叙述中具有优势。
  • Claude Opus 4.5 在 Excel 自动化和财务建模方面取得了显著进展。

平台更新:

  • Claude Developer Platform、Claude Code 和消费者应用都得到了更新。
  • 新增了更长的代理运行工具和在 Excel、Chrome 和桌面应用中使用 Claude 的新方式。
  • Claude 应用不再有对话长度限制。
  • Claude Code 增加了计划模式,能够构建更精确的计划。

安全方面:

Claude Opus 4.5 被认为是 Anthropic 最安全、最可靠的模型,在抵抗 prompt injection 攻击方面表现出色。

其他信息:

  • 可通过 Claude API 使用 claude-opus-4-5-20251101
  • Anthropic 正在研究 AI 如何改变工程等职业,并计划分享更多结果。
  • Claude Opus 4.5 拥有更好的视觉、推理和数学技能,并在许多领域处于领先地位。

总而言之,Claude Opus 4.5 在性能、效率和安全性方面都取得了显著进步,是 Anthropic 在 AI 领域的重要一步。

Pebble Watch software is now 100% open source

Pebble 软件更新与 Pebble Time 2 进展总结 (Summary of Pebble Software Updates and Pebble Time 2 Progress)

以下是对 Pebble 相关更新的总结:

1. 100% 开源软件 (100% Open Source Software)

  • Pebble 软件现在已完全开源 (约 95% 已开源,现在达到 100%),用户可以下载、编译和运行软件,确保 Pebble 设备的长久可用性。
  • 新的 Pebble 移动应用源代码已发布在 GitHub 上 (https://github.com/coredevices/mobileapp)。

2. Pebble 应用商店 (Pebble Appstore)

3. Pebble Time 2 (PT2) 进展 (Pebble Time 2 (PT2) Progress)

  • 时间表更新: 计划于 1 月份开始发货,大部分用户预计在 3 月/4 月收到 PT2。生产时间可能因中国农历新年假期而有所延迟。
  • 可维修性: PT2 后盖采用螺丝固定设计,方便用户更换电池。
  • 硬件设计文件: Pebble 2 Duo 的电气和机械设计文件已发布在 GitHub 上 (https://github.com/coredevices/hardware),方便开发者设计兼容 PebbleOS 的设备。
  • 颜色选择: 四种颜色可选:黑/黑,黑/红,银/蓝,银/(白色)。用户将在几周后收到邮件选择颜色。
  • 演示视频: 新发布的 Tick Talk 节目 #4 包含了 Pebble Time 2 的演示 (https://youtu.be/KTlRBI2QCzM)。

4. 软件组件 (Software Components)

5. 开放性与限制 (Openness and Limitations)

  • 虽然核心 Pebble 软件栈将始终开源,但目前 PebbleOS 和移动应用仍然依赖一些非自由软件组件 (例如心率传感器和 Memfault 库)。
  • 未来可能会出现更多非自由软件组件,但核心软件始终开源。

总而言之,Pebble 致力于通过开源软件、硬件可维修性和去中心化的应用商店,确保 Pebble 设备的长期可持续性。

France threatens GrapheneOS with arrests / server seizure for refusing backdoors

总结:La Quadrature du Net 关于 GrapheneOS 的声明

La Quadrature du Net (@LaQuadrature@mamot.fr) 发布声明,谴责《巴黎人报》和《费加罗报》近日对 GrapheneOS 的“可耻攻击”。

主要内容:

核心观点: La Quadrature du Net 强调 GrapheneOS 的重要性,并反对对该操作系统的负面宣传。

Shai Hulud launches second supply-chain attack

摘要:Shai-Hulud 活动 - 持续的 npm 供应链攻击

本文档总结了名为 Shai-Hulud 的持续 npm 供应链攻击活动,该活动利用 npm 平台上的漏洞来传播恶意代码并盗取敏感信息。

主要事件时间线:

  • 8 月 27 日: 发布关于 S1ngularity 活动的报告,该活动针对多个 nx 包。
  • 9 月 16 日: Shai-Hulud 攻击首次发生。
  • 9 月 18 日: 发布关于 Shai-Hulud 活动的技术分析。
  • 11 月 24 日: “Second Coming” - Shai-Hulud 活动的第二次波次,在 npm 废弃旧 token 的截止日期前发生。

Shai-Hulud 的运作方式:

Shai-Hulud 是一个自复制的 npm worm,感染系统后,会使用 TruffleHog 搜索 API 密钥和 token 等敏感信息,并将这些信息发布到公共 GitHub 仓库。然后,它尝试将自身复制到 npm,以在生态系统中传播。

本次攻击的新变化:

  • 使用 bunsetup_bun.js 执行恶意代码 bun_environment.js
  • 创建随机命名的仓库来存储被盗数据。
  • 感染高达 100 个 npm 包(上次为 20 个)。
  • 如果无法进行 GitHub 或 NPM 认证,则会删除用户主目录中的所有文件。
  • 将敏感信息发布到 GitHub,仓库描述为 "Sha1-Hulud: The Second Coming."

受影响的软件包:

目前已检测到 492 个受影响的软件包,总月下载量超过 1.32 亿次。受影响的软件包包括:AsyncAPI、PostHog、Postman 等公司。

攻击者错误:

攻击者在分发恶意代码时出现错误,有时只包含 setup_bun.js,而缺少 bun_environment.js,这限制了本次攻击的影响。

建议的安全措施:

  • 审核所有 Zapier/ENS 相关的 npm 依赖项和版本。
  • 轮换 GitHub、npm、云和 CI/CD 账户的所有凭证。
  • 检查 GitHub 上是否存在描述为“Sha1-Hulud: The Second Coming”的异常仓库。
  • 在 CI 中尽可能禁用 npm postinstall 脚本。
  • 锁定包版本并强制执行 GitHub 和 npm 账户的 MFA。
  • 使用 Safe-Chain 等工具来阻止 NPM 上的恶意包。

总而言之,Shai-Hulud 活动是一个持续的威胁,需要开发者和安全团队采取积极措施来保护其系统和数据。

Claude Advanced Tool Use

Claude AI Agent 功能增强:动态工具发现、程序化工具调用和工具使用示例 (Claude AI Agent 功能增强:动态工具发现、程序化工具调用和工具使用示例)

Anthropic 发布了一系列功能,旨在提升 Claude AI Agent 的能力,使其能够无缝地与数百甚至数千个工具协同工作。这些功能的最终目标是构建更强大、更高效的 AI Agent,处理更复杂的任务。

核心挑战:

  • 工具定义占用过多上下文窗口空间: 随着连接的 MCP 服务器数量增加,工具定义会占用大量 token,超过 10 万 token 甚至更多。
  • 自然语言工具调用效率低: 每次工具调用都需要完整的推理过程,中间结果会积累在上下文中,影响效率。
  • JSON Schema 无法表达工具使用模式: JSON Schema 仅定义数据结构,而无法指导工具的使用方式,例如何时包含可选参数、参数组合等。

主要功能:

Anthropic 引入了三个关键功能来解决上述问题:

  1. 工具搜索工具 (Tool Search Tool): 允许 Claude 在需要时动态发现工具,仅加载当前任务所需的工具,大幅减少上下文窗口占用。内部测试显示,使用该工具可以将上下文占用率降低 85%。
  2. 程序化工具调用 (Programmatic Tool Calling): 允许 Claude 通过编写代码来调用工具,避免了每次调用都需要完整的推理过程,提高效率并减少错误。例如,Claude 可以编写 Python 脚本来处理复杂的业务逻辑,例如预算合规性检查。
  3. 工具使用示例 (Tool Use Examples): 通过提供示例代码,直接展示工具的使用方式,解决 JSON Schema 无法完整表达工具使用模式的问题,提高工具调用准确性。

详细说明:

  • 工具搜索工具:
    • 工作原理: 用户提供所有工具定义,但标记部分工具为 defer_loading: true,使其可以按需加载。Claude 仅加载工具搜索工具和少量关键工具,当需要特定功能时,再搜索并加载相关工具。
    • 优势: 减少 token 占用,提高工具选择准确性。
    • 示例: 可以将整个 Google Drive 服务器标记为 defer_loading: true,但保留常用的文件搜索工具 search_filesdefer_loading: false
  • 程序化工具调用:
    • 工作原理: Claude 编写 Python 代码来调用和编排工具,代码运行在一个沙盒环境中。工具执行结果不会进入 Claude 的上下文窗口,从而减少 token 消耗。
    • 优势: 减少 token 消耗、降低延迟、提高准确性。
    • 示例: 在检查团队成员的旅行预算时,Claude 可以编写代码并行调用多个工具,避免了逐个调用造成的延迟和上下文污染。
  • 工具使用示例:
    • 工作原理: 在工具定义中提供示例代码,帮助 Claude 学习工具的使用模式。
    • 优势: 提高工具调用准确性,解决 JSON Schema 无法表达工具使用模式的问题。

最佳实践:

  • 分层使用功能: 根据实际需求,优先解决最大的瓶颈,例如上下文占用、效率低下或参数错误。
  • 工具搜索工具配置: 为工具定义清晰的描述,并使用系统提示引导 Claude 进行搜索。
  • 程序化工具调用配置: 清晰地记录工具的返回格式,并选择适合并行执行和重试的工具。
  • 工具使用示例配置: 提供多样化的示例代码,展示不同的使用场景。

结论:

Anthropic 的这些功能增强将极大地提升 Claude AI Agent 的能力,使其能够处理更复杂、更具规模的任务。通过动态工具发现、程序化工具调用和工具使用示例,开发者可以构建更强大、更高效的 AI Agent,推动 AI 应用的进一步发展。

Trillions spent and big software projects are still failing

软件开发的持续失败:教训未汲取,错误重演 (持续的软件失败:教训未汲取,错误重演)

本文回顾了作者在《IEEE Spectrum》杂志发表的关于软件开发和现代化失败的文章,以及这两十年来软件项目持续失败的普遍现象。 尽管全球信息技术支出从2005年到2025年增加了三倍多,但软件成功率并未明显提高,软件故障带来的商业和社会成本持续增长。

主要观点:

  • 失败的普遍性: 软件失败无处不在,不受国家、公司规模、组织类型或声誉的影响。
  • AI无法解决根本问题: 人工智能工具和代码助手在短期内无法解决大型软件项目中的复杂系统工程、项目、财务和组织政治问题。
  • 失败的原因: 软件失败的主要驱动因素包括:缺乏想象力、不切实际的目标、无法应对项目复杂性以及未管理的风险。
  • Phoenix案例: 以加拿大政府的Phoenix工资系统为例,展示了项目管理不善可能导致的灾难性后果。该系统耗资3.1亿加元,但在2016年上线后立即出现问题,导致数以万计的联邦政府雇员出现工资错误,造成了巨大的财务和精神压力。
  • 屡见不鲜的错误: 软件项目失败往往是重复出现的已知错误,而非创新探索中的意外。
  • 缺乏学习: 尽管经历了无数次失败,IT行业仍然未能从中吸取教训,重复犯同样的错误。
  • 对风险的忽视: 项目成本效益分析通常忽略了软件故障对用户造成的财务和精神损失。
  • 趋势与挑战: 尽管出现了敏捷开发和DevOps等方法,但它们也面临着实施挑战,并且成功率并非百分之百。
  • 对人工智能的警惕: 软件中越来越多地应用人工智能,要求对潜在的错误进行预判和应对,对所有软件系统的工作都提出了更高的要求。

结论:

作者呼吁IT行业停止重复错误,并强调需要更现实的项目管理、财务投入、技术能力和经验积累。 只有这样,才能避免未来出现更多类似的失败,并确保软件系统能够可靠地服务于社会。 强调了对人工智能的谨慎态度,呼吁在软件设计中优先考虑人类需求和价值观,避免重复过去的错误。

Brain has five 'eras' with adult mode not starting until early 30s

人类大脑发育的五个主要阶段:一项大规模研究揭示关键转折点

一项针对近4000名年龄在1岁到90岁之间的人群的大规模研究,揭示了人类大脑发育的五个主要阶段,并确定了四个关键的“转折点”,这些转折点标志着大脑组织结构进入不同的发展轨道。研究结果发表在 Nature 杂志上。

研究概述:

该研究通过分析大脑扫描数据,追踪了神经连接及其在整个生命周期中的演变。研究人员使用12个指标来量化大脑组织,包括连接效率、组织化程度以及大脑对中心枢纽的依赖程度。

五个主要阶段:

  1. 童年期 (出生 - 9岁): 这一阶段的特点是“网络整合”,即婴儿大脑中大量的突触(神经元之间的连接点)被修剪,更活跃的突触得以保留。虽然大脑的连接效率在此期间下降,但灰质和白质体积迅速增长,皮层厚度达到峰值,皮层折叠也趋于稳定。
  2. 青春期 (9岁 - 32岁): 白质体积持续增长,大脑的通讯网络组织结构不断完善。这一阶段的特点是整个大脑的连接效率稳步提高,与认知能力提升相关。
  3. 成年期 (32岁 - 66岁): 神经连接架构趋于稳定,与其它研究中智力和人格发展的平台期相符。大脑区域变得更加模块化,彼此隔离。
  4. 早期衰老期 (66岁 - 83岁): 标志着大脑架构开始发生变化。
  5. 晚期衰老期 (83岁以后): 这一阶段的特点是大脑连接性降低,可能与白质的衰老和退化有关。

关键转折点:

研究确定了四个关键的转折点,分别发生在9岁、32岁、66岁和83岁左右。这些转折点标志着大脑组织结构从一种发展轨道转移到另一种发展轨道。32岁左右的转变最为显著。

研究意义:

  • 研究表明大脑发育并非直线进行,而是经历几个关键阶段。
  • 了解大脑结构的演变过程,有助于识别大脑连接易受干扰的时间和方式。
  • 研究结果可能为精神健康障碍的风险因素提供见解,因为大多数精神健康障碍通常在青春期出现。
  • 生活事件,例如生育,可能与大脑变化有关,但该研究并未明确测试这种关联。

总而言之,这项大规模研究为我们理解人类大脑发育的复杂性和动态性提供了宝贵的见解,并为未来的神经科学研究开辟了新的方向。

X Just Accidentally Exposed a Covert Influence Network Targeting Americans

X平台曝光大量假冒特朗普支持者账户,疑为外国势力操控 (X Platform Exposes Numerous Fake Trump Supporter Accounts, Suspected to be Controlled by Foreign Forces)

本文报道了X平台(原Twitter)最近出现的一项新功能,意外揭露了大量自称是特朗普支持者的政治账户,实际上由外国国家操控。这一发现被认为是自2016年俄罗斯干预选举以来,大型平台公开曝光外国活动的最广泛的一次。

主要发现:

  • 新功能揭露: X平台推出一项新功能,允许用户查看账户创建和主要运营的地理位置,旨在提高透明度和真实性。
  • 大量外国账户: 该功能立即揭示了大量自称是美国特朗普支持者,但实际运营地位于欧洲、亚洲、非洲等外国的账户。
  • 伪装身份: 许多账户声称其位置在美国,甚至使用带有“American”字样的用户名,但实际运营地在海外。
  • 主要受影响群体: 受到影响的账户中,以自称“爱国者”并支持“美国优先”政策的特朗普支持者居多,例如拥有39.2万粉丝的“MAGA NATION”账户,运营地位于东欧。其他例子包括在泰国、尼日利亚、孟加拉国等地运营的账户。
  • 历史回溯: 这一现象让人联想到2016年俄罗斯对美国选举的干预,当时俄罗斯互联网研究机构(IRA)创建了大量假冒美国人身份的社交媒体账号,以传播不和谐信息并诋毁时任候选人希拉里·克林顿。
  • 新的威胁: CNN在2024年报道,X平台上存在旨在提升特朗普竞选的账户网络,这些账户盗用了欧洲女性的个人照片,并指示美国选民为特朗普投票。
  • 潜在动机: 操控这些账户的幕后力量可能来自多个国家,既有与美国信息战有历史渊源的国家(如俄罗斯),也有来自尼日利亚、印度、泰国和肯尼亚等国家,其动机可能包括国家影响力、金钱利益或两者兼有。

影响与展望:

  • 对民主的威胁: 这表明外国势力对美国政治的干预并未停止,对美国民主和社会的凝聚力构成威胁。
  • 公众意识提升: 新功能提高了公众对外国势力如何试图影响美国政治对话的认识。
  • 政治怀疑: 这可能会加剧政治领域的怀疑情绪,人们可能会对不同的观点产生怀疑,并指责其为“外国机器人”。
  • 平台责任: X平台面临选择:是积极打击这些外国账户,还是仅仅告知用户并允许内容存在。其平台声誉岌岌可危。
  • 未来趋势: 预计未来人们将更加谨慎地看待社交媒体作为衡量公众舆论的指标,并需要更仔细地审查在线趋势。

总而言之,X平台新功能意外揭露了外国势力对美国政治的持续干预,引发了对平台责任、公众意识和未来政治格局的深刻思考。

PS5 now costs less than 64GB of DDR5 memory. RAM jumps to $600 due to shortage

内存价格飙升:人工智能需求推动DDR5内存成本大幅上涨

根据Tom's Hardware的报道,当前全球内存和存储供应受到人工智能(AI)需求的巨大冲击,导致终端消费者面临日益上涨的组件价格。

DDR5内存价格飙升:

  • G.Skill Trident Z5 Neo 6000 MT/s 64GB内存套装的价格已达到创纪录的高位,Newegg上售价为599.99美元,比PS5 Slim或Xbox Series S贵200美元,仅比PS5 Pro少50美元。
  • 过去几个月,该套装的价格通常在205-220美元之间,但在短短两个月内,价格上涨了约190%。
  • DRAM价格上涨的主要原因是AI项目对内存需求的激增,导致生产线优先服务于AI客户,消费者不得不支付更高的价格。

其他存储设备也受到影响:

  • 由于AI需求,机械硬盘 (HDD) 从商店货架上消失,微型SD卡被用作替代品。
  • 大容量近线HDD的交付时间延长至两年。
  • QLC固态硬盘 (SSD) 的需求也大幅增加。
  • 经销商甚至开始捆绑销售内存和主板,以应对全球短缺。

未来展望:

  • Valve的即将推出的Steam Machine预计也会因DRAM危机而成本更高。
  • 专家预测,DRAM和NAND存储的短缺可能持续到2026年。
  • 内存市场通常存在周期性波动,预计2027年可能会出现DDR5内存的降价。

总结:

人工智能的快速发展对全球存储市场造成了巨大的冲击,DDR5内存和其他存储设备的价格都出现了大幅上涨。这种趋势预计将持续一段时间,在2027年之前,消费者可能需要为购买内存支付更高的价格。

France threatens GrapheneOS with arrests / server seizure for refusing backdoors

总结:La Quadrature du Net 对 GrapheneOS 的报道

La Quadrature du Net (@LaQuadrature@mamot.fr) 发布声明,指出《巴黎人报》和《费加罗报》近期发表了对 GrapheneOS 的负面报道,发起了一场“可耻的攻击”。

核心要点:

  • GrapheneOS 的介绍: GrapheneOS 是一款开源、免费且可公开访问的手机操作系统。
  • La Quadrature 的立场: La Quadrature 推荐并优先使用 GrapheneOS 作为保护用户免受广告追踪和间谍软件侵害的工具。
  • 报道背景: 媒体报道称 GrapheneOS 被犯罪分子(特别是贩毒集团)用于保护其数据免受警方追踪。
  • 声明目的: La Quadrature 的声明旨在反驳这些负面报道,并强调 GrapheneOS 的正当用途和重要性。

相关链接:

APT Rust requirement raises questions

LWN.net 报道:APT 引入 Rust 依赖引发 Debian 项目讨论

核心内容: Debian 的高级包管理工具 (APT) 计划于 2026 年 5 月引入 Rust 依赖,引发了 Debian 项目内部关于技术变更决策流程和对旧硬件支持的讨论。

主要细节:

  • 计划变更: APT 的主要维护者 Julian Andres Klode 宣布 APT 将依赖 Rust 编译器、标准库和 Sequoia 生态系统,以提高代码安全性并加强单元测试。
  • 影响范围: 该变更将影响 Debian 的非官方移植版本,要求这些版本在 6 个月内获得可用的 Rust 工具链,否则可能需要放弃这些移植。
  • 积极与消极反馈: 一些开发者欢迎这一转变,认为 Rust 的引入是积极的。但另一些开发者,例如 John Paul Adrian Glaubitz,则批评 Klode 的沟通方式过于强硬,缺乏讨论空间。
  • 现有依赖: APT 已经使用 Sequoia-PGP 项目的 sqv 工具进行 OpenPGP 签名验证,这使得 Alpha、Motorola 680x0、PA-RISC 和 SuperH 架构已经需要 Rust 编译器。
  • 对旧硬件的影响: 尽管 Klode 的声明听起来影响范围广泛,但实际影响可能小于预期,因为这些架构已经不再是 Debian 的官方支持架构。
  • 安全考量与争议: 一些开发者认为,如果 APT 的目标是减少漏洞,直接移除 .deb、.ar 和 .tar 格式解析代码可能更有效,因为这些代码仅由 apt-ftparchive 和 apt-extracttemplates 使用,且 apt-ftparchive 的主要用户是 Canonical 的 Launchpad。
  • Rust 支持挑战: Debian 在支持 Rust 包方面仍然存在一些问题,例如静态链接库的声明和跟踪 CVE。
  • Debian 的价值观: 该事件引发了关于 Debian 项目的价值观的讨论,包括“通用操作系统”的理念,强调对多种硬件架构的支持、长期支持和民主治理结构。
  • 可能的应对措施: Debian 拥有技术委员会和其他机制,可以应对开发者提出的有争议的变更。

总结: APT 引入 Rust 依赖的计划引发了 Debian 项目内部关于技术决策流程、对旧硬件支持以及 Rust 相关的基础设施挑战的讨论。尽管 Rust 在自由软件领域日益普及,但如何在保持 Debian 的核心价值观的同时推进技术升级,仍然是一个需要解决的问题。

Jakarta is now the biggest city in the world

全球城市化趋势:雅加达成为世界最大城市,未来增长点聚焦新兴经济体

根据联合国于2024年11月18日发布的新报告《2025年世界城市化展望》,雅加达已成为全球人口最多的城市,拥有近4200万居民。 这份报告是自2018年以来的首次修订,当时东京是全球最大的城市,雅加达排名第33位。

主要发现:

  • 城市人口占比: 全球约45%的人口居住在城市。
  • 人口排名变化:
    • 雅加达:第一位,4200万居民。
    • 达卡(孟加拉国):第二位,4000万居民。
    • 东京(日本):第三位,3300万居民。
    • 开罗(埃及):是前十名中唯一非亚洲城市。
  • 未来趋势: 预计达卡将在本世纪中叶成为世界最大城市,而东京预计到2050年将从第三位降至第七位。
  • “大城市”定义: 联合国将人口超过1000万的城市定义为“大城市”(megacity)。
  • 大城市的分布: 全球超过一半的大城市(19个)位于亚洲。美国有两个大城市:洛杉矶和纽约市。
  • 大城市数量增长: 大城市数量从1975年的8个激增到2025年的33个,预计到2050年将达到37个。
  • 新兴大城市: 预计未来人口将超过1000万的城市包括:
    • 埃塞俄比亚的亚的斯亚贝巴
    • 坦桑尼亚的达累斯萨拉姆
    • 印度的哈吉普尔
    • 马来西亚的吉隆坡
  • 中小城市崛起: 虽然大城市人口众多,但中小城市总人口仍然超过大城市,并且增长速度更快。 预计到2050年,全球将有超过15000个城市,其中大部分人口少于25万。
  • 城市人口下降: 值得注意的是,即使国家人口增长,一些城市的人口也在下降。例如,墨西哥城和中国成都的人口数量有所减少。

总结: 联合国报告突出了城市增长和扩张对全球可持续发展提出的警告,并预测了未来城市化趋势,重点关注新兴经济体中的城市增长,以及中小城市的重要性。

FLUX.2: Frontier Visual Intelligence

FLUX.2 总结 (FLUX.2 Summary)

FLUX.2 是一款专为实际创意工作流程设计的图像生成模型,旨在超越演示和花哨技巧。 它由 Black Forest Labs 开发,秉持“开源核心”理念,致力于开放研究和创新,为开发者和创意人员提供强大的工具。

主要特点与改进:

  • 高质量图像生成: FLUX.2 能够生成高质量图像,同时保持多张参考图像中的角色、风格和一致性。
  • 多参考支持: 支持同时参考多达 10 张图像,实现最佳风格一致性。
  • 细节与真实感增强: 图像细节更丰富,纹理更清晰,光照更稳定,适用于产品拍摄、可视化和摄影等场景。
  • 文本渲染能力提升: 能够可靠地生成包含复杂排版的图表、表情包和 UI 模拟图。
  • 更强的提示遵循性: 更好地遵循复杂的结构化指令,包括多部分提示和构图约束。
  • 世界知识整合: 具备更强的现实世界知识、光照和空间逻辑理解能力,生成更连贯的场景。
  • 高分辨率编辑: 支持高达 4MP 分辨率的图像编辑。

模型家族:

FLUX.2 提供多种模型产品,以满足不同需求:

  • FLUX.2 [pro]: 顶级图像质量,速度快,成本低,不妥协地平衡速度和质量。
  • FLUX.2 [flex]: 允许开发者控制模型参数,例如步骤数和引导比例,从而控制质量、提示遵循性和速度,尤其擅长渲染文本和细节。
  • FLUX.2 [dev]: 32B 的开源权重模型,结合文本到图像生成和多图像编辑功能,是目前最强大的开源图像生成和编辑模型。可在 Hugging Face 上获取,并提供参考推理代码。
  • FLUX.2 [klein] (即将发布): 开源、Apache 2.0 许可的模型,比同等规模的从头开始训练的模型更强大、更易于开发者使用。
  • FLUX.2 - VAE: 用于潜在表示的新变分自编码器,提供学习能力、质量和压缩率之间的优化平衡。

技术基础:

FLUX.2 基于潜在流匹配架构,结合了 Mistral-3 24B 参数的视觉-语言模型和修正流变换器。

资源链接:

Black Forest Labs 致力于构建视觉智能的基础设施,推动视觉感知、生成、记忆和推理的统一发展。

GrapheneOS migrates server infrastructure from France

GrapheneOS 停止在法国运营,原因与政府提案及媒体报道相关

GrapheneOS 项目宣布停止在法国的所有运营,并表示法国不再是“开源隐私项目”的安全场所。 这项决定主要受到欧盟 Chat Control 提案的支持以及法国媒体 Le Parisien 的负面报道所影响。

主要内容:

  • 运营转移: GrapheneOS 将所有网站和讨论服务器迁移到国外。 目前,项目依赖法国的 OVH Bearharnois 提供核心网站和社交媒体服务。 迁移计划将 Mastodon、Discourse 和 Matrix 实例转移到多伦多当地和共享服务器,关键网站基础设施将由德国公司 Netcup 托管。
  • 服务不受影响: 尽管运营转移,GrapheneOS 声明其服务器不收集用户敏感数据,且关键基础设施不在法国,因此签名验证和更新降级保护等服务不受影响。
  • 原因:
    • 欧盟 Chat Control 提案: GrapheneOS 开发人员对法国政府支持的欧盟 Chat Control 提案表示担忧,因此拒绝前往法国。
    • 媒体报道: Le Parisien 发表的两篇文章引发了问题。 一篇文章引用了法国网络犯罪检察官 Johanna Brousse 的言论,暗示可能对项目采取法律行动,如果发现项目与犯罪组织存在联系且不配合法律,将起诉项目发布者。
  • 澄清与争议: GrapheneOS 认为 Le Parisien 将其项目与政府资助的伪造版本(即“政府赞助的分叉”)混淆。 报道中提到了一个虚假的 Snapchat 应用、暗网广告以及一系列未公开的 YouTube 视频,这些都不是 GrapheneOS 的功能。
  • 历史背景: GrapheneOS 曾威胁要对这些政府赞助的分叉提起诉讼。 例子包括 ANOM,一家由美国联邦调查局支持的空壳公司,该公司开发了一个被破坏的 Android 操作系统和消息平台,作为 Operation Trojan Horse 的一部分,该行动从 2018 年到 2021 年期间渗透了数百个犯罪集团。

总结: GrapheneOS 决定停止在法国运营,是出于对隐私保护的担忧,主要源于欧盟 Chat Control 提案和法国媒体的错误报道,将开源项目与政府资助的恶意软件混淆。 项目正在将运营转移到其他地区,以确保其安全性和独立性。

Making Crash Bandicoot (2011)

崩溃小子开发幕后:安迪·加文的系列文章总结

安迪·加文,作为《崩溃小子》的联合创作者,分享了他关于这款经典游戏开发过程的一系列文章,详细记录了从最初构想到最终发布的历程。

核心概念与起源:

  • 1994年,Naughty Dog 是一家由安迪·加文和杰森·鲁宾组成的两人公司。当时,索尼缺乏像任天堂的马里奥和世嘉的索尼克一样的代表性吉祥物。
  • 因此,他们决定创建一个吉祥物,希望能够填补这一市场空白,并成功地创造了《崩溃小子》。

开发过程:

  • 技术挑战: 开发初期,加文和戴夫·巴格特面临着构建引擎和工具管道的挑战,以实现他们设想的卡通世界。杰森·鲁宾同时负责了所有美术设计,并不断催促加文确保视觉效果出色。
  • 游戏控制: 游戏控制是核心要素,加文及其团队不断迭代和改进了角色控制,例如优化角色停止速度和跳跃机制。
  • 内容填充: 在核心游戏机制确定后,他们发现关卡内容略显空洞,因此增加了更多的敌人。
  • 命名: 最初游戏的名字是“威利浣熊”,后来改为了“崩溃小子”,并考虑过“Dash”、“Smash”和“Bash”等名称。
  • 语言GOOL: 加文设计了一种名为GOOL的LISP 语言,用于《崩溃小子1、2、3》的开发。最初是解释型的,后来在《崩溃小子2》中,部分表达式被编译成机器码以提高效率。

团队贡献与视角:

  • 戴夫·巴格特分享了他对《崩溃小子》开发过程的见解。
  • 杰森·凯,另一位游戏行业资深人士,提供了对《崩溃小子》发布的外部视角。
  • 斯蒂芬·怀特,加文的合作者,共同参与了《崩溃小子2、3》、《Jak & Daxter》和《Jak 2》的开发,也提供了不少技术支持。

其他重要细节:

  • E3演示: 团队需要赶在E3展会上完成游戏演示。
  • 国际化: Naughty Dog 率先尝试了同时国际发布,并在《崩溃小子2》和《崩溃小子3》中实现了全球版本代码的一致性,并针对不同市场进行了本地化和营销。
  • 日本市场: 加文回顾了日本在 80 年代中期到 90 年代末在游戏行业中的重要地位。
  • 宣传: 为庆祝游戏15周年,加文分享了1996年首次亮相的美国电视广告。
  • 战争故事: Ars Technica 制作了一部关于《崩溃小子》开发过程的视频访谈,作为其“战争故事”系列的一部分。

粉丝互动:

  • 加文也鼓励粉丝分享他们对《崩溃小子》的第一印象和最喜欢的记忆。

总而言之,安迪·加文的文章系列详细记录了《崩溃小子》从概念到发布的整个过程,涵盖了技术挑战、设计决策、团队合作以及对市场营销的重视,展现了这款经典游戏背后的故事。

Human brains are preconfigured with instructions for understanding the world

关于人类大脑早期活动的新研究总结

以下是对提供的文章内容的总结:

核心发现:

一项新的研究表明,人类大脑在接收到任何外部感官刺激之前,就具有预配置的、结构化的活动模式。这意味着大脑并非完全由经验塑造,而是存在一个内在的“操作系统”。

研究方法:

加州大学圣克鲁斯分校(UC Santa Cruz)的研究人员利用大脑类器官(brain organoids)——由人类干细胞在实验室中培养的微型大脑组织模型——来研究大脑最早期的电活动。 类器官提供了一个独特的研究窗口,因为它们在实验室环境中存在,与体内环境隔离,可以大规模培养,并且符合伦理要求。

主要研究内容:

  • 类器官的培养和测量: 研究人员诱导干细胞形成脑组织,并使用专门的微芯片测量其电活动,类似于计算机中的芯片。
  • 早期活动模式: 研究人员观察到,在脑组织自组装成能够处理感官信息和产生语言和意识的组织之前,其细胞就开始自发地发出具有特定模式的电信号。这些模式与大脑默认模式(default mode)惊人地相似。
  • 默认模式: 大脑默认模式是指即使在没有执行特定任务时,大脑也会表现出的基本神经活动模式,为处理各种感官信号奠定基础。
  • 遗传蓝图: 研究结果表明,这些早期活动模式可能是一种遗传编码的蓝图,指导大脑的神经结构,并为大脑构建世界地图提供了基础。

研究意义:

  • 理解大脑发育: 这项研究有助于更深入地理解人类大脑的发育过程。
  • 神经发育障碍诊断和治疗: 了解早期大脑模式可能对诊断和治疗神经发育障碍具有重要意义。
  • 环境影响: 研究结果可以帮助评估毒素(如农药和微塑料)对大脑发育的影响。
  • 药物开发: 通过研究病理状态下的复杂动态,有望开发更有效、更经济的治疗方法,包括药物治疗和基因编辑工具。

研究团队:

该研究由UC Santa Cruz的Sharf实验室领导,并与UC San Francisco、UC Santa Barbara、华盛顿大学圣路易斯分校、约翰霍普金斯大学、汉堡大学医学中心和苏黎世联邦理工学院等机构的科研人员合作完成。

关键词: 大脑类器官, 电活动, 默认模式, 神经发育, 神经发育障碍, 遗传蓝图。

TSMC Arizona outage saw fab halt, Apple wafers scrapped

台積電亞利桑那廠斷電事件影響營利,凸顯海外擴張挑戰 (TSMC Arizona Factory Power Outage Impacts Profits, Highlights Challenges of Overseas Expansion)

根據消息來源,台積電 (TSMC) 在亞利桑那州 Fab 21 工廠的生產,上季末因工業氣體供應商 Linde 的電力故障而中斷。該事件導致該工廠停產數小時,並被迫報廢數千片客戶訂單上的晶圓,客戶包括蘋果 (Apple)、輝達 (Nvidia) 和超微半導體 (AMD)。

事件經過及影響:

  • 電力故障: 中斷源於 Linde 工廠的電力故障,Linde 是一家總部位於英國的工業氣體和工程公司,台積電將亞利桑那廠的氣體供應外包給了它。
  • 營利下滑: 此次事件是台積電第三季淨利大幅下降 (同比下降 99%,僅剩 140 萬美元) 的一個重要原因。儘管台積電聲稱營利受多重因素影響,且海外廠房的擴張將導致未來五年 (從 2025 年開始) 毛利率下降,但此次斷電事件提供了更直接的解釋。
  • 客戶影響: 目前來看,對客戶的影響應可忽略不計,且台積電可能透過保險來彌補部分損失。
  • 損失估算: 由於事件發生在季末,因此難以在季度結束前彌補損失。

台積電的挑戰與歷史經驗:

  • 海外擴張的挑戰: 報導指出,台積電在海外廠房的營運,特別是在非台灣地區,面臨跨文化適應的挑戰。
  • 過去的供應商問題: 過去台積電曾遭遇過由供應商造成的生產中斷,例如 2018 年由日本設備導入的電腦病毒攻擊,以及 2019 年來自化學供應商的受污染光阻事件。
  • 亞利桑那廠的重要性: 台積電亞利桑那廠今年第一季已實現盈利,顯示其快速擴張和生產晶片的能​​力。目前該廠的產能仍較小,許多產品已在台灣製造過。

其他細節:

  • Linde 在 2021 年宣布與台積電簽訂合約時,宣稱將在該設施投資 6 億美元,但文件中指出,該工廠僅需 14 名工廠員工和 14 名卡車司機。
  • 蘋果的 A16 SoC 是該廠生產的第一款產品,其後增加了 AMD 的 Ryzen 9000 和 Nvidia Blackwell 晶片,以及 Bitdeer 的晶片設計。
  • 台積電對此次事件的回應是,亞利桑那廠對公司營收有正面貢獻,但利潤受多重因素影響,且海外廠房的擴張將導致毛利率下降。

總體而言,此次亞利桑那廠斷電事件凸顯了台積電海外擴張的挑戰,以及對供應鏈管理的依賴可能帶來的風險。

Most Stable Raspberry Pi? 81% Better NTP with Thermal Management

精确 NTP 服务器优化:利用 CPU 核心隔离和热稳定实现微秒级精度 (中文总结)

这篇文章详细介绍了作者如何通过结合 CPU 核心隔离和热稳定技术,将基于树莓派和 GPS PPS 信号的 NTP 服务器的频率变化降低了 81%,频率标准偏差降低了 77%。

问题:热致时间抖动 (Thermal-Induced Timing Jitter)

现代 CPU (包括树莓派) 使用动态频率缩放以节省电量和控制温度。虽然这对节能有益,但对精确计时却有害。CPU 频率的不断变化会导致系统时钟的滴答率变化,从而引入抖动。更关键的是,系统时钟最终由晶体振荡器驱动,而晶体振荡器的频率受温度影响。CPU 加热和冷却会导致晶体振荡器温度变化,进而影响其频率,导致时间漂移。

解决方案:

作者通过以下两部分方案解决了这个问题:

  1. CPU 核心隔离: 将 chronyd 和 PPS 中断等关键任务专门分配给 CPU 0。
  2. 热稳定: 使用“时间燃烧器” (time burner) 进程,在其他 CPU (1-3) 上运行负载以保持 CPU 温度恒定,防止频率缩放。

具体实现:

  • CPU 核心隔离: 使用启动优化脚本,将 PPS 中断配置到 CPU 0,将 chronyd 设置为实时优先级,并将其也固定到 CPU 0。
  • 热稳定: “时间燃烧器”进程通过 MD5 哈希运算消耗 CPU 资源,PID 控制器根据 CPU 温度调节燃烧时间,将 CPU 温度控制在 54°C 左右。

实验结果:

优化前,RMS 偏移量为 85.44 纳秒。优化后,RMS 偏移量降至 43.54 纳秒,实现了近 50% 的降低。频率变化范围也显著缩小,计时精度大幅提升。

设置步骤:

  1. 安装必要的工具 (linux-cpupower, python3, util-linux)。
  2. 创建并配置启动优化脚本,设置 CPU 治理模式为 performance,并对关键任务进行 CPU 亲和性和优先级设置。
  3. 创建并配置时间燃烧器 Python 脚本,使用 PID 控制器维持 CPU 温度。
  4. 创建 systemd 服务,确保优化脚本和时间燃烧器在启动时自动运行。
  5. 验证设置,监控 chronyd 和时间燃烧器状态。

结论:

通过 CPU 核心隔离和热稳定技术,作者显著提高了 NTP 服务器的计时精度。虽然这种优化对于大多数应用来说可能过于复杂和耗电,但对于需要高精度计时或进行相关研究的应用来说,这是一个有效的解决方案。

未来改进方向:

  • 自适应 PID 调优
  • 硬件热控制 (例如 PWM 风扇)
  • 使用更高级的频率稳定设备,例如压电陶瓷振荡器 (OCXO)。

这篇文章详细介绍了作者在追求时间精确度方面的努力,并为其他人提供了一个参考,可以用于优化自己的 NTP 服务器。

Fifteen Years

内容摘要 (Summary)

这是一份个人喜爱的网络漫画列表,并包含了一些关于访问xkcd.com网站的幽默性建议。

主要内容:

总结:

这份内容本质上是作者分享自己喜欢的网络漫画,并以幽默的方式调侃了对网站访问的“苛刻”要求,旨在制造一种反差和滑稽的效果。

Cool-retro-term: terminal emulator which mimics look and feel of the old CRTs

cool-retro-term 概要

cool-retro-term 是一个终端模拟器,旨在模仿旧式阴极射线管 (CRT) 屏幕的外观和感觉。 它被设计成具有视觉吸引力、可定制且相对轻量级。

主要特点:

  • 外观: 模拟经典 CRT 屏幕的视觉效果。提供了多种预设方案,例如琥珀色和绿色,也让人联想到 IBM DOS 时代的终端。
  • 技术基础: 基于 qtermwidget 的 QML 端口 (Konsole)。
  • 平台支持: 适用于 Linux 和 macOS。
  • 依赖: 需要 Qt5 (建议使用最新的 LTS 版本)。
  • 可定制性: 可以通过上下文菜单访问颜色、字体和效果等设置。

截图:

提供了几个截图,展示了 cool-retro-term 的不同外观和效果。

安装:

  • AppImage/dmg: 可以直接从 Releases 页面下载最新的 AppImage (Linux) 或 dmg (macOS) 文件。
  • 包管理器: 许多发行版 (例如 Ubuntu、Fedora 和 Arch) 已经将 cool-retro-term 包含在官方软件仓库中,可以通过包管理器安装。

构建:

总而言之,cool-retro-term 是一个专注于复古风格,同时保持可定制和轻量级的终端模拟器。

Unpowered SSDs slowly lose data

固态硬盘 (SSD) 的长期存储可靠性:一份总结

这篇文章探讨了固态硬盘 (SSD) 作为长期存储介质的可靠性问题,并强调了备份的重要性。以下是主要内容总结:

1. SSD 并非永久性存储介质:

  • 尽管固态硬盘已取代机械硬盘成为主要的存储设备,但它们并非理想的长期存储方案。
  • 与机械硬盘使用磁化盘片存储数据不同,SSD 通过改变 NAND 闪存单元中的电荷来存储数据。
  • NAND 闪存即使断电也能保留数据,但数据保留时间有限。
  • 不同类型的 NAND 闪存的保留时间不同:
    • QLC NAND:约 1 年
    • TLC NAND:约 3 年
    • MLC NAND:约 5 年
    • SLC NAND:约 10 年
  • 大多数消费级 SSD 使用 TLC 或 QLC NAND,长时间断电会导致数据丢失或硬盘损坏。

2. 长期存储并非普遍需求:

  • 对于大多数用户,即使用一台或两台电脑,并且硬盘可能几个月不通电的情况,SSD 的数据保留问题并不重要。
  • 数据丢失通常是由于电源浪涌或硬盘故障造成的,而非电压损失。
  • 温度和 NAND 闪存质量会加速电压损失。

3. 备份至关重要:

  • 无论使用何种存储介质,备份都是保护数据的最佳方式。
  • 建议遵循“3-2-1 备份规则”:
    • 3 份数据副本
    • 至少 2 种不同的存储介质
    • 1 份异地存储副本
  • 备份可以应对 SSD 的寿命限制、意外事件(如停电)以及闪存存储的限制。

4. 结论:

  • 对于日常使用中的电脑,SSD 仍然是合适的存储设备。
  • 但对于需要长期存储数据的用户(例如创意专业人员和研究人员),不应将 SSD 作为长期存储的唯一方案。
  • 为了确保数据安全,应选择替代存储介质(如机械硬盘、磁带或 M-Disc)并建立可靠的备份系统。

总而言之,虽然 SSD 在速度和便利性方面具有优势,但其数据保留能力有限,因此不适合长期存储。定期备份数据是确保数据安全的关键。

Show HN: I built an interactive HN Simulator

Okay, I'm ready. Please provide the content you want me to summarize. I will do my best to provide a concise and accurate summary in markdown format and Chinese language, adhering to your specified constraints. Just paste the text here.

PRC elites voice AI-skepticism

Executive Summary: Rapid advancement in artificial intelligence (AI) has become a point of national pride in the People’s Republic of China (PRC), driven in part by a cohort of accelerationist advisors who view technology as a transformative solution to the country’s economic ills. Lauding it as a “new productive force” (新质生产力), these experts view AI […]

DoGE "cut muscle, not fat"; 26K experts rehired after brutal cuts

关于DOGE的终结:政府人才流失将困扰美国

本文报道了美国政府效率部(DOGE)突然被终止的事件及其后续影响。

事件回顾:

  • 在唐纳德·特朗普总统开始使用过去时态提及DOGE后,人事管理办公室(OPM)主任斯科特·库波证实DOGE已于八个月前被终止。
  • DOGE由亿万富翁埃隆·马斯克创立,旨在迅速大幅削减政府机构。
  • DOGE的X账号在报道发布前两天仍在运营。
  • 库波解释说,由于OPM已经承担了DOGE的大部分职能,因此不再需要一个“中央机构”。

DOGE的承诺与现实:

  • DOGE最初被宣传为能为政府节省一万亿美元。
  • 实际情况是,DOGE报告的节省金额为2140亿美元,但批评者认为可能被夸大了近40%。
  • 马斯克曾公开在X上宣称DOGE是“击败官僚主义、官僚统治,恢复人民统治的唯一机会”。

DOGE的负面影响:

  • DOGE的突然终止导致了人才流失。
  • 由于DOGE的运作高度保密,其真正的成本可能需要数月甚至数年才能评估。
  • 布鲁金斯学会的埃莱恩·卡马克研究员指出,DOGE的裁员实际上“切掉了肌肉,而不是脂肪”,因为他们裁掉了许多从事国家安全和公共卫生工作的重要专业人员。
  • 约一半的重聘是由于法院判决,但四分之一的重聘是在法院裁决之前进行的,表明政府承认裁员可能无法完成其重要任务。
  • 许多长期政府雇员选择辞职或退休,而不是等待DOGE裁员。
  • 库波表示,政府招聘冻结已经解除,但许多职位仍然难以填补。

DOGE的遗产:

  • 卡马克认为DOGE本质上是一个灾难,并警告说政府可能难以恢复。
  • 虽然DOGE已不复存在,但削减工作仍在预算管理办公室(OMB)的领导下继续进行。
  • 卡马克预测,在权力的转移或中期选举后,可能开始对DOGE进行调查。
  • 她强调,政府需要证明削减措施的有效性,否则将面临公众的强烈反对。

总而言之,DOGE的突然终结以及随之而来的裁员,给美国政府造成了巨大损失,导致人才流失和关键服务中断。虽然削减工作仍在继续,但DOGE的遗产将是长期的挑战,政府需要证明其削减措施的有效性,以避免进一步的负面影响。