2026-05-16

24 篇热帖

I believe there are entire companies right now under AI psychosis

总结:关于x.com的隐私扩展问题

主要内容:

该信息提示用户在使用x.com(原Twitter)时可能遇到问题,并提供了解决建议。

关键点:

  • 问题: 用户在使用x.com时可能遇到问题。
  • 原因: 某些与隐私相关的浏览器扩展程序可能导致这些问题。
  • 解决方案: 建议用户禁用这些隐私扩展程序,然后再次尝试。

总结:

总而言之,如果在使用x.com时遇到问题,请尝试禁用浏览器中的隐私扩展程序,这可能有助于解决问题。

Project Gutenberg – keeps getting better

项目古腾堡简介:超过 75,000 本免费电子书的数字图书馆

项目古腾堡是一个拥有超过 75,000 本免费电子书的数字图书馆。用户可以选择免费的 epub 和 Kindle 电子书,在线阅读或下载。该项目主要收录美国版权已过期的经典文学作品,汇集了世界文学的精华。

主要特点:

  • 完全免费: 无需任何费用和注册,完全免费使用。
  • 无需应用程序: 仅需普通的网页浏览器或电子书阅读器即可访问。
  • 历史悠久: 项目自 1971 年以来一直致力于提供免费电子书,拥有超过 50 年的历史。
  • 志愿者驱动: 数百名志愿者持续贡献力量,进行电子书的数字化和校对工作。
  • 已故首席执行官: 项目曾有一位杰出的首席执行官,格雷戈里·纽比博士 (Dr. Greg Newby)。
  • 欢迎捐赠: 鼓励用户捐赠以支持更多书籍的数字化工作。

查找免费电子书的方式:

  • 最受欢迎: 浏览最受欢迎的 100 本电子书,或根据下载量进行排名。
  • 主要类别: 提供类似大型书店的各类图书分类。
  • 精选书单: 志愿者精心策划的阅读书单。
  • 搜索选项: 可以通过作者、标题、主题、语言、类型、受欢迎程度等多种条件进行搜索。
  • Self.gutenberg.org: 访问 self.gutenberg.org,获取世界图书馆基金会提供的自助出版电子书。

如何参与:

  • 分布式校对员 (Distributed Proofreaders): 招募新志愿者参与电子书的数字化工作。 每天校对一页即可贡献力量。
  • 修复和改进: 报告错误、错误、错别字,并提出修改建议,帮助改进项目古腾堡。
  • 录制有声读物: 与 LibriVox 合作,录制有声读物。

其他资源:

  • 关于项目古腾堡: 了解项目背景信息。
  • 捐赠: 支持项目古腾堡。
  • 新电子书订阅源 (Feeds): 获取新电子书的更新通知。
  • 链接政策: 了解链接到项目古腾堡网站的政策。
  • 机器人访问政策: 了解爬取和抓取网站的政策。
  • 合作伙伴和附属机构: 查看项目古腾堡的合作伙伴和附属机构。
  • 版权和许可信息: 查阅版权、许可和商标信息。
  • “免费电子书”的含义: 了解“免费电子书”的含义(无成本或自由)。

获取帮助:

  • 阅读选项和 Kindle: 了解如何阅读和享受电子书。
  • 常见问题解答: 浏览关于项目古腾堡的常见问题解答。
  • 帮助、指南和常见问题解答: 查找关于各种主题的深入信息。
U.S. DOJ demands Apple and Google unmask over 100k users of car-tinkering app

EZ Lynk Auto Agent 应用数据调查:美国司法部寻求数万用户数据

美国司法部(DOJ)正在调查 EZ Lynk 公司开发的 Auto Agent 应用,并向苹果、谷歌、亚马逊和沃尔玛等公司发出传票,要求提供数万(可能超过十万)下载了该应用的用户信息,以支持其对 EZ Lynk 公司违反《清洁空气法案》的指控。

案件背景

DOJ 自 2021 年起起诉 EZ Lynk,指控该公司通过销售“欺骗装置”违反了《清洁空气法案》。这些装置,通常与 EZ Lynk Auto Agent 应用和车载 OBD 硬件连接使用,据称允许用户绕过柴油车辆的工厂排放控制系统。 EZ Lynk 坚称其产品的主要目的是车辆性能监控、软件更新以及合法的改装和诊断,而非规避排放控制,用户的使用行为由用户自行负责。

传票范围

传票要求苹果和谷歌提供下载和账户数据,亚马逊和沃尔玛提供购买 EZ Lynk 硬件的用户信息。政府表示,需要这些信息来识别并采访证人,了解这些工具的实际使用情况。 已经收集到论坛帖子和社交媒体证据,显示部分用户确实利用该系统禁用排放控制。

隐私担忧与反弹

EZ Lynk 的律师认为传票的范围“过度”,远超案件所需的范围,并引发了第四修正案问题。 隐私倡导团体,如电子前沿基金会(EFF)和电子隐私信息中心(EPIC)也对政府要求提供个人身份信息的范围表示担忧,认为大多数用户可能并未阅读使用条款,可能因下载用于车辆诊断和调校的工具而面临意外的法律风险。 汽车爱好者和“修车权”倡导者认为此案反映了政府环境法规与车主改装车辆需求的矛盾。

后续发展

EZ Lynk 曾试图援引第 230 条免疫条款(通常用于保护科技平台免受用户行为的责任),但法院已于 2025 年驳回了该辩护。 此次事件凸显了政府对应用商店数据的兴趣日益增长,用于执行法规。 类似的请求此前也曾出现,例如 2019 年对枪支瞄准镜应用用户数据的要求,但规模远小于本次调查。

苹果、谷歌及其他公司尚未公开评论。 DOJ 也未就传票挑战的结果做出进一步说明。 此次传票挑战的结果可能为监管执法案件中的数字隐私设定重要先例。 对于使用调校工具的车主来说,这意味着政府越来越愿意追溯应用下载到个人用户。

关键要点总结:

  • 美国司法部正在调查 EZ Lynk 的 Auto Agent 应用,指控其违反《清洁空气法案》。
  • DOJ 向苹果、谷歌、亚马逊和沃尔玛发出传票,要求提供数万用户数据。
  • EZ Lynk 否认指控,认为其产品用于车辆监控和诊断,用户使用方式由用户负责。
  • 隐私倡导团体和律师认为传票范围过宽,引发了隐私担忧。
  • 案件可能对数字隐私和监管执法产生重要影响。
California bill would require patches or refunds when online games shut down

加州游戏保护法案进展:游戏开发者与行业协会的观点

以下是对文章内容的总结:

加州正在审议一项名为“保护我们的游戏法案”(Protect Our Games Act)的法案,旨在规范游戏开发商终止在线游戏服务(live service games)的行为。该法案旨在确保消费者在支付后能够持续访问游戏,避免游戏突然下线的情况。

支持方的观点:

  • SKG(具体名称未明确)在致加州立法机构的公开信中表示,目前没有其他媒介能够像游戏一样,在消费者购买后突然下线。
  • SKG认为,随着在线游戏服务的日益普及,明确的游戏终止流程对于保障消费者持续访问他们付费享受的游戏至关重要。

反对方的观点:

  • 娱乐软件协会(Entertainment Software Association, ESA),代表主要的电子游戏出版商,公开反对该法案,认为其歪曲了现代游戏分发模式。
  • ESA指出,消费者获得的是游戏的使用许可,而不是不受限制的所有权。
  • 由于维护在线基础设施需要持续投入,游戏终止是现代软件的“自然特征”。
  • ESA还认为,该法案会对游戏出版商施加不合理的期望,例如,需要无限期地保留音乐或知识产权的许可,这在法律和技术上都可能不可行。

立法进程:

  • 该法案已获得加州众议院隐私与消费者保护委员会和司法委员会的积极投票。
  • 然而,该法案仍需在加州众议院和参议院获得多数通过,然后才能提交给加州州长Gavin Newsom签署。

其他信息:

  • 加州目前的立法进展对“停止杀游戏”(Stop Killing Games)运动来说是个好消息。 英国的类似运动在上次议会辩论后进展停滞。

Bun Rust rewrite: "codebase fails basic miri checks, allows for UB in safe rust"

代码错误分析与总结 (Code Error Analysis and Summary)

这段代码和错误信息展示了一个Rust程序中发生的未定义行为 (Undefined Behavior)。以下是分析和总结:

问题描述 (Problem Description):

程序在尝试从原始指针 (raw pointer) 创建一个切片 (slice) 时,遇到了未定义行为。具体的错误信息是 "constructing invalid value of type &[u8]: encountered a dangling reference"。

代码及错误位置 (Code and Error Location):

  • 错误发生行: src/main.rs:97
  • 相关代码: unsafe { core::slice::from_raw_parts(ptr as *const u8, self.len()) } 这行代码尝试将一个原始指针转换为一个字节切片。
  • 代码片段:
    fn main() {
        let test = Box::new(*b"Hello World");
        let init = PathString::init(&*test);
        drop(test);
    
        println!("{:?}", init.slice());
    }
    

错误原因 (Error Cause):

错误的关键在于 test 的生命周期。test 是一个 Box,它在堆上分配了内存,并持有字符串 "Hello World" 的拷贝。 drop(test)init 变量被创建后立即释放了 test 占用的内存。 PathString::init(&*test) 创建 PathString 结构体,其中可能存储了 test 指向的内存的地址。 当 testdrop 掉后,该内存不再有效,init.slice() 尝试访问已经被释放的内存,导致悬空引用 (dangling reference),从而引发未定义行为。

核心问题 (Core Issue):

  • 悬空引用 (Dangling Reference): init 可能持有对 test 释放后内存的引用。
  • 生命周期管理 (Lifetime Management): 代码没有正确管理 testinit 的生命周期,导致 init 访问了已经失效的内存。
  • unsafe 代码的风险 (Risk of unsafe code): from_raw_parts 是一个 unsafe 函数,它要求程序员保证指针的有效性。如果指针无效,则会导致未定义行为。

错误栈信息 (Stack Backtrace):

  • PathString::slice (src/main.rs:97:18 - 97:75): 错误发生在 PathStringslice 方法内部,尝试从原始指针创建切片。
  • main (src/main.rs:130:22 - 130:34): 调用 init.slice() 发生在 main 函数中。

总结 (Summary):

该程序由于生命周期管理不当,导致在 test 变量被释放后,仍然尝试访问其内存,从而引发了悬空引用和未定义行为。 PathString::init 函数可能没有正确管理 test 指向的内存的生命周期,导致在 init.slice() 调用时,指针已失效。 Rust 的 unsafe 代码需要格外小心,确保指针始终有效。

建议 (Recommendations):

  • 重新设计生命周期 (Redesign Lifetimes): 确保 init 变量的生命周期至少与 test 变量的生命周期一样长。
  • 避免悬空引用 (Avoid Dangling References):drop(test) 之前,不要使用 init 变量或其任何依赖于 test 的数据。
  • 审查 PathString::init 的实现 (Review Implementation of PathString::init): 检查 PathString::init 函数的实现,确保它正确处理了内存管理,避免创建悬空引用。 考虑使用 Rust 的所有权和借用机制来安全地管理内存。
  • 避免 unsafe 代码 (Avoid unsafe code): 尽可能避免使用 unsafe 代码,并确保在必须使用时,代码的正确性得到充分验证。

总而言之,这是一个典型的 Rust 生命周期问题,需要仔细分析代码,确保内存安全。

ABC News has taken all FiveThirtyEight articles offline

总结:关于x.com的隐私扩展问题

主要内容:

该信息提示用户在使用x.com(原Twitter)时可能遇到问题,并提供了解决建议。

关键点:

  • 问题: 用户在使用x.com时可能遇到问题。
  • 原因: 某些与隐私相关的浏览器扩展程序可能导致这些问题。
  • 解决方案: 建议用户禁用这些隐私扩展程序,然后再次尝试。

总结:

总而言之,如果在使用x.com时遇到问题,请尝试禁用浏览器中的隐私扩展程序,这可能有助于解决问题。

SQL patterns I use to catch transaction fraud

欺诈检测中的 SQL 模式总结 (SQL Patterns for Fraud Detection)

本文档描述了在交易数据中检测欺诈行为的常用方法,主要依赖 SQL 查询,而非机器学习或其他更高级的技术。这些模式适用于各种场景,例如信用卡、医疗保健索赔、电子商务和销售点交易,只要有交易记录即可。

核心观点:

  • SQL 是关键: 欺诈检测主要依赖 SQL 查询,通过对交易表进行连接和分析来发现异常模式。
  • 迭代构建: 建议按照顺序逐步构建欺诈检测规则,从最简单的模式开始。
  • 组合模式: 单一模式往往不足以准确识别欺诈,需要将多个模式组合使用,并根据信号进行评分。
  • 窗口函数的重要性: 窗口函数是构建复杂欺诈检测规则的基础,能够极大地提高分析效率。

六种常见欺诈检测模式:

  1. 速度 (Velocity): 检测短时间内交易数量异常高的用户,例如被盗卡快速清空的场景。

    • 查询示例: 统计每小时内每位用户交易数量,并筛选出交易数量超过阈值的用户。
    • 调整: 调整时间窗口大小和交易数量阈值。
    • 滑动窗口: 使用 QUALIFY 语句(或等效的 CTE 结构)实现滑动窗口,检测 5 分钟内交易次数是否超过 5 次。
  2. 不可能的旅行 (Impossible Travel): 检测在短时间内出现在两个相距遥远地点的交易,通常是卡片被克隆的迹象。

    • 查询示例: 通过 LAG 函数获取前一次交易的时间和地点,计算两次交易之间的时间差和距离,并筛选出时间短、距离远的交易。
    • 阈值: 使用速度阈值(例如,超过 600 英里/小时)来判断是否为不可能的旅行。
    • 扩展: 可以扩展为检测同一州内不同城市、同一区域内不同邮编以及跨境交易。
  3. 金额异常 (Amount Anomalies): 检测特定金额的交易,这些金额在正常交易中很少出现,但欺诈交易中却经常出现。

    • 查询示例: 筛选出金额为 $1.00、 $5.00、 $10.00、 $99.99、 $499.99 等特殊金额的交易。
    • 原因: 这些金额通常与卡片测试、规避限额等欺诈行为有关。
  4. 可疑商户 (Suspicious Merchants): 检测在短时间内,大量不相关的用户在同一商户进行异常交易,可能是商户的 POS 机被恶意安装了读卡器。

    • 查询示例: 统计每个商户每小时内唯一用户数量和总交易金额,并筛选出用户数量和交易金额超过阈值的商户。
    • 基线比较: 将商户的当前交易数据与历史数据进行比较,检测交易量是否异常飙升。
    • 时间窗口: 使用一周的滚动平均值来建立商户的交易基线。
  5. 非正常时间 (Off-Hours): 检测在用户通常不进行交易的时间段发生的交易,可能表明卡片被盗用。

    • 查询示例: 分析每个用户的历史交易时间,确定其通常的交易时间段,然后筛选出在非正常时间段发生的交易。
    • 历史数据: 需要至少 90 天的历史数据来建立用户的正常交易模式。
  6. 链式信号的窗口函数 (Chained Signals with Window Functions): 使用窗口函数创建包含额外信息的交易视图,方便构建更复杂的欺诈检测规则。

    • 查询示例: 计算两次交易之间的时间差、商户是否发生变化、过去 24 小时内的总金额以及每日交易的数量。
    • 规则表达: 将复杂的欺诈检测规则简化为 SQL 筛选表达式。

总结与建议:

  • 组合使用: 将以上所有模式组合使用,并根据信号进行评分,以提高欺诈检测的准确性。
  • 从简单开始: 从速度模式开始,逐步构建更复杂的规则。
  • 窗口函数: 投资于窗口函数,可以极大地提高分析效率
The Zulip Foundation

总结:Zulip 开源项目重大变革

本文宣布了 Zulip 开源项目和 Kandra Labs 公司的一次重大转型:Zulip 创始人 Tim Abbott 将加入 Anthropic 公司,并捐赠 Kandra Labs 公司成立独立的非营利 Zulip 基金会。

主要变化:

  • 所有权和治理结构变更: Zulip 项目将由 Zulip 基金会正式管理,致力于开发最佳团队聊天体验,尤其关注公共利益组织和社区。Kandra Labs 将完全由 Zulip 基金会拥有,继续提供 Zulip 的托管、支持和改进服务,以满足商业客户的需求。
  • 领导层变动: Tim Abbott、Alya Abbott、Greg Price 和 Alex Vandiver 将加入 Anthropic 公司。Kim Vandiver 已加入 Kandra Labs 担任临时总裁,以确保平稳过渡。
  • 基金会董事会: 基金会董事会成员包括 Tim Abbott、Greg Price、Alya Abbott 和 Rust 语言社区的 Josh Triplett。
  • 顾问委员会: 基金会拥有由 Andrew Sutherland、Hazel Weakly、Jeremy Avigad、Nick Bergson-Shilcock 和 Puneeth Chaganti 等专家组成的顾问委员会。
  • 价值观承诺与资金来源: 基金会的成立旨在正式承诺 Zulip 的价值观,并为项目提供可持续的资金来源,包括申请赠款和接受税收减免捐款。
  • 稳定性和持续发展: Zulip 的运营将继续正常进行,包括 Zulip Cloud、移动推送通知服务和支持合同。团队将继续致力于消除错误并改进工作流程。
  • Tim Abbott 的离职原因: Tim Abbott 选择加入 Anthropic,致力于负责任地发展人工智能,并认为这比继续担任 Zulip 首席执行官更能为公共利益做出贡献。

未来展望:

  • Zulip 基金会正在招聘新的董事会成员和顾问委员会成员。
  • 团队将继续招聘新员工以填补空缺职位。
  • 社区将有机会在 Zulip 开发者社区进行问答活动。

总而言之,这次变革旨在确保 Zulip 项目的长期稳定性和独立性,并为未来的发展奠定坚实的基础。

'No way to prevent this,' says only package manager where this regularly happens

JavaScript 生态系统遭遇严重供应链攻击:社区哀叹“无法避免”

摘要:

近期,npm 注册中心遭受了一场毁灭性的供应链攻击,导致数百万企业应用程序受损,数十亿用户记录暴露。JavaScript 生态系统的开发者普遍表示悲痛,并认为这场危机是完全无法预见的,是构建现代 Web 应用的“代价”。

主要要点:

  • 攻击事件: 一名黑客利用一个长期废弃的 npm 包,向全球生产构建注入了加密货币挖矿程序,造成了大规模的远程代码执行攻击。
  • 开发者反应: 开发者普遍认为,这种攻击是不可避免的,并将其视为现代 Web 应用开发中固有的风险,类似于“自然现象”。他们表示无法预见并阻止此类事件的发生。
  • 其他生态系统的对比: 与 JavaScript 生态系统不同,Go、Rust 以及使用原生 Web API 的生态系统,由于依赖第三方代码较少且拥有严格的加密验证机制,并未受到类似攻击的影响。
  • npm 官方回应: npm 官方发言人表示,他们无法通过任何注册策略或构建沙箱来阻止此类攻击,并表达了对受害者的慰问。他们承认 npm 注册中心默认允许执行任意安装脚本,并强调社区需要保持“韧性”,等待下一次不可避免的 breach。
  • 核心问题: 攻击暴露了 JavaScript 生态系统对深度嵌套、未经审查的第三方软件包的过度依赖,以及 npm 注册中心在安全措施方面的不足。

关键词: npm, 供应链攻击, JavaScript, 安全漏洞, 远程代码执行, 加密货币挖矿, 第三方软件包。

Frontier AI has broken the open CTF format

CTF 现状:人工智能的冲击与未来展望 (CTF Current Situation: The Impact of Artificial Intelligence and Future Prospects)

本文作者,一位经验丰富的 CTF 选手,分享了其对当前 CTF 竞争环境的观察和担忧。核心观点是,人工智能的快速发展,特别是 GPT-5.5 等大型语言模型的出现,已经严重改变了 CTF 的本质,使其失去了原有的意义和价值。

作者背景与CTF经验:

作者自 2021 年开始参与 CTF 竞赛,并在多个大型赛事中取得优异成绩,包括 HCKSYD、DownUnderCTF 和国际顶尖团队 TheHackersCrew。CTF 对其来说,是学习安全知识、自我提升和结识行业精英的重要途径。

人工智能的冲击:

  • 早期影响: GPT-4 出现后,许多中等难度的 CTF 挑战开始可以被 AI 一键解决,导致竞赛优势降低。
  • Claude Opus 4.5 的突破: Claude Opus 4.5 的出现,使得 AI 能够解决几乎所有中等难度的挑战,甚至一些困难的挑战。通过 CLI 工具和 API 接口的整合,可以轻松构建自动化系统,在短时间内完成大量挑战。
  • GPT-5.5 的终结: GPT-5.5 和 GPT-5.5 Pro 的发布,进一步加速了这一趋势。这些模型甚至可以解决 HackTheBox 上的 "Insane" 难度堆栈溢出挑战,使得 CTF 竞争变成“谁能负担更多计算资源”的竞赛。
  • 专业安全模型贬值: 通用的大型语言模型 (LLM) 的能力超越了专门的安全模型,使得后者价值降低。

CTF 竞争的失衡:

  • 排行榜失真: CTFTime 排行榜不再反映人类的技能水平,而是 AI 编排能力的体现。
  • 玩家活动减少: 顶尖团队的参与度降低,整体玩家活跃度下降。
  • 挑战设计动力减弱: 挑战开发者失去设计复杂、精美的挑战的动力,转而选择更易于教学的平台。
  • 新手困境: 初学者在 AI 主导的排行榜中难以看到进步,容易被 AI 取代,影响学习积极性。

CTF 并非安全研究:

作者强调,CTF 的目的并非安全研究,而是通过竞赛激发学习兴趣和提升技能。AI 在 CTF 中的应用,虽然可以提高效率,但剥夺了人类解决问题的乐趣和挑战。

对 "适应" 的质疑:

作者认为,仅仅要求适应 AI 的现状是不够的,因为这会导致 CTF 丧失原有的价值,并阻碍新手学习和成长。

现状总结:

CTF 社区正在逐渐空虚,排行榜不再具有意义,许多经验丰富的选手也失去了参与的兴趣。

未来展望:

作者呼吁 CTF 社区保持团结,并积极探索新的学习和交流方式,例如安全相关的社交活动、学习平台和社区论坛。虽然传统的 CTF 形式可能已经过时,但 CTF 社区的价值和精神仍然值得传承。 重要的是,要寻找新的方式来保持学习的热情和竞争的动力。

Palantir has hired more than 30 senior UK Government officials

Palantir 与英国政府官员的“旋转门”调查报告摘要

根据The Nerve的调查,美国科技监控公司Palantir自2012年以来,已招聘了32名高级英国政府和公共部门官员。这些官员来自英国国民医疗服务体系 (NHS)、国防部 (MoD)、卫生和社会护理部、内政部、外交部、英国安全局、政府采购服务机构、秘密情报局以及唐宁街。

主要内容:

  • 广泛招聘: Palantir在英国政府内部拥有广泛的招聘网络,涉及多个重要部门。
  • 争议合同: 该公司正因其不断增长的英国政府合同而受到审查,这些合同包括NHS、国防部、金融行为监管局以及11个警察部队。
  • 服务用途: Palantir的服务曾被美国移民和海关执法局 (ICE) 用于追踪、识别和定位移民。
  • **国际争议:**该公司还被指控向以色列国防军出售服务,并被联合国人权特别报告员弗朗切斯卡·阿尔巴内西指责“从加沙的种族灭绝中获利”。
  • 腐败风险: 尽管目前没有证据表明存在不当行为,但透明度专家警告称,这种大规模招聘行为给英国带来了“严重的腐败风险”。
  • 关键职位: 被Palantir招聘的官员包括国防部的AI高级官员(曾共同撰写英国的AI军事战略)以及NHS英格兰的前AI总监。
  • 顾问团队: 四名上议院议员为Palantir提供咨询,Palantir的付费顾问名单还包括两名将军和一位前首相顾问。

Palantir的回应:

Palantir否认了所谓的“旋转门”策略,并声称报告中包含的32名官员是在15年内招聘的,其中14人已不再为该公司工作,其中一些已经离开超过五年。该公司还强调,六名是退役军人,他们的公共部门经验是为国家服务和保护国家,并认为将退役军人纳入此类报告是不恰当的。

专家观点:

透明国际英国研究主管Steve Goodrich表示,政府与私营部门之间的“旋转门”缺乏有效控制,导致前官员利用其掌握的特权信息和联系,为新雇主谋取利益的风险。Spotlight on Corruption执行主任Susan Hawley补充说,公司确实会这样做,以获取政府运作的特权信息并从中获得商业优势。

Waymo updates 3,800 robotaxis after they 'drive into standing water'

Waymo 召回近4000辆自动驾驶汽车以修复软件问题

以下是关于Waymo召回自动驾驶汽车的总结:

主要问题: Waymo 因软件问题自愿召回约 3800 辆在美国运营的自动驾驶出租车。该问题可能导致车辆驶入洪水中,造成安全隐患。

召回范围: 此次召回针对使用 Waymo 第五代和第六代自动驾驶系统 (ADS) 的车辆。

事件背景: 近期,Waymo 车辆在德克萨斯州奥斯汀被摄像头记录到驶入洪水的街道并停止运行,需要其他驾驶员绕行。类似事件在其他地点也发生过。此前,Waymo 车辆还因未让行校车和在旧金山大规模停电期间在交通中停止运行而受到批评。

Waymo的回应: Waymo 承认在高速道路上处理无法通过的洪水中存在改进空间,并选择了向美国国家公路交通安全管理局 (NHTSA) 提交自愿软件召回。该公司表示,正开发额外的软件安全措施,并在恶劣天气期间限制车辆的运行区域,以避免可能发生闪洪的区域。

运营情况: Waymo 目前在美国 11 个市场运营商业自动驾驶出租车服务,在包括旧金山、洛杉矶、凤凰城、奥斯汀和迈阿密等城市提供广泛的公共访问。

圣安东尼奥服务暂停: Waymo 透露,其在德克萨斯州圣安东尼奥的自动驾驶出租车服务目前已暂停。 4 月 20 日,一辆 Waymo 自动驾驶汽车在圣安东尼奥驶入洪水,被卷入溪流,当时车内没有乘客,引发了 NHTSA 的调查,并导致了此次自愿召回。 Waymo 表示正在准备恢复在圣安东尼奥的公共乘车服务。

其他信息:

  • Waymo 每周在美国提供超过 50 万次行程,在一些最具挑战性的驾驶环境中运行。
  • Waymo 最近发布了其新的自动驾驶系统,该系统集成在中国制造的车辆中。

总而言之,此次召回是为了解决 Waymo 自动驾驶汽车在洪水中行驶的安全问题,并反映了该公司致力于提高自动驾驶技术的安全性的努力。

Meta to receive $3.3B in tax breaks for its $10B Louisiana data center

人工智能数据中心建设与税收优惠:机遇与争议 (AI Data Centers and Tax Incentives: Opportunities and Controversies)

本文探讨了美国人工智能(AI)基础设施建设中数据中心快速扩张带来的机遇与挑战,尤其关注各州政府为吸引数据中心而提供的巨额税收优惠政策。

主要内容:

  • 数据中心激增与投资: 为了支持AI发展,美国各地的农村和郊区城镇都在迅速涌现新的数据中心。预计今年对AI基础设施的投资将达到近7000亿美元。这些数据中心规模庞大,有的甚至超过纽约中央公园的两倍。
  • 州政府的税收优惠: 至少36个州为吸引数据中心建设提供税收优惠,导致政府税收损失高达数亿美元。例如,弗吉尼亚州每年为数据中心开发商提供19亿美元的税收减免,佐治亚州为26亿美元,德克萨斯州则从2024年的1.5亿美元激增至超过10亿美元。
  • 路易斯安那州的“Hyperion”项目: Meta公司在路易斯安那州Richland Parish建设的Hyperion数据中心是税收优惠政策的典型案例。Meta公司将获得高达33亿美元的税收减免,这笔资金足以支付该州警察部门七年多的预算。
  • 对税收优惠政策的质疑: 政策分析师Kasia Tarczynska认为,这些税收优惠是对一个快速增长且不需要公共投资支持的行业的“浪费补贴”。她指出,实际补贴金额可能远超官方估计。
  • 数据中心建设的潜在益处: 各州政府认为,数据中心建设能带来更多就业机会和地方投资。Meta公司表示,Hyperion项目在建设高峰期将雇佣5000多名熟练工匠,建成后将提供500多个运营岗位,并承诺投资学校、非营利组织以及改善当地基础设施,包括道路和污水处理系统。
  • 政策调整与反弹: 随着对数据中心影响的担忧日益增加,至少28个州正在考虑修改现有的税收优惠政策,以控制能源需求或调整激励成本。弗吉尼亚州等9个州甚至考虑完全取消数据中心税收优惠。
  • 公众反感与阻力: 2025年,当地居民的反对阻止了价值1560亿美元的48个数据中心项目建设。盖洛普民意调查显示,超过七成的美国人反对在其居住地附近建设数据中心。
  • 数据透明度不足: 许多州的数据补贴信息不透明,只有11个州公开披露哪些公司获得了税收减免。

总结:

人工智能基础设施的建设推动了数据中心的大规模扩张,各州政府通过提供巨额税收优惠来吸引数据中心投资。虽然数据中心建设能带来就业机会和经济效益,但高额的税收减免和对当地环境的影响引发了公众的担忧和质疑,促使各州政府重新评估相关政策。

The main thing about P2P meth is that there's so much of it (2021)

关于冰毒(甲基苯丙胺)的转变:从右旋冰毒到P2P合成,以及日益严峻的危机 (关于甲基苯丙胺的转变:从右旋冰毒到P2P合成,以及日益严峻的危机)

本文总结了Sam Quinones在Econtalk和《大西洋月刊》中关于甲基苯丙胺和无家可归现象的讨论,以及相关研究,探讨了甲基苯丙胺合成方式的转变及其对社会的影响。

合成方式的转变:从右旋冰毒到P2P

  • 早期冰毒 (右旋冰毒): 早期冰毒主要由伪麻黄碱或麻黄碱合成,使用者相对容易控制,能维持正常生活。
  • P2P合成的兴起: 2006年美国禁止非处方药销售伪麻黄碱,2008年墨西哥也几乎禁止了伪麻黄碱的销售。为了应对这一情况,制毒者转向使用苯乙酮(Phenylacetone,简称P2P)进行合成,P2P可以由多种常见化学品制成。
  • 合成方法的演变: 自2009年起,甲基苯丙胺的合成逐渐转向P2P。DEA (美国毒品执法局) 的数据表明,P2P合成迅速取代了基于伪麻黄碱的合成。

冰毒的化学差异:异构体与杂质

  • 异构体 (L-meth vs. D-meth):
    • 甲基苯丙胺存在两种异构体:右旋甲基苯丙胺 (D-meth) 和左旋甲基苯丙胺 (L-meth)。D-meth能提高大脑多巴胺水平,产生欣快感,是药物效果的主要来源;L-meth对多巴胺没有影响,几乎没有活性。
    • P2P合成的冰毒最初会产生等量的D-meth和L-meth,而基于伪麻黄碱的合成只产生D-meth。
    • 截至2019年,P2P合成的冰毒中L-meth的比例已经大幅降低。
    • L-meth存在于一些常见的药物中,如维克咳嗽气雾剂和帕金森病/抑郁症药物西列吉兰。
  • 杂质: P2P合成的冰毒纯度比以往更高,平均达到95%的D-meth。合成P2P的路线和方法不断变化,DEA认为大部分杂质来自P2P的生产过程。

冰毒的供应量和使用量

  • 边境查获量激增: 边境查获的冰毒量大幅增加,表明供应量显著提高。
  • 污水检测显示使用量翻倍: 西雅图的污水检测数据显示,2017年冰毒代谢物的浓度翻倍,此后保持相对稳定。
  • 使用人数增加,重度使用者激增: 甲基苯丙胺的使用人数增加,但更显著的是重度使用者的数量三倍增加。
  • 价格下降: 冰毒的价格持续下降,反映出供应量的增加。
  • 过量死亡人数激增: 甲基苯丙胺过量死亡人数大幅增加,并且仍在持续上升。

总结

文章认为,L-meth和杂质不太可能是导致精神问题的直接原因,而是P2P合成带来的冰毒供应量的增加才是导致问题的关键因素。冰毒供应量的增加以及重度使用者的增加,导致了日益严峻的社会危机。

关键信息摘要:

  • 甲基苯丙胺合成方式从基于伪麻黄碱的合成转变为基于P2P的合成。
  • P2P合成冰毒最初含有等量的D-meth和L-meth,但现在D-meth的比例已大幅提高。
  • 冰毒的纯度比以往更高。
  • 冰毒的供应量和使用量都在显著增加,导致过量死亡人数激增。
How to Write to SSDs [pdf]

如何写入固态硬盘 (How to Write to SSDs) - 摘要

本文由Bohyun Lee、Tobias Ziegler和Viktor Leis撰写,探讨了如何优化数据库系统以充分利用固态硬盘 (SSD) 的性能并延长其使用寿命。研究表明,采用“异地写入”(out-of-place writes) 至关重要。

主要发现与优化:

  • 异地写入的重要性: 传统的“就地写入”(in-place writes) 并不能充分利用SSD的特性,导致写入放大 (write amplification) 和SSD寿命缩短。异地写入提供了更大的灵活性,允许数据库系统更智能地安排写入操作。
  • 写入放大 (WA) 的来源: 研究发现数据库系统和SSD自身都会导致写入放大。数据库系统通常会进行双写缓冲 (doublewrite buffering),而SSD内部的垃圾回收 (garbage collection) 也会增加写入次数。
  • 提出的优化措施:
    • 压缩与页面打包 (Compression & Page Packing): 通过压缩页面并进行打包,减少写入的数据量,提高读取效率。
    • 基于失效时间的分组 (Grouping by Deathtime): 根据页面失效时间对页面进行分组,优化垃圾回收过程,减少写入放大。
    • ZNS支持: 优化设计可以无缝支持Zoned Namespace (ZNS) 接口,充分利用ZNS的特性。
    • 对齐数据库和SSD GC单元: 将数据库垃圾回收单元与SSD内部GC单元对齐,减少SSD写入放大。
    • NoWA模式: 针对普通SSD,引入NoWA模式,保证SSD写入放大的系数为1。
    • 使用FDP放置提示: 对于支持灵活数据放置 (FDP) 的SSD,可以使用放置提示来进一步优化写入。
  • 实验结果:
    • 通过应用所有优化措施,在YCSB-A基准测试中,吞吐量提高了1.65-2.24倍,每操作的闪存写入次数减少了6.2-9.8倍。
    • 在TPC-C基准测试中,吞吐量提高了2.45倍,闪存写入次数减少了7.2倍。

结论:

本文提出了一系列异地写入优化措施,通过协同优化数据库系统和SSD,显著降低了写入放大,提高了性能和延长了SSD的使用寿命。这些优化措施不仅适用于现有的固态硬盘,还能无缝支持未来的SSD接口,例如ZNS和FDP。

代码与数据:

代码、数据和其他相关资源已发布在GitHub上:https://github.com/LeeBohyun/ZLeanStore

Orthrus-Qwen3: up to 7.8×tokens/forward on Qwen3, identical output distribution

Orthrus:基于双视图扩散的内存高效并行token生成

Orthrus 是一个双架构框架,它统一了大型语言模型 (LLM) 的精确生成保真度和扩散模型的快速并行token生成,官方实现了该框架及其模型checkpoint。

模型架构:

Orthrus 采用双架构,通过结合自回归和扩散视图实现并行token生成。它利用精确的跨模型共识机制,保证输出与原始基础模型的预测分布完全一致。

模型Zoo:

  • 所有模型均基于 Qwen3 backbone,保证严格无损生成
  • 提供以下模型:
    • Orthrus-Qwen3-1.7B:加速比 4.25×
    • Orthrus-Qwen3-4B:加速比 5.20×
    • Orthrus-Qwen3-8B:加速比 5.36×
  • 模型可以在 HuggingFace 上找到:🤗 HuggingFace

安装:

  1. uv pip install -e .
  2. uv pip install ninja packaging
  3. uv pip install flash-attn --no-build-isolation (或 pip install "flash-attn-4[cu13]" 如果您的设备支持)

建议使用 uv 进行快速依赖解析。

快速开始:

  • ⚡ 立即尝试: 在 Colab 中直接运行 Orthrus:Open In Colab
  • 示例代码:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer

model = AutoModelForCausalLM.from_pretrained(
    "chiennv/Orthrus-Qwen3-8B",
    dtype=torch.bfloat16, device_map="cuda",
    attn_implementation="flash_attention_2",  # options: sdpa | eager | flash_attention_4
    trust_remote_code=True,
).eval()
tokenizer = AutoTokenizer.from_pretrained("chiennv/Orthrus-Qwen3-8B")

prompt = "Write a program to count the frequency of each word in a paragraph."
messages = [{"role": "system", "content": ""}, {"role": "user", "content": prompt}]
input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True, enable_thinking=False).input_ids

output_ids = model.generate(
    input_ids=input_ids.to(model.device),
    max_new_tokens=2048,
    use_diffusion_mode=True,
    streamer=TextStreamer(tokenizer, skip_prompt=True) # enable streaming generation
)

即将推出: 原生集成 vLLM 和 SGLang。

关键优势:

  • 显著的推理加速: 打破了标准自回归解码的顺序瓶颈,在生成任务中实现高达 7.8 倍的加速。
  • 严格无损生成: 采用精确的跨模型共识机制,保证输出与原始基础模型的预测分布完全一致。
  • 零冗余内存开销: 自回归和扩散视图共享相同的 Key-Value (KV) 缓存,内存开销仅为 O(1)。
  • 参数高效: 通过仅微调总参数的 16% 并保持基础 LLM 严格冻结,注入并行生成能力。

性能对比:

  • Orthrus 优于 EAGLE-3 和 DFlash 等推测解码方法。
  • 与扩散语言模型相比,Orthrus 解决了并行生成与顺序约束之间的矛盾,实现了并行生成保真度的新状态。
  • 在 MATH-500 数据集上,Orthrus 在保证完全无损性能的情况下实现了约 6 倍的加速。

引用:

如果您在工作中发现此模型或架构有用,请引用以下论文:

@misc{vannguyen2026orthrusmemoryefficientparalleltoken,
      title={Orthrus: Memory-Efficient Parallel Token Generation via Dual-View Diffusion},
      author={
Erlang/OTP 29.0

Erlang/OTP 29 发布总结 (Erlang/OTP 29 Release Summary)

Erlang/OTP 29 是一个重要的主要版本发布,包含新特性、改进和一些不兼容性。以下是主要亮点:

安全增强 (Security Enhancements)

  • 默认安全策略: SSH 守护程序现在默认禁用 shell 和 exec 服务,遵循“默认安全”原则,防止未经授权的代码执行。SFTP 子系统也默认禁用。
  • 量子安全密钥交换: SSL 配置中,默认首选的密钥交换组为 x25519mlkem768,这是一种混合量子安全算法,提供对经典和量子计算机攻击的保护。

新特性 (New Features)

  • io_ansi 模块: 允许程序向终端输出虚拟终端序列(ANSI 序列),用于添加文本颜色/样式或创建完整的终端应用程序。
  • ct_doctest 模块: 允许测试 Erlang 模块文档和文档文件中的示例代码。
  • ignore_xref 属性: xref 工具现在直接处理 ignore_xref 属性的过滤,确保所有调用 xref 的工具都能正确处理这些声明。
  • 原生记录 (Native Records): 实现了 EEP-79 中描述的原生记录,这是一种类似于传统元组记录的全新数据结构,但更像一个真正的类型。目前处于实验阶段。
  • is_integer/3 BIF: 新的内建函数,方便验证值是否为整数并在指定范围内。
  • 多值推导 (Multi-valued Comprehensions): 支持 EEP 78 中定义的多值推导。
  • 推导式变量绑定 (Comprehension Variable Binding): 通过启用 compr_assign 特性,可以在推导式中绑定变量。
  • 随机置换函数: 增加了 rand:shuffle/1rand:shuffle_s/2 函数,用于随机置换列表。

语言和编译器改进 (Language and Compiler Improvements)

  • 默认工作目录: Erlang 系统默认代码路径中,当前工作目录 (.) 的位置已从第一位移动到最后一位。
  • JIT 优化: JIT 现在可以为具有多个小端段的二进制文件匹配或创建生成更好的代码。
  • 编译器优化: 编译器现在可以为具有常量值的列表推导生成更有效的代码。
  • 语言实现者文档: compile 模块的文档中添加了针对在 BEAM 上运行的语言实现者的建议。

编译器警告 (Compiler Warnings)

  • 弃用警告: 启用了一些新的编译器警告,用于标记已弃用的功能。
    • catch 运算符(建议使用 trycatch)。
    • 从子表达式导出变量。
    • andor 运算符。
    • 匹配别名模式 (例如 {a,B} = {X,Y})。
  • 旧的守卫测试: Erlang/OTP 30 将删除旧的守卫测试 (例如 list(L) 而不是 is_list(L)),目前仍然会发出警告。

其他 (Other)

  • Windows 支持: 不再提供 32 位 Erlang/OTP 构建版本。

更多详细信息和潜在的不兼容性,请参考 README

WinCE64 – Windows CE 2.11 for N64

简要总结:任天堂64运行Windows CE 2.11

本项目是一个业余爱好项目,旨在将Microsoft Windows CE 2.11运行在真实的任天堂64主机上。项目本身并非微软官方支持,而是通过自定义的硬件抽象层(HAL)将未修改的nk.lib内核加载到VR4300处理器上,从而启动CE 2.11的GWES桌面和Shell环境。

主要功能与结构:

  • 启动与系统: CE 2.11系统能够完整启动,并提供桌面、任务栏和文件浏览器等功能。
  • 输入: N64手柄被识别为鼠标,A键为左键,B键为右键。
  • 存储: EverDrive-64 X7的SD卡被挂载到\SDCard目录下,并使用FatFS文件系统访问。
  • 音频: 通过N64 AI硬件播放音频,利用标准的CE wave stack。
  • 第三方应用: 能够从SD卡直接运行第三方CE 2.11 EXEs,例如 BeziersCE
  • 3D加速: 采用RDP加速的3D演示 (cube3d.exe),通过直接rasterising平滑阴影三角形实现。

架构:

  • 核心: 未修改的nk.lib负责调度和TLB管理。
  • 标准CE模块: CE 2.11的标准用户模式模块(如coredll.dll, gwes.exe等)从ROM镜像中加载,保持不变。
  • 自定义组件:
    • HAL/OAL: 负责引导、异常向量、MIPS启动、定时器、USB调试以及RDRAM相关处理。
    • 显示驱动: 处理VI framebuffer、RDP填充加速以及软件光标合成。
    • 键盘/鼠标 PDD: 轮询Joybus,识别N64手柄和官方N64鼠标。
    • SD文件系统: 基于FatFS的FSD,注册为\SDCard,使用PI-DMA EverDrive-X7驱动。
    • Wave PDD: 轮询模式的AI驱动,位于waveapi.dll之下。
    • commctrl.dll: 包含缺失的DllMain,使spinner控件正常注册。
    • Shell: 提供Win9x风格的桌面、任务栏和文件浏览器。
    • RDP 3D库: 用于用户EXE的最小化三角形rasteriser。

构建与运行:

  • 依赖: 需要wince211_sdk (Windows CE 2.11 SDK), libdragon (N64 homebrew toolchain) 和 EverDrive-64 X7。
  • 构建: 使用bash bsp/build.sh构建,生成可直接由X7加载的n64ce.z64文件。
  • 运行:
    • 真实N64: 使用diag/ed64_upload工具将ROM上传到EverDrive-64 X7。
    • 模拟器: 由于涉及到硬件相关的优化,目前仅支持真实硬件,模拟器支持尚未实现。

代码库结构:

  • bsp/: 包含HAL、驱动程序、Shell、应用程序和ROM镜像。
  • bootloader/: 包含libdragon IPL3 trampoline,用于加载nk.bin
  • diag/: 包含用于LE模式测试、音频测试和USB上传的诊断ROM。
  • docs/: 包含架构图、硬件调试笔记和N64相关quirks。

免责声明:

本项目不提供微软或任天堂的任何专有文件。需要用户自行提供SDK和工具链。项目代码采用MIT许可证,但CE 2.11 SDK的静态库不受该许可证约束。

London Police Deploy Facial Recognition at Protest for First Time

伦敦政治抗议活动将首次部署人脸识别技术:总结

以下是对原文内容的总结:

核心事件: 明天,伦敦市警察局将在伦敦卡门区举行的“联合王国,联合西方”政治集会(由托米·罗宾逊组织,主题为“国家统一、言论自由和基督教价值观”)上首次部署实时人脸识别 (LFR) 技术。

其他活动: 与此同时,伦敦还将举行一个约 3 万名参与者的“纳克巴日”亲巴勒斯坦游行,但该游行将不会受到相同的人脸识别监控。

技术部署与演变:

  • 移动到固定: 警方正在从使用固定在警车上的 LFR 系统转向将摄像头固定在路灯和其他公共基础设施上。
  • 克罗伊登试点项目: 在为期六个月的克罗伊登试点项目中,警方利用固定摄像头扫描了超过 47 万张面孔,导致 173 起逮捕。 警方声称犯罪率下降了 10.5%,其中针对女性和女孩的暴力犯罪下降了 21%。 然而,分析显示,平均每 2717 人被扫描后,才有一人被逮捕,这意味着绝大多数被扫描者与犯罪无关。
  • 永久化部署: 克罗伊登试点项目的成功促使警方计划永久化该部署。

争议与担忧:

  • 缺乏民主授权: 英国议会从未就 LFR 技术进行投票,也没有明确的法律法规监管其使用。 警方自行制定部署政策,而 LFR 技术是在没有议会监督的情况下引入、测试和普及的。
  • 双重标准: Reform UK 领导人奈杰尔·法拉奇批评警方对“联合王国”集会使用 LFR 技术,而对亲巴勒斯坦游行未采取相同措施,认为这是“双重标准”。
  • 对政治参与的监控: 在抗议活动中使用人脸识别技术,会创建一个政治参与的生物识别记录,即使数据声称会在几秒钟内被删除。 这可能会导致一些人选择不参加合法示威活动,从而影响民主权利的行使。
  • 安全威胁依据模糊: 警方声称部署 LFR 技术是基于“情报显示,部分与会者可能对公共安全构成威胁”,但并未明确说明威胁的具体内容。 这相当于将整个抗议活动变成一个监控区域,所有参与者都被扫描并与警务数据库进行比对。

总结: 伦敦市警察局正在扩大使用人脸识别技术,特别是在政治抗议活动中,引发了关于隐私、公民自由和民主参与的担忧。 这种技术部署缺乏民主授权,并可能对公民的政治权利产生寒蝉效应。

I designed a nibble-oriented CPU in Verilog to build a scientific calculator

FPGA 科学计算器项目总结 (FPGA Scientific Calculator Project Summary)

本项目使用 FPGA 实现了一个完整的科学计算器,包含定制的软核 CPU、微码固件以及相应的工具。

项目结构 (Project Structure):

项目包含以下关键文件夹:

  • verilog/: 包含 CPU、ALU、I/O 以及测试用例的 SystemVerilog 源代码。
  • ucode/: 包含软核 CPU 的微码(固件)。
  • quartus/: 包含用于 FPGA 综合的 Quartus 项目文件。
  • modelsim/: 包含 ModelSim 仿真设置。
  • Qt/: 包含基于 Qt 的模拟器和调试器,使用 Verilator。
  • calctest/: 包含硬件验证的命令行测试工具,使用 Verilator。
  • tools/: 包含微码的汇编器和脚本编译器。
  • Pathfinding/: 包含算法研究和验证项目。

快速上手 (Quick Start):

推荐通过构建 Qt 模拟器开始体验。需要在 WSL2 环境中执行 cd /mnt/c/Projects/FPGA-Calculator/verilog 后运行 make qt,然后在 Qt Creator 中打开 Qt/Calculator.pro 并构建为 "Desktop Qt MSVC2022 64 Bit"。

所需工具 (Required Tools):

  • Verilator: 用于 Verilog 仿真,Qt 模拟器依赖。
  • Qt: 用于桌面/WebAssembly/Android 应用开发,版本 6.9+。
  • Quartus: 用于 FPGA 综合,版本 13.0 SP1 用于 Cyclone II。
  • ModelSim: 用于波形仿真,可选。
  • Visual Studio 2022: 用于 Qt 的 C++ 编译器,Community Edition 即可。
  • Python 3: 用于汇编器和工具。

Verilator 设置 (Verilator Setup):

Verilator 在 WSL2 中运行,项目源文件位于 Windows 分区,通过 WSL2 访问。

构建目标 (Build Targets):

  • Qt 模拟器: 使用 make qt 命令构建。
  • Calctest: 使用 make calctest 命令构建命令行测试工具。
  • ModelSim: 使用 make test_self 命令进行 CPU 自检。
  • FPGA 硬件: 使用 make revB 命令组装 RevB 板的微码。

路径查找项目 (Pathfinding Projects):

独立的研究和验证项目,包括:

  • BCD 算术黄金参考(硬件验证子模块)
  • 复杂操作概念验证(使用基本算术)
  • 计算器算法的 C++ 实现(已弃用)
  • 数值输入状态机模拟
  • 键盘布局设计和用户交互测试

许可 (License):

本项目使用 Creative Commons Attribution-NonCommercial-ShareAlike 4.0 国际许可证 开源,允许分享、改编,但仅限于非商业用途,并要求署名和使用相同许可证。

Δ-Mem: Efficient Online Memory for Large Language Models

δ-mem: 一种轻量级在线记忆机制

本文提出了一种名为 δ-mem 的轻量级记忆机制,旨在解决大型语言模型(LLM)在长期助手和智能体系统中积累和重用历史信息的问题。简单地扩展上下文窗口成本高昂且往往无法有效利用上下文。

核心思想与机制:

δ-mem 机制通过以下方式实现:

  • 增量式记忆更新: δ-mem 使用一个固定大小的在线状态矩阵(在线记忆),并通过 Delta 规则进行学习,压缩过去的经验。
  • 与注意力的耦合: δ-mem 的读取输出用于生成低秩修正,直接应用于 LLM 的注意力计算过程中,从而影响其生成过程。
  • 紧凑的在线状态: 实验表明,即使仅使用一个 8x8 的在线记忆状态,δ-mem 也能有效提升模型性能。

实验结果:

δ-mem 在实验中表现出以下优势:

  • 性能提升: 在平均指标上,δ-mem 的得分提升了 1.10 倍于冻结的原始模型 (frozen backbone),并且比最强的非 δ-mem 记忆基线提升了 1.15 倍。
  • 记忆密集型任务表现更优: 在需要大量记忆的任务基准测试中,δ-mem 的表现更突出,在 MemoryAgentBench 上提升了 1.31 倍,在 LoCoMo 上提升了 1.20 倍。
  • 保持通用能力: δ-mem 在提升记忆能力的同时,很大程度上保留了模型的通用能力。

总结:

δ-mem 证明了通过紧凑的在线状态直接耦合注意力计算,可以在无需完全微调、替换模型骨干或显式扩展上下文的情况下,实现有效的记忆功能。这种方法为构建更高效、更强大的 LLM 提供了新的思路。

关键信息概括:

  • 问题: LLM 在长期任务中积累和重用历史信息面临挑战。
  • 解决方案: δ-mem – 一种轻量级在线记忆机制。
  • 核心机制: 使用 Delta 规则更新的固定大小的在线状态矩阵,并将其作为低秩修正应用于注意力计算。
  • 优势: 提升性能,尤其在记忆密集型任务中,同时保持通用能力。
  • 关键特点: 无需完全微调、替换骨干或显式扩展上下文。
Fecal transplants for autism deliver success in clinical trials

肠道微生物移植在改善自闭症症状方面的研究进展 (Research Progress on Fecal Microbiota Transplantation in Improving Autism Symptoms)

本文总结了亚利桑那州立大学(ASU)研究团队在肠道微生物与自闭症症状之间的联系方面取得的进展。以下是主要内容:

1. 自闭症与肠道问题:

  • 美国每59个新生儿中就有1个被诊断为自闭症。
  • 高达30-50%的自闭症患者患有严重的胃肠道问题,如便秘、腹泻和腹痛。
  • 研究表明,解决胃肠道问题可以改善自闭症相关的症状。

2. 早期研究与效果:

  • 2017年和2019年发表的研究表明,通过粪便移植引入新的细菌,可以显著改善自闭症儿童的行为,包括社交技能、活动过度、沟通等方面。
  • 最初的改善效果在八周内显现。

3. 长期效果和持续改善:

  • ASU研究团队对治疗的持久效果进行了调查,发现治疗后的两年前,症状不仅没有消失,反而有所改善。
  • 最初,83%的参与者被评为“严重”的自闭症,而两年后,只有17%被评为严重,39%为轻度或中度,令人惊讶的是,44%低于轻度自闭症的截断值。
  • 心理自闭症症状在八周时减少了24%,两年后减少了近50%。

4. 机制与后续发展:

  • 研究人员认为,肠道微生物与大脑之间存在着强烈的联系。
  • 2022年,Krajmalnik-Brown及其同事对一种特定的细菌配方进行了专利,并成立了Gut-Brain Axis Therapeutics公司。
  • 该治疗方法被命名为微生物移植治疗(MTT)。

5. 临床试验进展:

  • 一项Phase 2的安慰剂对照临床试验显示,治疗组在自闭症症状(主要结果)和每日排便记录(次要结果)方面均优于安慰剂组。
  • 在Parent Global Impressions评估中,治疗组在接近所有症状方面均优于第一部分中的安慰剂组,在胃肠道、接受性语言和所有症状的平均值方面有统计学意义的改善。
  • 在发脾气、刻板行为和认知方面也出现了略有意义的改善。

6. 未来展望:

  • 研究团队正在寻求资金,以进行大规模的Phase 3临床试验,为最终获得FDA批准做准备。
  • 相关研究发表在《Scientific Reports》期刊上。

总结:

该研究表明,通过粪便移植改善肠道微生物多样性,有可能长期改善自闭症患者的症状,并可能对自闭症的治疗提供新的思路和方法。目前的研究正朝着获得FDA批准的方向发展,有望为自闭症患者带来新的治疗选择。

NYT and vaping: How to lie by saying only true things (2022)

关于《纽约时报》一篇关于青少年吸食电子烟的文章的解构:议程新闻的辨识

本文旨在剖析一篇2022年《纽约时报》关于青少年吸食电子烟的文章,揭示其如何将EVALI(电子烟或吸入性损伤)住院病例归咎于合法烟草尼古丁电子烟,而实际上起因是非法THC产品。文章逐句分析,指出文章的误导性在于其措辞技术上准确,但含义具有欺骗性。

背景

2019-2020年,EVALI肺损伤危机由掺杂维生素E醋酸盐的非法THC电子烟引起。然而,这场危机被用来为限制合法烟草尼古丁电子烟的措施提供公共理由。文章指出,即使在THC产品中发现了维生素E醋酸盐,且合法尼古丁电子烟在大量销售后从未出现过类似问题,且在采取法律诉讼后危机已缓解,但人们却普遍认为尼古丁电子烟是致命的。

文章分析

文章通过对《纽约时报》文章的逐句分析,揭示了其误导性:

  • 混淆THC和尼古丁电子烟: 文章将两者混淆,利用“电子烟”、“吸食THC和尼古丁”、“与电子烟相关的肺损伤”等模糊措辞,以及时间顺序叙事,使得读者难以区分两者。
  • 案例选择: 文章以Lizzie Burgess的住院事件为例,将合法烟草尼古丁电子烟与肺损伤联系起来,但实际上她的肺损伤是由非法THC电子烟引起的。
  • 评论区反应: 文章引用了评论区中许多读者对文章的赞同,认为电子烟成瘾并危害儿童,甚至主张对其进行禁令。仅有一位评论员指出,Burgess的肺损伤是由掺杂非法THC的电子烟引起的,而非尼古丁电子烟。
  • 文章结构: 文章通过将“合成尼古丁”、“调味电子烟”、“与电子烟相关的肺损伤”、“尼古丁成瘾”等元素进行巧妙排列,引导读者得出错误的因果推论。

文章的策略

文章指出,《纽约时报》文章并非简单地撒谎,而是通过精心措辞和选择性引用,利用“后此故此”(post hoc ergo propter hoc,即“后此故此”)的逻辑谬误,误导读者。文章使用了“电子烟”和“吸食THC和尼古丁”等概括性术语,掩盖了非法THC电子烟与肺损伤之间的联系,从而将责任归咎于合法尼古丁电子烟。

文章的特点

  • 客观真相清晰: EVALI危机是由掺杂维生素E醋酸盐的非法THC产品引起的,而合法尼古丁电子烟并未发现维生素E醋酸盐污染。
  • 高调且经过编辑: 文章发表于《纽约时报》等知名媒体,经过了编辑和事实核查。
  • 纯文本/语法层面的操纵: 文章的误导性在于其措辞和选择性引用,而非简单的虚假陈述。
  • 不必要的THC相关内容: 文章可以专注于合法尼古丁电子烟的批评,而无需引入与EVALI相关的THC产品案例。
  • 有意的策略: 文章的措辞经过精心设计,作者很可能清楚地知道自己在做什么。

结论

文章强调,读者应该保持批判性思维,审视科学新闻报道,避免被精心设计的措辞和选择性引用所误导。文章鼓励读者不仅要关注句子是否技术上准确,还要关注文章是否清晰地表达了事实,以及是否回避了关键信息。

总而言之,本文旨在揭示《纽约时报》文章中存在的议程新闻倾向,并提醒读者在阅读新闻时保持警惕,避免被误导。


希望这个摘要对您有所帮助。