2026-03-16

30 篇热帖

Corruption erodes social trust more in democracies than in autocracies

腐败对社会信任的影响:民主制度下的脆弱性

摘要:

虽然腐败在民主和专制政权中都存在,但其社会后果可能因政权类型而异。民主制度中的平等和公正规范使得社会信任对机构失败高度敏感。本文理论化了两种机制——规范放大和代表性传染——可以使腐败在民主制度下更多地侵蚀社会信任。在民主制度下,腐败违反了核心公平规范,并涉及选举腐败官员的公民。而在专制制度下,腐败被认为是常态,精英阶层被视为与普通公民分离。

研究方法:

为了检验该理论,我们利用了来自 62 个国家的数据,结合了个体层面的调查回复和国家层面的民主质量指标进行多层次分析。

研究结果:

首先,我们证明了腐败感知会普遍降低社会信任。然后,我们发现这种个体层面的心理机制在民主制度下明显比在专制制度下更强,即使控制了不平等和国家层面的腐败。

讨论:

这些发现揭示了一种不对称的脆弱性:使民主制度运作的问责制结构也使社会资本变得脆弱。这对于理解民主制度的复原力具有重要意义,因为腐败以不同于专制制度的方式威胁着民主合作所必需的社会信任。

1. 引言

民主制度可能对某些威胁具有独特的敏感性。最近关于民主倒退的研究表明,当规范衰落和机构削弱时,民主制度可能会从内部崩溃 (Levitsky and Ziblatt, 2018)。本文识别了一种特定的敏感性:在民主制度下,社会资本似乎对腐败特别敏感。

我们认为,这种敏感性源于民主制度的基础承诺:平等和公正。这些承诺可能创造了两种心理机制,从而放大腐败对社会信任的影响。首先,规范放大:在普遍主义是应许理想的民主制度下,腐败可能标志着社会契约的破裂。公民可能会推断,如果旨在体现公正的机构受到损害,那么整个社会都是不可信任的。相反,在专制制度下,特别是主义是预期的,腐败证实了寻常的运作,而不是标志着社会腐败。其次,代表性传染:在民主制度下,腐败官员被视为通过选举来自“人民”,可能涉及全体公民。相反,在专制制度下,掠夺性精英被视为一个截然不同的阶级,与普通公民隔离。他们的腐败不会影响人际信任。如果这些机制按理论所述运作,那么将腐败感知与社会不信任联系起来的个体层面的心理过程应该取决于政权类型——在民主制度下强,在专制制度下弱。

You (2018) 的一项研究为我们的理论提供了有力的证据。他使用社会信任和腐败的国家层级数据,分别研究了民主和专制制度,发现腐败与民主制度中社会信任的减弱呈强相关性,但在专制制度中则不然。这种引人注目的模式与我们的理论一致。然而,由于该发现是在总体层级获得的,它仍然存在一个问题:它是否反映了人们对腐败的真正心理差异,还是其他现象的产物。

本文旨在提供个体层面的证据,说明为什么民主制度中的人们对腐败的感知可能特别敏感。我们首先复制了 You 的国家层级发现,使用来自 62 个国家(涵盖从俄罗斯和伊朗等专制制度到新西兰和荷兰等稳定自由民主制度)的最新数据。然后,我们使用多层次建模来检验是否存在相应的个体层面的模式。我们发现,在民主制度下,人们对腐败的感知与社会信任降低相关,而这种个体层面的关联在专制制度下则明显较弱或不存在。这些发现表明,腐败与社会信任之间的关系在不同政权类型之间存在不对称性。虽然民主制度通过其机构促进了高水平的社会信任,但它们也可能使这种社会资本更容易受到机构失败的感知的影响。这可能是问责制的代价:使民主制度运作的规范——平等、代表性和透明性——也可能确保机构失败会反映在公民的社会世界观中。

2. 理论框架

2.1 社会信任及其政治基础

社会信任——相信大多数人是值得信任的——长期以来被认为是民主社会的重要基石 (Putnam, 1993; [Fukuyama, 1995](#

MoD sources warn Palantir role at heart of government is threat to UK security

英国政府与 Palantir Technologies 的安全风险:一份摘要

本文报道了英国国防部内部人士对美国人工智能监控和安全公司 Palantir Technologies 的担忧,认为该公司对英国的国家安全构成威胁。以下是主要内容:

合同与金额: Palantir 在英国政府拥有至少 6.7 亿英镑的合同,其中包括 1500 万英镑与英国核武器机构的合同。

核心担忧:

  • 数据主权问题: 尽管国防部声称数据仍然处于英国政府所有,但内部人士认为这种说法具有误导性。Palantir 能够通过数据抓取和聚合,构建关于英国的详细画像,并将其用于自身目的。
  • 数据洞见归属: 关键问题在于,即使数据本身仍由国防部控制,但 Palantir 从数据中获得的洞见并不属于国防部。这可能导致 Palantir 掌握敏感信息,从而对国家安全构成风险。
  • 潜在的全面画像: 一位情报背景的内部人士认为,Palantir 已经可能拥有对整个英国人口的完整画像,并整合了来自不同政府部门的数据。
  • 信息聚合能力: Palantir 能够将多个未公开的信息组合起来,生成高度机密的信息。例如,通过追踪国防供应商的货物信息,Palantir 可能推断出核潜艇的部署地点。

Palantir 的国际影响:

  • 美国移民执法: Palantir 在美国被用于追踪和定位移民,引发隐私担忧。
  • 美国政府数据整合: Palantir 协助美国政府整合税务和国土安全数据,创建了可搜索的公民数据库,引发网络安全问题。
  • 军事行动: Palantir 的技术被用于美国在委内瑞拉、加沙和伊朗的军事行动中。

其他国家的回应: 瑞士军方拒绝了 Palantir 的技术,理由是担心敏感数据可能被美国政府和情报机构访问。

历史案例: Palantir 在与纽约警察局的合同中断后,曾声称对从其平台生成的分析洞见拥有知识产权,这表明该公司可能试图声称对英国政府数据洞见拥有所有权。

批评与呼吁:

  • Open Rights Group 警告称,Palantir 可能会利用其掌握的信息,对英国施加压力。
  • Good Law Project 认为,英国政府给予 Palantir 过多的数据访问权限,而监管机构对此却无能为力。
  • 自由民主党议员呼吁建立英国主权的技术能力,并移除与外国政治组织关系密切的公司。

Palantir 的回应: Palantir 否认了上述指控,称其毫无根据。

总之,这篇文章揭示了英国政府与 Palantir Technologies 合作所面临的国家安全风险,呼吁议会采取行动,并对该公司的数据访问和使用进行更严格的监管。

Canada's bill C-22 mandates mass metadata surveillance of Canadians

Bill C-22 (Lawful Access Act) 概述

加拿大政府近日推出了《Bill C-22》(Lawful Access Act,法律访问法案),旨在规范执法部门获取个人信息以及发展加拿大网络上的监控和侦查能力。该法案取代了先前因隐私担忧而撤回的《Bill C-2》中的相关条款,标志着加拿大法律访问政策的重大调整。

法案结构与主要内容:

《Bill C-22》分为两个主要部分:

  1. “关于及时获取数据和信息”: 该部分对执法部门获取通信服务提供商(如互联网服务提供商和无线运营商)持有的个人信息进行了改进。
    • “服务确认”权力: 执法部门将可以要求电信服务提供商确认是否为特定个人提供服务,但其他个人信息需要经过法官审查和批准的生产令才能获取。
    • 规范: 包含关于自愿披露、挑战请求、紧急情况和外国请求等规则。
  2. Supporting Authorized Access to Information Act (SAAIA) (支持授权访问信息法): 建立新的要求,要求通信服务提供商积极配合执法部门进行监控和侦查能力建设。

主要变化与担忧:

  • 改进: 相比之前的《Bill C-2》,该法案显著限制了无证获取个人信息的权力,将范围仅限于电信服务提供商以及是否为特定个人提供服务的信息,更深入的个人信息获取需要司法监督。
  • 担忧(SAAIA): SAAIA 提出的要求对网络提供商影响巨大,可能要求提供商与执法部门合作,允许执法部门直接访问网络以测试数据访问和拦截能力。
    • “电子服务提供商” (ESP) 定义: 将范围扩大到包括互联网平台(如 Google、Meta 等),并对 ESP 施加义务,要求提供“合理协助”进行测试和评估,并对请求保密。
    • 核心提供商: 政府将指定“核心提供商”,需要履行更严格的义务,包括开发和维护监控能力、安装和测试设备,以及保留特定元数据(例如传输数据),最长不超过一年。
    • 数据保留限制: 虽然规定了数据保留的限制(例如,不包括信息内容、网页浏览历史和社交媒体活动),但仍存在网络可能因这些规则而变得不安全的风险,且这些变化通常不公开。
    • 国际信息共享: 许多规则似乎旨在促进全球信息共享,包括遵守《布达佩斯公约第二补充议定书》(2AP)和 CLOUD Act。

总结:

《Bill C-22》在限制无证获取个人信息方面取得了一定进步,但 SAAIA 提出的要求对网络服务提供商的义务和潜在的安全风险引发了严重的隐私和公民自由担忧。该法案如果通过,将对加拿大通信网络和网络服务提供商与政府机构的互动方式产生重大影响。


中文翻译说明:

  • 我尽量保持了原文的准确性和简洁性。
  • 使用了Markdown格式,方便阅读。
  • 重点突出了法案的结构、主要内容以及改进和担忧。
  • 对一些专业术语进行了翻译或解释,以方便理解。
  • 避免了个人意见和未在原文中出现的信息。
US Job Market Visualizer

342 职业可视化工具摘要 (Summary of the 342 Occupation Visualization Tool)

这是一个用于可视化美国劳工统计局《职业展望手册》(Occupational Outlook Handbook) 中 342 个职业的工具,涵盖了美国经济中的 1.43 亿个职位

核心功能:

  • 可视化呈现: 使用树状图 (treemap) 形式展示职业数据。每个矩形的面积与该职业的总就业人数成比例。
  • 可切换指标: 矩形的颜色代表可切换的指标,包括:
    • 劳工统计局 (BLS) 预测的增长前景
    • 中位工资
    • 教育要求
    • 人工智能 (AI) 暴露度 (Digital AI Exposure)
  • 交互式探索: 点击任何一个矩形可以查看其完整的劳工统计局页面。
  • 开发工具: 该工具并非正式的经济报告或研究论文,而是一个用于探索劳工统计局数据的可视化开发工具。

LLM 驱动的着色 (LLM-powered Coloring):

  • 自定义指标: 该工具的源代码 (GitHub: https://github.com/karpathy/jobs) 包含爬虫、解析器以及一个管道,用于编写自定义的 LLM 提示词,从而根据任何标准对职业进行评分和着色。
  • 提示词驱动: 用户可以编写提示词,LLM 对每个职业进行评分,然后树状图根据评分进行着色。
  • “数字 AI 暴露”示例: “数字 AI 暴露”选项是其中一个示例,它根据 AI 对每个职业的潜在影响进行估计。用户可以编写不同的提示词来评估其他因素,例如人形机器人暴露、外包风险或气候影响。

“数字 AI 暴露”评分提示词示例:

该提示词要求 LLM 扮演专家分析师,根据劳工统计局的职业描述,在 0 到 10 的尺度上评估职业的 AI 暴露度。 AI 暴露度的衡量标准是 AI 对该职业的重塑程度,包括直接影响(AI 自动化人类执行的任务)和间接影响(AI 提高每个工人的生产力,从而减少所需人数)。 提示词强调了工作产品是否以数字形式存在的重要性。 如果工作主要在电脑上完成,例如写作、编码、分析和沟通,则 AI 暴露度通常很高。 提示词提供了不同暴露等级的锚定示例,并要求 LLM 以 JSON 格式输出评分和理由。

重要提示:

  • 粗略估计: “数字 AI 暴露” 评分是 LLM 的粗略估计,而非严格的预测。
  • 并非预测消失: 高分并不意味着该职业会消失。例如,软件开发人员的 AI 暴露度很高,但由于每个开发人员的生产力提高,对软件的需求可能会增加。
  • 未考虑所有因素: 该评分没有考虑到需求弹性、潜在需求、监管障碍或对人类工人的社会偏好等因素。 许多高暴露度的职业可能会被重塑,而不是被取代。
Chrome DevTools MCP

Chrome DevTools MCP:让编码代理调试您的浏览器会话 - 总结

本文介绍了 Chrome DevTools MCP (Chrome DevTools Protocol 协议服务器) 的一项新功能:允许编码代理直接连接到活跃的浏览器会话。该功能旨在简化调试流程,并促进人工调试和 AI 辅助调试的无缝切换。

主要功能与优势:

  • 重用现有浏览器会话: 编码代理现在可以直接访问您的当前浏览会话,无需重新进行登录等操作。
  • 访问活跃的调试会话: 编码代理可以访问 DevTools UI 中活跃的调试会话。例如,在网络面板中发现失败的网络请求,可以直接让编码代理进行调查;在元素面板中选中元素,同样可以请求编码代理进行分析。

工作原理:

  • 该功能在 Chrome M144 (Beta 版) 中引入。
  • MCP 服务器通过请求远程调试连接来与 Chrome 实例建立连接,基于 Chrome 现有的远程调试功能。
  • 默认情况下,远程调试功能是禁用的,需要用户手动在 chrome://inspect#remote-debugging 中启用。
  • 使用 --autoConnect 选项配置 MCP 服务器时,服务器会自动连接到活跃的 Chrome 实例并请求调试会话。
  • 为了防止恶意使用,Chrome 会在每次请求调试会话时弹窗提示用户确认,并在调试会话进行时在页面顶部显示 "Chrome 被自动化测试软件控制" 的提示。

使用步骤:

  1. 启用 Chrome 中的远程调试: 在 Chrome (>=144) 中,访问 chrome://inspect/#remote-debugging 启用远程调试,并允许或拒绝调试连接。
  2. 配置 Chrome DevTools MCP 服务器: 使用 --autoConnect 命令行参数配置 MCP 服务器,例如在 gemini-cli 配置中加入 "--autoConnect", "--channel=beta"
  3. 测试配置: 使用 Gemini CLI 运行提示,例如 Check the performance of https://developers.chrome.com,验证 MCP 服务器是否能够连接到 Chrome 实例,并成功获取用户权限。

未来展望:

Chrome 团队计划逐步向编码代理暴露更多 DevTools 面板数据,进一步增强 AI 辅助调试的能力。

总结:

Chrome DevTools MCP 的新功能使得编码代理能够直接介入活跃的浏览器会话进行调试,显著提高了调试效率,并为开发者提供了更灵活的调试选择。通过简单的配置,即可启用此功能,并享受 AI 辅助调试带来的便利。

The 49MB web page

现代新闻网站的臃肿与用户体验困境 (现代新闻网站的臃肿与用户体验困境)

本文探讨了现代新闻网站用户体验面临的严重问题,指出它们在追求短期利益(CPM)的同时,牺牲了用户体验和长期读者留存。

问题根源:

  • 数据臃肿: 仅仅加载纽约时报的四个标题就产生了422个网络请求和49MB的数据,相当于Windows 95的大小,甚至超过了2006年标准MP3歌曲的大小。
  • 追踪与隐私: 新闻网站过度追踪用户,在用户阅读标题之前就发起数十个广告竞价请求,导致CPU占用率升高,耗费电量。
  • 经济激励: 发布商为了追求更高的CPM,采用“用户滞留时间”作为重要指标,导致设计决策倾向于延长用户在页面上的停留时间,而非优化用户体验。
  • 广告技术栈: 现代广告技术栈和框架设计导致页面臃肿,抵消了硬件性能提升带来的优势。

用户体验问题:

  • Z-Index Warfare (层叠式战争): GDPR弹窗、订阅模态框、通知权限请求等元素占据页面底部30%的空间,阻碍用户访问内容。
  • Cumulative Layout Shift (CLS,累积布局偏移): 广告加载导致页面内容突然跳动,破坏用户阅读体验,增加认知负担。
  • 自动播放视频: 自动播放的视频持续干扰用户,即使滚动页面,视频也会固定在屏幕底部。
  • 垂直空间压缩: 粘性头部、分享栏等元素占据宝贵的手机屏幕垂直空间,导致内容显示区域狭小。
  • 文章内容截断: 为了追踪用户行为和加载更多广告,文章内容被截断,用户需要点击“继续阅读”按钮。
  • 高交互成本: 用户在阅读内容之前需要进行多次操作(关闭弹窗、滚动页面),增加了交互成本。

解决方案:

  • 限制弹窗: 在60秒的停留时间或50%的滚动深度之后才能显示弹窗。
  • 序列化弹窗: 逐步显示弹窗,而非一次性弹出多个。
  • 非侵入式模态框: 设计简洁、易于关闭的模态框。
  • 预留异步内容空间: 使用骨架加载器等技术,预留广告位空间,避免内容加载后布局跳动。
  • 订阅按钮放置: 将订阅按钮放置在文章内容中间,而非强制用户完成一系列操作。
  • 使用RSS订阅: 避免追踪和干扰,选择RSS订阅获取新闻内容。

总结:

新闻网站应该关注用户体验,将用户视为合作伙伴而非资源。工程师和设计师需要摆脱商业模式的束缚,构建更简洁、更易于使用的网站。用户可以通过选择RSS订阅等方式,拒绝被过度追踪和干扰。作者鼓励工程师关注网络面板和用户同理心,共同改善网络环境。

Why I love FreeBSD

FreeBSD:二十余载的信任与热爱 (FreeBSD: Twenty Years of Trust and Love)

本文讲述了作者使用FreeBSD超过二十年的经历,表达了对FreeBSD操作系统的深深热爱,并强调了其卓越的品质、社区精神和持续的价值。

核心观点:

  • 文档的重要性: 作者最初被FreeBSD吸引的关键在于其详尽、准确且及时的官方手册 (FreeBSD Handbook)。这表明了FreeBSD团队对质量的重视,并间接证明了系统的可靠性。
  • 与Linux的差异: 尽管Unix的灵感来源相同,FreeBSD被描述为更成熟、更稳定、更专注。作者在早期使用时,便发现FreeBSD在硬件性能、稳定性及资源利用率上优于Linux。
  • 持续的价值: FreeBSD始终坚持“The Power to Serve”(服务能力)的宗旨,专注于稳定、高效、安全地提供服务,而非盲目追求创新或赶时髦。即便作者后来转向Mac,FreeBSD仍然是其服务器和关键工作负载的首选。
  • 原生功能与优势: FreeBSD拥有许多原生且强大的功能,例如 jails (容器化技术)、ZFS (文件系统) 和 bhyve (轻量级虚拟机),无需额外安装软件包即可实现高效、安全的管理。
  • 卓越的社区: 作者高度赞扬了FreeBSD社区,认为其成员充满热情、专业且注重长期价值,与追求快速变现的商业化倾向形成鲜明对比。BSD社区的人们是真正的朋友,而非仅仅是同事。
  • FreeBSD Foundation: 强调了FreeBSD Foundation在社区中的重要作用,它强大且有效,但同时避免了过度干预和自负,这在其他开源项目基金会中是比较罕见的。

主要细节:

  • 作者在2002年首次接触FreeBSD,并将其安装在笔记本电脑上进行实验,最终取代了Linux。
  • 早期使用过程中,作者通过编译系统,发现了FreeBSD在性能和稳定性方面的优势。
  • FreeBSD Handbook成为了作者重要的学习资源,甚至影响了其系统设计和运行方式。
  • 作者认为 FreeBSD 的优势在于其长期稳定性和可预测性,这对于生产环境至关重要。
  • FreeBSD 的更新通常只需要小幅调整,而不会导致彻底的改动。
  • 作者强调了 FreeBSD 社区的积极氛围和开发者们的奉献精神。

总而言之,文章表达了作者对FreeBSD的长期信任与热爱,强调了其技术优势、社区精神和对服务宗旨的坚持,并认为其是可靠、稳定、值得信赖的操作系统。

My Journey to a reliable and enjoyable locally hosted voice assistant (2025)

本地语音助手搭建之旅:从Google Home到Home Assistant Assist

这篇文章记录了作者从使用Google Home(通过Nest Mini)到搭建完全本地化的Home Assistant语音助手(Assist)的转变过程。作者长期关注Home Assistant的Assist进展,并最终转向使用本地优先(Local First)和llama.cpp(此前使用Ollama)技术支持的本地Assist。

主要内容:

  • 背景: 作者之前使用Google Home,但决定迁移到本地化的语音助手方案。
  • 迁移目标: 目标是搭建一个可靠且易于使用的本地语音助手。
  • 技术栈:
    • Home Assistant Assist: 作为核心的语音助手平台。
    • Local First: 强调本地优先的数据处理和控制,增强隐私和可靠性。
    • llama.cpp: 一个用于运行大型语言模型的C++库,用于处理语音识别和自然语言理解。作者之前使用Ollama,后来迁移到llama.cpp。
  • 文章目的: 分享作者搭建本地语音助手的步骤和经验。

总结:

这篇文章主要描述了作者从Google Home迁移到Home Assistant Assist的经历,并介绍了使用的关键技术:Local First和llama.cpp。文章旨在分享搭建可靠且易于使用的本地语音助手的经验。

How I write software with LLMs

使用 LLM 编写软件:我的工作流程和经验 (使用 LLM 编写软件:我的工作流程和经验)

本文介绍了作者使用大型语言模型 (LLM) 编写软件的经验和工作流程,强调了 LLM 在软件开发中的潜力,以及如何通过合理的流程提高效率和质量。

核心观点:

  • **编程偏好转变:**作者发现自己并非喜欢编程本身,而是喜欢创造事物,而编程只是实现目标的一种方式。LLM 的出现使得作者可以更专注于创造,而非被编程细节所困扰。
  • LLM 带来的优势: 使用 LLM 编写软件可以显著降低代码缺陷率,甚至优于手动编写。 此外,作者的工程技能转移到系统架构设计和可用性选择方面,而不是编写代码本身。
  • 模型演进: LLM 的能力在不断提升,早期需要逐行审查代码,现在可以审查函数级别,未来甚至可能只需要关注架构层面。
  • 项目成果: 作者使用 LLM 成功构建了多个项目,包括安全 LLM 助手 Stavrobot、语音笔记记录工具 Middle、艺术时钟 Sleight of Hand 和多人画板 Pine Town。
  • 工作流程: 作者采用“建筑师”、“开发者”和“评审员”相结合的流程,利用不同 LLM 模型的优势进行规划、开发和审查。
    • 建筑师 (Claude Opus 4.6): 负责规划,与作者沟通,直到达成一致的架构设计和详细计划。
    • 开发者 (Sonnet 4.6): 根据建筑师的规划,负责代码的实际编写。
    • 评审员 (Codex, Gemini, Opus): 独立审查计划和代码,提供反馈,并根据反馈与开发者或建筑师进行沟通。
  • 工具选择: 作者推荐使用 OpenCode 或 Pi 作为 LLM harness,因为它支持使用多个模型并允许定义自定义代理。
  • 关键要求:
    • 多模型支持: 使用不同模型进行代码审查,提高代码质量。
    • 代理调用: 允许代理之间进行通信,避免信息传递的冗余。

具体细节:

  • 项目经验: 详细介绍了 Stavrobot 的设计理念和功能,以及 Middle 和 Sleight of Hand 的实际应用。
  • 代码示例: 文章末尾提供了一个完整的代码编写会话示例,展示了作者与 LLM 之间的交互过程和决策过程。
  • 潜在问题: 如果作者对技术不够熟悉,可能会导致 LLM 做出错误的架构决策,导致代码质量下降。
  • 未来展望: LLM 在软件开发中的作用将越来越重要,但人类的工程技能仍然不可或缺。

总结:

本文详细阐述了作者使用 LLM 进行软件开发的工作流程和经验,强调了 LLM 在提高开发效率和质量方面的潜力。作者认为,通过合理的流程和工具选择,可以充分利用 LLM 的优势,并最终实现高效的软件开发。

LLM Architecture Gallery

大型语言模型 (LLM) 架构图库摘要 (截至 2026 年 3 月 16 日)

该页面汇集了来自 Sebastian Raschka 杂志文章(包括《大型 LLM 架构比较》、《从 GPT-2 到 gpt-oss:分析架构进步》、《从 DeepSeek V3 到 V3.2:架构、稀疏注意力及 RL 更新》和《春季开放权重 LLM 的梦想》)的 LLM 架构图和数据表。 该图库主要关注架构面板。

总体目标: 提供 LLM 架构的视觉参考,并追踪其发展趋势。

数据来源: 文章中列出的 LLM 模型,并按照其架构、参数规模、发布日期等信息进行整理。

改进建议: 欢迎提交问题报告,指出不准确的信息、错误的标签或失效的链接。

购买渠道: 该图库已制作成海报,可在 Redbubble 和 Zazzle 购买。

以下是架构图库中列出的模型及其关键信息:

1. 密集型基线 (2019):

  • 参数规模: 1.5 亿
  • 解码器类型: 密集型
  • 注意力机制: 带学习绝对位置嵌入的 MHA (多头注意力机制)
  • 关键细节: 经典 GPT-2 配方,包含 dropout、GELU、LayerNorm 和全多头注意力机制。

2. 密集型模型 (2024):

  • 参数规模: 80 亿
  • 解码器类型: 密集型
  • 注意力机制: GQA (分组查询注意力) + RoPE (旋转位置嵌入)
  • 关键细节: Pre-norm 结构,与 OLMo 2 规模相似但更宽。

3. 密集型 DeepSeek 模型 (2024):

  • 参数规模: 70 亿
  • 解码器类型: 密集型
  • 注意力机制: MHA + QK-Norm (查询和键归一化)
  • 关键细节: 使用内部残差后归一化布局。

4. 稀疏 MoE DeepSeek V3 (2024):

  • 总参数规模: 671 亿,活动参数规模: 37 亿
  • 解码器类型: 稀疏 MoE (混合专家)
  • 注意力机制: MLA (多层注意力)
  • 关键细节: 采用密集前缀和共享专家,提高推理效率。

5. 稀疏 MoE DeepSeek V3.2 (2025):

  • 总参数规模: 671 亿,活动参数规模: 37 亿
  • 解码器类型: 稀疏 MoE
  • 注意力机制: MLA
  • 关键细节: 架构与 DeepSeek V3 相同,主要变化在于推理导向的训练配方。

6. Gemma (2025):

  • 参数规模: 27 亿
  • 解码器类型: 密集型
  • 注意力机制: GQA + 滑动窗口/全局注意力 (5:1)
  • 关键细节: 围绕 27B 的“甜蜜点”,更强的本地注意力以及大型多语言词汇表。

7. Mistral (2025):

  • 参数规模: 24 亿
  • 解码器类型: 密集型
  • 注意力机制: 标准 GQA
  • 关键细节: 延迟优先设计,KV 缓存更小,层数更少。

8. Meta MoE (2025):

  • 总参数规模: 400 亿,活动参数规模: 17 亿
  • 解码器类型: 稀疏 MoE
  • 注意力机制: GQA
  • 关键细节: 交替使用密集块和 MoE 块,专家数量更少,但更大。

9. Qwen (2025):

  • 总参数规模: 235 亿,活动参数规模: 22 亿
  • 解码器类型: 稀疏 MoE
  • 注意力机制: GQA + QK-Norm
  • 关键细节: 高容量 MoE 设计,
Office.eu launches as Europe's sovereign office platform

Office.eu 发布:欧洲数据主权的新选择

Office.eu,一个完全由欧洲公司拥有的生产力平台,正式于今日在海牙发布,旨在提供对微软 Office 和 Google Workspace 等常用平台的替代方案。该平台基于开源技术,完全运行在欧洲基础设施上,旨在帮助组织重新掌控其数据和数字运营。

主要特点与优势:

  • **欧洲自主:**Office.eu 拥有 100% 的欧洲所有权,数据和应用完全存储在欧洲数据中心,远离非欧洲控制。
  • 数据主权与隐私: 该平台将数据主权、隐私和透明度作为核心价值,完全符合欧盟数据保护法规。
  • 功能齐全的办公套件: Office.eu 集成了文档编辑、协作和安全数据存储功能,提供完整的办公解决方案。
  • 易于迁移: 平台提供方便的迁移工具,帮助客户从 Microsoft 365 和 Google Workspace 顺利过渡。
  • 用户友好: 界面直观易用,确保用户可以轻松切换到 Office.eu。
  • 定价: 价格与现有市场替代方案相当。
  • 技术基础: 部分构建于领先的欧洲开源平台 Nextcloud 之上。
  • 目标客户: 主要面向欧洲各地的个人和中小企业。

发布背景与意义:

随着对数字依赖和数据主权问题的日益关注,Office.eu 的发布具有战略意义。近期地缘政治发展凸显了在欧洲建立安全、独立的数字基础设施的重要性。Office.eu 的推出,旨在应对欧洲对美国软件的依赖,并确保欧洲数据和运营的安全。

发布时间表:

目前 Office.eu 正在通过邀请向选定的客户进行推广。计划于 2026 年第二季度在整个欧洲进行广泛的逐步推广。

海牙的地位:

Office.eu 的根植于海牙,国际和平与正义之城,得到了 Security Delta (HSD) 的支持。海牙是数字治理、网络安全和创新的领先中心,积极支持加强欧洲数字主权的举措。

公司信息:

Office.eu 成立于 2024 年,于 2026 年初开始运营。

更多信息:

Obsession with growth is destroying nature, 150 countries warn

政治动态摘要 (Political News Summary)

以下是对提供内容的摘要,主要涵盖了近期欧盟及与欧盟相关的政治和经济动态:

1. 特朗普的表态与欧洲的反应 (Trump's Statements and European Response)

  • 特朗普表示他预计将“采取”古巴("take" Cuba)。
  • 面对特朗普要求欧洲协助处理霍尔木兹海峡局势的要求,欧洲拒绝表示不会被“敲诈” (rejected Trump's demand to help clean up Hormuz mess, rejecting being "blackmailed").

2. 特朗普诉讼 (Trump Lawsuit)

  • 英国广播公司 (BBC) 请求法官驳回特朗普提出的 100 亿美元诉讼。

3. 欧盟能源政策 (EU Energy Policy)

  • 欧盟正在考虑放宽国家援助规则,并可能对天然气价格设定上限,以降低能源账单。

4. 欧盟森林保护法 (EU Deforestation Law)

  • 一位特朗普政府官员警告称,欧盟的森林保护法将损害与美国的贸易。该法案可能会导致美国生产商减少向欧盟出口。欧洲的家畜养殖户也可能受到影响。

5. 欧盟立法标准 (EU Lawmaking Standards)

  • 欧盟执行机构表示,全球不稳定迫使其削弱长期存在的立法保障措施(guardrails),因此计划放宽立法标准,引发了对欧盟破坏民主的指责。

6. 欧盟简化政策 (EU Simplification Policies)

  • 一些公司表示,欧盟的简化政策正在将欧洲变成一个不可预测的商业伙伴。

7. 欧盟电力网络改革 (EU Electricity Grid Reform)

  • 为了加速清洁能源转型,欧盟希望放松对自然保护的限制,因为自然保护措施正在减缓这一进程。这引发了绿色环保团体之间的反弹。

总而言之,内容主要关注特朗普的政策立场、欧盟在能源、贸易、立法和电力改革等方面的政策调整,以及这些政策可能产生的负面影响和争议。 (In short, the content mainly focuses on Trump's policy stance, the EU's policy adjustments in areas such as energy, trade, legislation, and electricity reform, and the negative impacts and controversies that these policies may have.)

Polymarket gamblers threaten to kill me over Iran missile story

以色列记者因报道导弹袭击事件而受到骚扰和死亡威胁:一场与预测市场赌徒的斗争

事件概述:

2026年3月10日,一枚伊朗弹道导弹袭击了耶路撒冷外的 Beit Shemesh 城市,造成了爆炸。记者Emanuel Fabian 在《以色列时报》的现场直播中报道了导弹击中一片开阔地,未造成人员伤亡。然而,此后Fabian 遭受了持续不断的骚扰和死亡威胁,因为有人质疑他的报道是否准确地描述了导弹袭击事件。

骚扰事件的经过:

  • 最初的质疑: Fabian 最初收到来自名为Aviv 的人士的邮件,质疑他的报道称导弹“击中”开阔地,而实际上是拦截器碎片坠落。Fabian 坚持认为,根据以色列军方的信息和现场视频,导弹的战斗部爆炸了,而非仅仅是碎片。
  • 持续的压力: 随后,来自Daniel 的人士持续联系 Fabian,要求他修改报道,称其不准确。Daniel 甚至暗示,修改报道可以“帮助”他、其他人以及以色列国家。
  • Polymarket 的关联: 调查显示,这些邮件的目的是为了确认导弹是否击中以色列,以影响 Polymarket 预测市场上的赌注结果。该预测市场上的“伊朗袭击以色列”事件,有超过 1400 万美元的资金进行投注。
  • 虚假信息和威胁升级: 骚扰者开始散布关于 Fabian 报道的虚假信息,并威胁要对 Fabian 及其家人造成伤害,如果他没有按照他们的要求修改报道。威胁变得越来越具威胁性,涉及财务损失和人身伤害。
  • 警察介入: Fabian 向警方报案,警方正在调查此案。

Polymarket 的回应:

Polymarket 谴责了针对 Fabian 的骚扰和威胁,并表示此类行为违反了其服务条款。该公司表示,预测市场依赖于独立报道的完整性,而试图胁迫记者修改报道会损害这种完整性。Polymarket 已经封禁了参与骚扰的账户,并将信息提供给相关部门。

主要问题:

  • 媒体独立性: 事件突显了媒体独立性面临的威胁,以及外部势力试图影响新闻报道的风险。
  • 预测市场与新闻操纵: 事件揭示了预测市场可能被用于操纵新闻报道,并对记者造成压力。
  • 法律监管: 强调了对预测市场进行更严格的法律监管的必要性,以防止操纵和滥用。

Fabian 认为,此次事件表明,记者可能会因为被承诺获得赌注奖励而进行不正当行为。他希望这种令人不安的新局面不会发生,并且希望预测市场、新闻和犯罪行为之间能够保持清晰的界限。

Nasdaq's Shame

纳斯达克指数规则变更:对被动投资者的潜在影响 (Nasdaq Index Rule Changes: Potential Impact on Passive Investors)

这篇文章主要讨论了纳斯达克交易所(Nasdaq)正在考虑对纳斯达克100指数(Nasdaq-100 Index)的规则进行修改,以及这些修改可能对被动投资者产生的影响。作者认为,这些修改实际上是为了迎合SpaceX上市的需求,并可能导致财富从普通零售投资者的退休账户转移到公司内部人士和早期投资者的口袋里。

主要观点:

  • 尾部驱动犬: 过去,指数投资是一种低成本的方式,让投资者可以跟随主动基金经理的选股(价格发现)。但现在,情况反过来了,指数的构成决定了市场结构,而非反映市场价格。
  • SpaceX的影响: 为了赢得SpaceX的上市,纳斯达克正在考虑修改规则,允许SpaceX迅速进入纳斯达克100指数。SpaceX的估值高达1.75万亿美元,这将对纳斯达克交易所产生巨大的吸引力。
  • “快速进入”规则: 新规则允许市值排名前40的公司在上市后仅15个交易日即可加入指数,且免除标准的流动性要求。
  • 低流通股的5倍权重倍增: 对于流通股低于20%的公司,纳斯达克计划将权重乘以5倍,最高可达100%。这意味着即使流通股占比很小,公司在指数中的权重也会被显著放大。文章举例说明,如果SpaceX仅有5%的股份公开流通,其指数权重将达到25%,相当于一个4380亿美元的公司。
  • 锁定期的幻觉: 尽管公司有锁定期限制,但纳斯达克修改指数规则会导致被动基金在公司上市初期就不得不购买大量股票,形成人为的供需扭曲。
  • 季度再平衡: 纳斯达克将会在季度再平衡时更新流通股比例。当公司的流通股比例达到20%时,权重将恢复到100%。这为公司提供了操纵股价的机会,例如在锁定期到期前故意压低股价,然后在到期后利用指数基金的强制购买力量推高股价。
  • 天王星和金星的巧合: SpaceX计划在6月中旬上市,作者认为这可能与纳斯达克的季度再平衡日期有关,并且公司可能故意利用“天王星和金星的对齐”作为幌子。
  • 被动基金的被迫购买: 最终,作者认为这些规则变更将导致被动基金被迫以高价购买股票,并为公司内部人士提供获利的机会。

总结:

作者认为,纳斯达克的规则修改是为了迎合SpaceX上市的需求,并可能对被动投资者造成不利影响。通过修改指数规则,纳斯达克将允许公司在上市初期迅速进入指数,并获得被动基金的强制购买,从而人为地抬高股价,最终导致财富转移。作者提醒投资者保持警惕,不要盲目追随指数基金,并进行自己的独立研究。


AirPods Max 2

AirPods Max 2 总结

AirPods Max 2 是一款专为 H2 芯片优化的头戴式耳机,旨在提供终极的个人聆听体验。以下是其主要功能和特点:

音频体验:

  • 自适应均衡 (Adaptive EQ): 针对耳垫的贴合度和密封性进行调整,提供更一致的聆听体验,适应不同的佩戴方式和耳部几何结构。
  • 高保真音频: 内置麦克风测量用户听到的声音,并实时调整,提供更丰富、更忠实的声音,涵盖更高频率。
  • 无损音频与低延迟: 通过 USB-C 连接时,支持无损音频和超低延迟,完美还原原始录音,适用于电影、音乐和游戏。
  • 个性化空间音频: 采用内置陀螺仪和加速计,结合 iPhone、iPad、Mac 或 Apple TV 追踪头部运动,提供动态头部追踪的个性化空间音频体验,营造影院般的环绕声效果。
  • 实时翻译 (Live Translation): 通过 Apple Intelligence 提供实时翻译功能,只需按住聆听模式按钮即可轻松进行跨语言交流。
  • 对话感知 (Conversation Awareness): 当用户开始说话时,自动降低音量并放大前方声音,方便交谈。
  • 响度降低与个性化音量: 自动降低响亮的外部声音,同时保持音质。个性化音量功能会学习用户在不同环境下的音量偏好。

主动降噪与环境模式:

  • 改进的主动降噪: 借助 H2 芯片,降噪效果提升高达 1.5 倍,有效抑制更多不必要的噪音,同时不影响音质。
  • 自适应音频 (Adaptive Audio): 自动调整降噪级别,适应不同环境,例如安静的办公室或嘈杂的咖啡厅。
  • 透明模式 (Transparency Mode): 允许外部声音进入,方便用户与周围环境互动。

其他特性:

  • 电池续航: 开启主动降噪时,单次充电可提供长达 20 小时的聆听时间。配合充电盒使用,可延长至 24 小时。
  • 智能保护盒: 配备智能保护盒,支持 MagSafe 充电和 Qi 认证充电器,并带有挂绳环和寻物扬声器。
  • 防尘、防汗、防水: 具备 IP57 级防尘、防汗和防水性能。
  • Siri 集成: 支持语音隔离、嘿 Siri 以及 Siri 交互。

总结:

AirPods Max 2 是一款功能强大的头戴式耳机,通过 H2 芯片和一系列创新技术,提供卓越的音质、强大的降噪能力、个性化的空间音频体验和便捷的智能功能,旨在为用户带来极致的个人聆听享受。

Grandparents are glued to their phones [video]

总结:关于老年人使用数字设备及其引发的家庭担忧

根据《大西洋月刊》的一篇文章,作者Charlie Warzel探讨了老年人越来越多地使用数字设备这一现象,以及年轻一代对此日益不安的感受。

文章主要探讨了以下问题:

  • 现象: 老年人花费在数字设备上的时间显著增加。
  • 担忧: 年轻人对老年人使用数字设备的情况感到担忧。
  • 核心问题: 这种担忧是否值得?或者年轻人的焦虑是否仅仅是将自身的屏幕时间焦虑投射到他们的父母和祖父母身上?

文章通过采访Charlie Warzel,深入探讨了这一现象背后涉及的家庭关系、科技以及老年人孤独感等复杂问题。

Animated 'Firefly' Reboot in Development from Nathan Fillion, 20th TV

《萤火虫》动画剧集正在早期开发!

以下是关于《萤火虫》动画剧集开发情况的总结:

  • 项目概要: 一部《萤火虫》动画剧集正在20th Television Animation的参与下早期开发,由Nathan Fillion的制作公司Collision33与20th Television Animation合作。
  • 主创团队: 编剧制作人Tara Butters(曾参与《神盾局特工》、《小岛秀夫》)和Marc Guggenheim(曾参与《绿箭侠》、《闪电侠》)将首次合作担任本剧的编剧。目前已经完成了剧本,并与荣获奥斯卡和艾美奖的动画工作室ShadowMachine合作开发了概念艺术。
  • 故事背景: 动画剧集的故事设定在原剧(2002)与电影《星河战队》(2005)之间的时间线。
  • Joss Whedon的参与: Nathan Fillion表示已获得Joss Whedon(《萤火虫》原作者)的许可,进行此次动画剧集的开发。
  • 演员阵容: Nathan Fillion与Alan Tudyk的播客节目“Once We Were Spacemen”的现场录制活动上,宣布了该消息。 参与宣布的还有Gina Torres、Jewel Staite、Morena Baccarin、Sean Maher和Summer Glau等原剧演员。
  • 预热活动: 在宣布前,Nathan Fillion及其他演员们在社交媒体上进行了为期一周的预热活动,暗示即将有《萤火虫》相关的新闻发布。
  • 后续计划: 该项目预计很快将会面向潜在买家推介。

Starlink Mini as a failover

星链 Mini 作为家庭网络备份连接的体验总结

本文记录了作者使用星链 Mini 作为家庭 FTTP 连接的备份方案的体验,并重点介绍了相关的配置和注意事项。

核心内容:

  • 星链 Mini: SpaceX 的小型便携式卫星天线,可设置为“待机模式”,每月费用仅 4.5 英镑。
  • 待机模式: 允许用户随时恢复全带宽服务,并提供 500kbps 的无限低速数据流量,足以支持 Google Meet、FaceTime、Claude 和低画质 Netflix 等应用。
  • 硬件成本: 星链 Mini 售价 159 英镑,相较于同等功能的 4G/5G 备份方案更具优势,且不受移动网络覆盖范围限制。
  • 性能表现: 延迟表现良好,平均 26ms,峰值可达 65ms。软件更新后平均功耗约为 13W。
  • UniFi 集成: UniFi Dashboard 增加了对障碍物和天线延迟的显示功能。
  • 新服务: 星链推出了 100Mbps、200Mbps 和“Max” (400Mbps+) 等速率的宽带计划,并提供免费的星链 Mini 以订阅“住宅 Max”计划。
  • IPv6 配置: 使用星链 Mini 需要在 UniFi 设备上进行 IPv6 配置,具体步骤如下:
    • 将 WAN 设置为手动模式,启用 IPv6,并设置 IPv6 连接为 SLAAC。
    • 禁用自动前缀委派,并将前缀委派大小设置为 56。
    • 由于 UniFi 存在 bug,需要通过 SSH 手动添加默认 IPv6 路由,通过 TCP dump 获取路由器广播地址并添加路由。
    • 需要注意的是,此修复方案在 UniFi 固件更新后会失效,建议创建启动脚本以自动添加路由。
  • 自动故障转移: UniFi 支持将星链配置为 WAN2,并设置负载均衡和故障转移优先级,实现自动故障转移。
  • 离网应用: 星链不受本地基础设施影响,在停电情况下仍可提供网络连接。

总结:

作者认为星链 Mini 作为家庭网络备份连接方案非常实用,尤其是在停电情况下。虽然 IPv6 配置较为复杂,但通过手动配置或创建启动脚本可以解决。

'Pokémon Go' players unknowingly trained delivery robots with 30B images

《宝可梦Go》数据助力外卖机器人精准配送:一篇总结

本文介绍了《宝可梦Go》游戏的数据如何被重新利用,用于帮助外卖机器人进行精准配送。

核心内容:

  • 《宝可梦Go》与外卖机器人合作: Niantic Spatial(《宝可梦Go》开发团队)与Coco Robotics(外卖机器人制造商)合作,利用Niantic的视觉定位系统(VPS)技术,提升机器人配送的精准性和可靠性。
  • VPS技术: VPS是一种导航工具,可以通过分析周围建筑物和地标来定位,精度可达厘米级别。该模型训练使用了超过300亿张《宝可梦Go》用户拍摄的照片。
  • 数据来源: 这些照片主要来自玩家在游戏中探索特定地点、扫描现实世界雕塑和地标(Field Research),以及参与“宝可梦对战竞技场”等活动。
  • 解决GPS问题: 传统的GPS在城市高楼林立的环境下容易受到干扰,VPS技术可以克服这一问题,提供更精确的定位。
  • 数据再利用的案例: 这并非数据被重新利用的唯一案例。例如,谷歌的验证码测试(CAPTCHA)可能被用于训练人工智能视觉模型,Waze的用户数据也被执法部门用于调查。
  • 持续更新的“活地图”: Niantic的目标是构建一个不断更新的“活地图”,配备VPS的机器人将收集更多数据,进一步提升模型的准确性,类似于Waymo和特斯拉等自动驾驶公司的数据收集方式。

总结:

文章指出,《宝可梦Go》游戏产生的大量用户数据,如今正被用于解决外卖机器人配送的实际问题,展现了众包数据的巨大价值和潜在用途。未来,随着VPS技术的不断完善和数据积累,外卖机器人将能够更准确、更高效地完成配送任务。

Lazycut: A simple terminal video trimmer using FFmpeg

LazyCut 总结

LazyCut 是一个基于终端的视频剪辑工具,旨在方便用户在命令行中进行视频剪辑操作。

核心功能:

  • 标记起始点和结束点: 用户可以使用 LazyCut 标记视频的起始点 (in point) 和结束点 (out point)。
  • 导出剪辑: 根据标记的起始点和结束点,LazyCut 可以导出剪辑后的视频片段。
  • 宽高比控制: 允许用户在导出剪辑时控制视频的宽高比。

安装方法:

  • macOS: 使用 Homebrew 安装: brew tap emin-ozata/homebrew-tap 然后 brew install lazycut
  • Windows: 从 GitHub releases 页面下载预编译的二进制文件 (lazycut_X.X.X_windows_amd64.zip),解压并添加到 PATH 环境变量,或者直接运行。需要安装依赖项:ffmpeg 和 chafa。可以使用 winget install ffmpeg 安装 ffmpeg,或者从 ffmpeg.org 下载。可以使用 Scoop 安装 chafa: scoop install chafa
  • 从源代码构建: 克隆 GitHub 仓库 git clone https://github.com/emin-ozata/lazycut.git,进入目录 cd lazycut,然后运行 go build./lazycut video.mp4

使用方法:

使用命令 lazycut <video-file> 打开视频文件进行剪辑。

快捷键:

操作
Space 播放/暂停
h / l 快进/快退 ±1s
H / L 快进/快退 ±5s
i / o 设置起始/结束点
Enter 导出
? 帮助
q 退出

重复计数: 支持重复计数,例如 5l 表示快进5秒。

Stop Sloppypasta

Okay, I'm ready. Please provide the content you want me to summarize. I will do my best to generate a concise and accurate summary in markdown format and Chinese, adhering to the specified constraints. Just paste the text here.

What is agentic engineering?

代理工程:利用编码代理进行软件开发概述

本文介绍了代理工程这一新兴实践,即在开发软件时借助编码代理的辅助。

什么是编码代理? 编码代理是能够编写和执行代码的代理,例如 Claude Code、OpenAI Codex 和 Gemini CLI。

什么是代理? 代理,尤其是在大型语言模型(LLM)如 GPT-5、Gemini 和 Claude 的语境下,是指通过循环调用工具来达成目标的软件。 对于编码代理,这些工具包括一个能够执行代码的工具。 代理接收用户的目标描述,生成并执行代码,直到目标达成。 代码执行是代理工程得以实现的关键能力。

代理工程的核心内容:

  • 人类工程师的角色转变: 编码不再是软件工程师的唯一任务,更重要的是确定需要编写的代码内容,以及选择合适的解决方案,并根据具体情况进行权衡。
  • 有效使用编码代理: 需要为代理提供合适的工具,明确定义问题,并验证和迭代结果,确保代码的健壮性和可信度。
  • 学习与改进: LLM 本身不会从错误中学习,但编码代理可以通过更新指令和工具集来学习和改进。
  • 目标: 代理工程旨在帮助我们承担更具野心的项目,从而产生更多、更高质量的代码,解决更具影响力的难题。

“氛围编码” (Vibe Coding) 的区别:

“氛围编码”一词由 Andrej Karpathy 提出,指在使用 LLM 编写代码时,忽略代码本身,将其视为原型质量的、未经审查的代码。 代理工程强调的是将 LLM 生成的代码提升到生产级别的标准。

本指南的定位:

Agentic Engineering Patterns 是一个持续更新的指南,旨在识别和描述能够获得实际成果的代理工程模式,并尽可能地保持其长期有效性。 内容会随着新技术的出现而不断添加和更新。 本指南的目标是提供关于如何有效利用这些工具的实用指导。

Cannabinoids remove plaque-forming Alzheimer's proteins from brain cells (2016)

大麻素可能清除阿尔茨海默病斑块蛋白:初步实验室研究

2016年6月27日

主要内容:

加州拉荷亚 - 索尔克研究所的科学家们发现初步证据表明,四氢大麻酚 (THC) 以及大麻中发现的其他化合物,可以促进细胞清除淀粉样β蛋白,这是一种与阿尔茨海默病相关的毒性蛋白。

研究发现:

  • 实验室研究: 该研究是在实验室培养的人类神经元中进行的。
  • THC的作用: THC 降低了神经元中淀粉样β蛋白的水平,并消除了淀粉样β蛋白引起的神经元炎症反应,从而使神经元得以存活。
  • 炎症与神经元死亡: 研究表明,高水平的淀粉样β蛋白与细胞炎症和更高的神经元死亡率相关。
  • 内在机制: 科学家们发现,大脑细胞自身产生的类似大麻素的化合物可能参与保护细胞免于死亡。大脑细胞拥有受体,可以被内源性大麻素激活,而THC的作用机制与内源性大麻素相似。
  • 与J147药物的关联: 索尔克研究所的另一项研究发现了一种阿尔茨海默病候选药物 J147,该药物也能清除淀粉样β蛋白并减少炎症,正是对 J147 的研究促使科学家们发现了内源性大麻素在清除淀粉样β蛋白和减少炎症中的作用。

阿尔茨海默病背景:

  • 阿尔茨海默病是一种进行性脑部疾病,会导致记忆丧失并严重损害患者的日常生活能力。
  • 据美国国家卫生研究院称,阿尔茨海默病影响了超过五百万美国人,是死亡的主要原因,也是最常见的痴呆症类型,预计在未来50年内发病率将增加三倍。
  • 淀粉样β蛋白在脑细胞中积累,是阿尔茨海默病标志性斑块的主要成分。

研究团队:

  • 索尔克研究所细胞神经生物学实验室教授 David Schubert 是该论文的资深作者。
  • Antonio Currais 是 Schubert 实验室的博士后研究员,也是该论文的第一作者。
  • 其他作者包括来自加州大学圣地亚哥分校的 Oswald Quehenberger 和 Aaron Armando;以及索尔克研究所的 Pamela Maher 和 Daniel Daughtery。

研究支持:

该研究得到了美国国家卫生研究院、Burns 基金会和 Bundy 基金会的资助。

重要声明:

该研究结果是在探索性实验室模型中获得的,THC 类似化合物作为治疗手段需要进行临床试验验证。


中文翻译说明:

  • 对原文进行了精简和结构化,突出关键信息。
  • 使用准确的医学术语,并对一些专业名词进行了解释。
  • 保留了原文的关键数据和结论,并确保信息准确无误。
  • 避免了个人意见和推测,只陈述原文内容。
  • 语言流畅,符合中文表达习惯。
The Linux Programming Interface as a university course text

TLPI 在大学课程中的应用调查

作者正在进行一项调查,旨在了解其著作《Linux Programming Interface (TLPI)》在大学课程中的应用情况,并以此为基础改进未来版本,使其更适用于大学教学。

核心要点:

  • TLPI 的意外应用: 虽然作者最初并未针对大学市场撰写 TLPI,但越来越多的大学教师将其用作 Linux 或 UNIX 系统编程课程的必读教材或推荐阅读材料。
  • 调查目的: 作者希望收集更多关于 TLPI 在大学课程中使用的具体细节,以便为未来版本提供改进方向。
  • 邀请参与: 作者诚挚邀请正在使用 TLPI 作为教材的大学教师通过邮件联系,分享他们的经验和反馈。
  • 调查问题: 作者特别感兴趣以下问题的答案:
    1. 机构名称和网址
    2. 课程大纲
    3. 课程级别(例如:三年级、四年级等)
    4. 课程学生人数
    5. TLPI 是作为必读教材还是推荐阅读材料使用
    6. 您认为 TLPI 在作为大学教材方面有哪些可以改进的地方?(提供详细反馈越好)

总结:

作者希望通过本次调查,更好地了解 TLPI 在大学教学中的实际应用,并根据教师的反馈进行改进,从而使其更适合大学课程使用。

Apideck CLI – An AI-agent interface with much lower context consumption than MCP

AI 代理的上下文膨胀问题:为什么 CLI 可能是最佳解决方案

本文探讨了在构建 AI 代理时,使用 MCP (Multi-Connector Platform) 架构面临的上下文膨胀问题,并提出了 CLI (Command Line Interface) 作为一种更有效的替代方案。

问题:MCP 上下文膨胀

将 GitHub、Slack、Sentry 等工具集成到 AI 代理中时,仅仅工具的定义就可能占用大量上下文窗口空间。例如,即使使用 Claude 的 200k 上下文窗口,仅仅 40 个工具的定义就可能占用超过 25%。每个工具的描述、JSON 模式、字段说明、枚举和系统指令都需要消耗 550-1400 个 tokens。一个拥有 50 多个端点的 SaaS 平台,其工具描述可能需要 50,000+ tokens,几乎没有空间用于实际的对话、文档检索和推理。

一些团队报告称,3 个 MCP 服务器消耗了 200,000 tokens 中的 143,000,即 72% 的上下文空间被工具定义占用。这使得在剩余的 57,000 tokens 中构建有用的功能变得困难。David Zhang 甚至彻底移除了他们的 MCP 集成,因为上下文限制导致了不可接受的权衡。

Scalekit 的基准测试显示,与 CLI 相比,MCP 使用的 tokens 数量增加了 4 到 32 倍。最简单的任务(检查仓库语言)使用 CLI 消耗 1,365 tokens,而使用 MCP 消耗 44,026 tokens。

三种应对方案

  • MCP + 上下文压缩: 压缩模式、按需加载工具定义、将 OpenAPI 规范拆分成小块。适用于小规模、明确定义的交互,但需要额外的基础设施。
  • 代码执行(Duet 方式): 代理像开发者一样,阅读 API 文档、编写代码、运行并保存脚本。适用于需要复杂工作流的长期工作区代理,但存在安全风险。
  • CLI 作为代理接口: 提供 CLI 接口,代理通过 --help 命令逐步发现 API 功能。

CLI 的优势

  • 渐进式信息披露节省 tokens: 代理只需要 80 tokens 的引导信息,并在需要时动态加载功能,例如:
    • apideck --list (列出可用 API)
    • apideck <api> --list (列出 API 资源)
    • apideck <api> <resource> <verb> --help (获取操作帮助)
  • 可靠性: CLI 运行在本地,避免了远程服务器超时等问题。Scalekit 的基准测试显示,MCP 调用 GitHub Copilot 服务器的失败率高达 28%。
  • 结构化安全: CLI 通过代码中的权限分类来保护数据,而不是依赖于 prompt 指令。
  • 通用兼容性: CLI 可以在各种代理框架中使用,无需特定框架的支持。

适用场景与限制

  • MCP 更适合高频次、紧密定义的工具。
  • 代码执行更适合需要复杂、状态型工作流的场景。
  • CLI 在需要流式和双向通信时表现较弱。
  • MCP 在处理多用户场景时,可以更好地管理身份验证和权限控制。

对 API 提供商的建议

  • 考虑 API 规范的大小,并提供渐进式信息披露的 API 设计。
  • 确保 API 的输出格式对机器友好。
  • 强化 API 的结构化安全。

总而言之,虽然 MCP 和代码执行在特定场景下有优势,但 CLI 凭借其 token 效率、可靠性和结构化安全,成为了构建 AI 代理的更具实用性的选择。

Federal Right to Privacy Act – Draft legislation

隐私保护法案:应对日益严重的隐私侵蚀

问题:隐私的日益侵蚀

当前社会,个人隐私正面临日益严峻的威胁。大多数人并不知道自己的生活数据被收集、关联、出售、评分和存储的程度。 汽车可以成为移动遥测设备,学校拥有大量数据,包括健康记录、出生证明、视频和照片,且这些数据往往存储在不可靠的供应商手中。 公司可以收集个人行踪、习惯、设备、家庭、购买记录和日常活动,从而预测个人的去向、人际关系、恐惧和未来行为。 个人信息已从简单的姓名和城市公开,扩展到包含大量数据的影子档案,其规模超乎想象。

这种趋势正在恶化。 过去,在公共场合拍摄照片的可能性极低,但现在,车牌识别系统可以将正常的出行记录转化为可搜索的行动历史。 监控公司正在抓取和编目人脸图像,以及这些照片的拍摄地点和时间。 个人正在构建包含庭院标语、保险杠贴纸等旨在表达社区意愿的数据集,而这些信息不应被用于建立数据库。 政府可以通过购买经纪人处的数据,绕过原本需要搜查令的合法程序。 这些系统共同构成了一个不断增长的个人生活档案,可能被公司、数据经纪人、承包商和政府利用。

这种做法违背了美国的价值观。 美国是一个自由之国,而非被监视之国。 沃伦和布兰戴斯认为,最严重的伤害并不总是身体上的。 法律正确地谴责对身体的侵犯——电池。 它同样应该谴责对个人隐私的侵犯,对心灵的扰乱,暴露带来的羞辱,以及缓慢盗取“独处权”的权利。

解决方案:综合隐私保护法案

该法案旨在对监控、隐蔽收集、强制性“同意”、数据经纪人交易以及政府规避合法程序(在自由与犯罪证据之间取得平衡)进行严格限制。 它旨在恢复基于规则的保护措施,这些措施人们可以理解,法院可以执行。

该法案的主要内容包括:

  • 禁止广泛的商业监控,并严格限制数据经纪人活动。
  • 赋予个人对其数据的控制权,并为儿童、医疗、生物特征、遗传和位置数据提供保护。
  • 保护虐待和家庭暴力受害者,允许其移除个人图像。
  • 实施“选择加入”机制,例如“此通话可能会被录音”的明确提示。
  • 限制政府使用无人机。
  • 禁止强制上传身份信息,除非存在更安全的替代方案。
  • 更新 CAN-SPAM 法案,允许用户一键删除电子邮件地址。
  • 为汽车蜂窝连接提供物理和数字开关。
  • 限制政府购买私营部门数据。
  • 阻止私营部门建立可搜索的包含车牌、庭院标语和其他表达意愿数据库。
  • 要求采用本地优先的监控架构,而不是云托管的大规模跟踪。
  • 为州机动车管理局 (DMV) 建立框架,使其能够在身份证上包含双因素身份验证和数字身份信息。
  • 要求使用社会安全号码进行身份验证,以防止欺诈。
  • 控制美国邮政系统的垃圾邮件。
  • 制定 TOTP(基于时间的一次性密码)启发式的数字车牌框架。
  • 制定监控摄像头安全标准,并要求企业通知用户正在使用该标准。
  • 对侵犯者处以严重的民事诉讼和刑事处罚。

该法案强调了“最近的发明和商业方法引起人们对必须采取的下一步的关注,以保护个人,并确保个人获得法官库利所说的‘独处权’。”

行动呼吁

该项目仍在进行中。 鼓励人们审查草案,提出修改意见,并编写测试,通过 LLM 检查该法案在现实世界中的预期行为。

为支持该法案,建议:

  1. 联系 2 个人,并请他们联系 2 个人,解释隐私为何是人权,以及该法案的重要性。
  2. 致电您的代表和参议员, 敦促他们支持或发起《联邦隐私权法案》。
  3. 在此处签名, 让国会看到对具有实际效力的隐私法律存在真正的民众支持。

人工智能预测该法案进入国会众议院的

Kangina

坎吉納 (Kangina):阿富汗的传统水果保鲜技术

坎吉納 (Kangina),也称为冈吉纳 (Gangina),是阿富汗一种古老的传统水果保鲜技术,尤其用于葡萄。该技术源于阿富汗中部的农村地区和北部地区,当地居民无法进口新鲜水果,因此利用这种方法在冬季保存葡萄,商贩也用它来安全地储存和运输葡萄到市场销售。

技术原理与制作方法:

坎吉納是一种被动控制大气储存的形式。它通过泥土和秸秆制成的密封容器,限制空气、水分和微生物的流动,类似于塑料袋的作用。制作过程如下:

  • 使用泥土和秸秆制作两个碗状的半球体。
  • 将这些半球体在阳光下晒干。
  • 每个容器可装入1-2公斤无瘀伤的葡萄。
  • 用更多的泥土密封容器。
  • 将容器保存在干燥、阴凉的地方,避免阳光直射。

泥土的透气性允许氧气进入容器,保持葡萄的活性,同时二氧化碳浓度升高抑制葡萄的新陈代谢和真菌生长。泥土还能吸收多余的水分,防止细菌和真菌的滋生,从而延长葡萄的保鲜期,可保存长达六个月。常用的葡萄品种包括皮厚实的Taifi和Kishmishi品种。

历史与现代应用:

这种用泥土和秸秆储存葡萄的做法可以追溯到12世纪,安达卢西亚的农业学家伊本·阿wwam (Ibn al-'Awwam) 在其著作《农业之书》中记载了在玻璃容器或“牛粪碗”中分层堆放葡萄并用泥土密封的保鲜技术。

现代研究表明,坎吉納和聚苯乙烯泡沫箱是保存葡萄最有效的容器之一。尽管坎吉納容器沉重、笨重且容易吸收水分,但它仍然是一种经济实惠且环保的水果保鲜方式。

关键词: 阿富汗, 坎吉納, 葡萄, 水果保鲜, 传统技术, 泥土, 秸秆, 被动控制大气储存。

LLMs can be exhausting

使用 LLM 时的挑战与应对策略 (使用 Claude 和 Codex)

日期: 2026 年 3 月 15 日

本文记录了作者在使用大型语言模型 (LLM) (如 Claude 和 Codex) 编程时遇到的问题,以及如何克服这些问题以提高效率。作者发现,长时间使用 LLM 容易导致疲劳,从而影响提示词的质量,并最终导致效率下降。

主要问题:

  • 疲劳与提示词质量下降: 作者指出,精神疲劳会导致提示词质量下降,进而影响 LLM 的表现。
  • 反馈循环过慢和上下文冗余: 在处理大型文件解析等任务时,每次调整都需要重新解析,导致反馈循环过长。同时,任务所需的上下文量过大,导致 LLM 很快达到上下文压缩的临界点,影响其性能。
  • “认知外包”陷阱: 依赖 LLM 自动填充未定义的需求,是一种容易陷入的陷阱,因为 LLM 目前还无法完全胜任。

应对策略和“最佳实践”:

  • 避免“恶性循环”: 当作者不再享受编写高质量提示词的过程,或者感觉自己是在敷衍了事时,应及时休息。
  • 关注提示词的清晰度和信心: 编写提示词时,应明确期望的最终结果,并对结果充满信心。
  • 将反馈循环速度作为问题: 对于反馈循环过慢的情况,应将其定义为需要解决的问题。
  • 利用 LLM 优化反馈循环: 作者发现,可以利用 LLM 创建快速反馈循环,例如:
    • 与 LLM 讨论反馈循环速度问题,并明确目标(例如,小于 5 分钟)。
    • 提供失败案例,并要求 LLM 快速重现该案例。
    • 明确成功标准,例如: “重现此特定失败案例,并确保完成时间少于 5 分钟。可以尝试优化代码路径或省略不必要的代码。”
  • 借鉴 TDD (测试驱动开发) 的思想: 通过明确的成功标准和快速反馈循环,可以帮助 LLM 优化代码,减少上下文消耗,并提高效率。

结论:

作者认为,在使用 LLM 时遇到的问题,有时可能源于自身的能力不足。需要认识到疲劳的信号,避免陷入“认知外包”的陷阱。 关键在于明确问题,并利用 LLM 优化反馈循环,从而提高效率并节省调试时间。 最终目标是找到一种既能享受编写高质量提示词的过程,又能快速获得令人满意的结果的方法。

订阅:

文章末尾提供了订阅作者博客的链接。