个人百科:利用数据和语言模型记录和重现生活点滴 (个人百科: 利用数据和语言模型记录和重现生活点滴)
这篇文章讲述了作者如何利用旧照片、口述历史和现代技术,构建一个个人百科全书,记录和重现自己以及家人朋友的生活点滴。
项目起源与早期阶段 (项目起源与早期阶段)
作者在整理祖母家的旧照片时,发现有1351张照片,涵盖了家族几代人的历史。为了还原照片背后的故事,作者与祖母进行了访谈,记录了她对照片的回忆,并将其整理成类似维基百科的页面。作者使用了MediaWiki软件搭建本地实例,并参考了2011年威廉王子和凯特王妃的婚礼维基百科页面作为参考。
数据积累与口述历史 (数据积累与口述历史)
作者在构建百科的过程中,积极寻求帮助,从 Reddit 上的 r/genealogy 社区获得了关于口述历史记录的建议和资源。通过与祖母及其他家庭成员的访谈,作者收集了大量信息,并利用音频转录和语言模型技术简化了编辑过程。
数字照片与语言模型的应用 (数字照片与语言模型的应用)
作者随后将目光转向存储在 Google Photos 中的数字照片和视频。利用照片的 EXIF 元数据(日期、时间、地理坐标等),作者尝试使用语言模型自动生成百科页面。
- Coorg 之旅: 作者将 625 张 Coorg(卡达加地区)旅行的照片输入 Claude Code,模型仅凭照片内容和时间戳,成功识别了地点并描述了行程细节。作者补充了个人回忆,进一步完善了页面内容。
- 墨西哥城之旅: 作者整合了照片、视频、Google Maps 定位数据、Uber 行程记录和 Shazam 音乐识别历史等多种数据源,利用 Claude Code 编写了关于墨西哥城之旅的百科页面。模型能够根据银行交易记录识别餐厅,根据视频分析识别足球比赛,并根据 Shazam 历史描述音乐氛围。
个人百科的诞生 (个人百科的诞生)
最终,作者将所有整理好的内容汇集在一起,打造了一个名为 whoami.wiki 的个人百科全书。该百科利用 MediaWiki 作为基础,使其能够像维基百科一样,通过链接将人物、事件和地点连接起来。
项目意义与开源发布 (项目意义与开源发布)
作者意识到,这个项目已经超越了简单的家族历史记录,而是一个结构化、可浏览的个人生活百科全书。 whoami.wiki 现在已开源发布,允许用户在自己的机器上运行,并使用任何语言模型来创建和编辑页面。作者强调,该项目不仅有趣,更重要的是,它帮助作者重新审视了自己和身边人的生活,发现了许多被遗忘的细节和珍贵的回忆。
总结 (总结)
该文章展示了利用现有数据(照片、视频、社交媒体消息等)和语言模型技术,构建个人百科全书的可行性。该项目不仅提供了一种记录和重现个人生活点滴的独特方式,更重要的是,它能够帮助人们重新审视过去,珍惜当下,并加深对家人和朋友的了解。