I failed to recreate the 1996 Space Jam website with Claude
Claude 无法完美复刻 1996 年的 Space Jam 网站:一次实验与反思
这篇文章记录了作者尝试使用 Claude AI 模型复刻 1996 年 Space Jam 电影的官方网站的经历。作者是一位工程经理,拥有计算机科学学位,他希望通过 Claude 复制这个网站,以永久保存它。
实验背景:
- Space Jam 1996 网站是一个经典的早期网络设计案例,简单、色彩鲜艳,充满怀旧感。
- 作者提供给 Claude 的材料包括网站的截图和所有原始资源文件。
- 为了追踪 Claude 的工作流程和 API 调用,作者设置了一个中间人代理,记录了 Claude 与 Anthropic API 之间的所有交互。
实验过程与发现:
- 初步尝试与问题: Claude 能够生成一个大致相似的网站,但行星的轨道排列错误,呈现出近乎对称的菱形形状,而非原始网站的椭圆形。即使作者尝试引导 Claude 关注行星的轨道模式,并要求其解释推理过程,结果仍然不理想。
- Claude 的局限性: 作者发现 Claude 无法精确测量像素坐标,这限制了其在细节上的还原能力。Claude 能够识别行星的语义信息(例如,“行星 B-Ball”),但无法将其转化为精确的坐标。
- 工具辅助的尝试: 作者构建了各种工具来辅助 Claude 进行精确测量,包括网格叠加、像素坐标参考点、颜色差异比较和屏幕截图比较工具。然而,这些工具并没有改善结果,反而可能加剧了 Claude 的错误,因为它似乎会过度依赖自身生成的版本,而不是参考原始截图。
- 视觉编码的限制: 作者推测 Claude 使用的视觉编码方式将图像分割成 16x16 的小块,并将其转化为单一的嵌入向量。这导致 Claude 无法捕捉到像素级别的细节,从而难以准确还原网站的布局。
- 放大图像的尝试: 最后,作者尝试提供放大两倍的截图,希望增加每个行星所占的像素块数量,从而提高 Claude 的还原精度。然而,结果仍然不理想。
结论:
作者最终未能成功地使用 Claude 完美复刻 1996 年的 Space Jam 网站。他认为 Claude 在理解图像的语义信息方面表现良好,但在处理视觉细节方面存在局限性。作者推测 Claude 的视觉编码方式限制了其精确还原图像的能力。
作者的建议:
作者提出了几种可能的解决方案,包括将屏幕分割成多个区域进行处理、尝试更有效的提示工程,以及为 Claude 提供一个可以调整图像比例的工具。
总而言之,这篇文章记录了一次有趣的实验,揭示了当前 AI 模型在处理视觉细节方面的局限性,并强调了在尝试复刻复杂视觉内容时需要考虑的因素。