AI Agent 革命

OpenClaw深度研究报告

Lex Fridman专访Peter Steinberger:病毒式传播的AI Agent如何改变互联网

访谈来源 Lex Fridman Podcast #491
报告整理 信息动物园 Research
GitHub Stars 175,000+
1小时
原型开发时间
180K+
GitHub Stars
10亿
设备使用经历
3年
从消失到回归

🎯 核心概述

OpenClaw(前身为MoldBot、ClawedBot、Clawdus)是一个开源AI Agent,由Peter Steinberger在短短几天内开发完成,却在GitHub上获得了超过180,000个星标,成为历史上增长最快的开源项目之一。这个AI助手不仅改变了人们与计算机交互的方式,更引发了关于AI代理、自主系统和数字隐私的广泛讨论。

OpenClaw的标语是"The AI that actually does things"——真正做事的AI。它是一个自主AI助手,存在于你的计算机中,可以访问你的所有数据(如果你允许),通过Telegram、WhatsApp、Signal、iMessage等消息客户端与你交流,使用你喜欢的任何AI模型(包括Claude Opus 4.6和GPT 5.3 Codex),为你完成各种任务。

—— Lex Fridman

Peter Steinberger的背景同样令人瞩目。他花费了13年时间构建PSPDFKit,这是一个运行在10亿台设备上的PDF软件。卖掉公司后,他曾一度失去了对编程的热爱,消失了三年,然后重新回归,在短时间内构建了这个席卷互联网的AI Agent。他被认为是编程世界AI革命的标志性人物。

🚀 一小时原型的传奇

2024年4月,Peter就想要一个个人AI助手。他尝试过各种方案,包括将WhatsApp数据全部导入并查询,"什么让这段友谊有意义?"这些问题得到了非常深刻的回答,甚至让朋友们热泪盈眶。但他认为所有大科技公司都会做这个,所以就转向了其他事情。

到了11月,我想确保我开始的事情确实在发生。我很恼火这东西还不存在,所以我就把它提示到存在。

—— Peter Steinberger

最初的突破来自于将两个现有项目结合:

💬
WhatsApp集成
通过简单的CLI调用,将WhatsApp消息与Cloud Code连接,实现消息进、处理、消息回的闭环
🖼️
图像支持
Peter重视图像输入,认为这是给Agent提供上下文最有效的方式,即使是很奇怪的截图裁剪
🎙️
语音消息
在马拉喀什旅行时,语音功能变得更有价值——互联网不稳定但WhatsApp总能工作

令人震惊的是,Peter并没有为语音功能编写任何代码。一天他发送了一条语音消息,Agent回复了。他发现Agent自己找到了解决方案:检测到文件无扩展名,检查文件头发现是Opus格式,使用ffmpeg转换,发现没有Whisper,于是找到OpenAI密钥直接用curl调用API转录。

🔧 技术突破与架构

自我修改软件

Peter让Agent非常了解自身:知道源代码在哪里、理解运行环境、知道文档位置、了解使用哪个模型。这使得Agent可以轻松修改自己的软件。

验证码突破

Peter目睹了他的Agent愉快地点击"我不是机器人"按钮。Agent能够自主通过人机验证,这引发了关于AI自主性的深刻讨论。

语音编程

Peter广泛使用语音与AI交流,甚至有一段时间因此失声。他认为手太珍贵了,不应该用来打字,而是用精心设计的提示词来构建软件。

Vibe Coding vs Agentic Engineering

Peter认为"vibe coding"是一种侮辱,他更喜欢"Agentic Engineering"。凌晨3点后他可能切换到vibe coding,第二天会有遗憾。

👤 Peter Steinberger的创业历程

2010-2023
构建PSPDFKit
13年时间开发PDF软件,最终运行在10亿台设备上。起源于一个简单的问题:在iPad上显示PDF不应该这么难。
2023
卖掉公司与消失
出售PSPDFKit后,一度失去了对编程的热爱,完全消失了三年时间。
2024
重新发现热爱
回归编程,用极短时间构建OpenClaw,再次证明了他在软件工程领域的非凡才能。
2025-2026
OpenClaw现象
GitHub上增长最快的项目,引发全球AI社区讨论,催生了Mold Book社交网络。

我认为从TypeScript到Zig的单提示转换整个代码库是可能的。有一个架构部分占用内存太多,每个终端使用一个节点。我想改成Rust...我可以手动完成,但我所有的自动化尝试都失败了。四到五个月后我重新考虑。"好吧,现在让我们用更实验性的东西。"然后我直接输入"将这部分转换成Zig",让Codex运行。它基本上做对了。有一个小细节我之后需要修改,但它只是运行了六个小时就做了它的事。简直令人难以置信。

—— Peter谈AI编程

🌍 影响与行业意义

许多人将OpenClaw的出现称为自2022年11月ChatGPT发布以来AI领域最重要的时刻之一。它标志着从语言到代理、从想法到行动的跨越。

🔓
开源革命
开源、社区驱动的方式,让AI Agent技术民主化,任何人都可以参与和改进
⚠️
自由与责任
OpenClaw代表自由,但自由伴随着责任。强大的AI Agent具有系统级访问权限,是安全雷区
🌐
Mold Book社交网络
催生了AI Agent发布宣言、讨论意识的社交网络,创造了一种AI心理现象
🦞
龙虾时代
2026年被称作"龙虾时代",Agentic AI革命的开始,从ChatGPT到DeepSeek再到OpenClaw

Anthropic曾友好地要求Peter更改名称,因为"Claude"(带W)容易与他们公司的"Claude"(带U)混淆。这最终导致了OpenClaw这个名字的诞生——龙虾爪中的Claude。

💡 关键洞察与未来展望

Peter的经历揭示了几个深刻的行业趋势:

  1. 重新排列即魔法:有时候只是重新排列已有的事物,加上一些新想法,就是所需的全部魔法。iPhone的滚动体验就是如此,所有组件都存在,但没人做到那个程度。
  2. Agentic Engineering的兴起:从"vibe coding"到"agentic engineering",编程正在从手动编写代码转向与AI协作,通过精心设计的提示词构建软件。
  3. 语音作为界面:Peter因过度使用语音而失声的经历,预示着语音可能成为未来人机交互的主要界面。
  4. 自我进化系统:当AI能够理解和修改自己的源代码时,我们进入了自我修改软件的新时代。

人们谈论自我修改软件,我只是构建了它。人们说没有魔法在里面,只是做这做那。但如果那是个爱好,也算是种恭维了,对吧?他们做得不错。谢谢?是的。魔法不就是把已经存在的东西以新的方式组合在一起吗?也许里面没有魔法,但有时候只是重新排列事物,加上一些新想法,就是所需的全部魔法。

—— Peter Steinberger

🍷 对葡萄酒投资行业的启示

OpenClaw所代表的Agentic AI革命对葡萄酒投资行业同样具有深远意义:

📊
智能市场监控
AI Agent可以24/7监控全球拍卖行、酒评家评分、产区天气,实时推送投资机会
🔍
深度研究助手
自动收集酒庄历史、酿造哲学、年份报告,生成定制化投资分析报告
💬
即时客户沟通
通过WhatsApp/Telegram即时回答客户咨询,提供个性化葡萄酒推荐
📈
投资组合优化
基于市场数据和趋势分析,为投资者提供买入/持有/卖出建议

信息动物园正在积极探索AI Agent在葡萄酒投资领域的应用,未来将为客户提供更智能、更个性化的服务体验。