引言
在此前的文章中,我们多次阐述了对 AI Memes 现状以及 AI Agent 未来发展的观点。然而,AI Agent 赛道的叙事发展与迭代速度仍然相当惊人。从“Truth Terminal”上线、迎来 Agent Summer 至今不过短短两个月时间,AI 与加密结合的叙事几乎每周都在演变。最近,市场的关注点开始转向“Framework”类项目,它们主要由技术叙事驱动。在这块相对小众的细分领域中,过去几周里已出现多家市值超过 10 亿美元的独角兽项目,还带动了一种全新的资产发行范式:项目根据其 GitHub 代码仓库来发行代币,基于这些框架构建的 Agent 同样也能发行代币。框架成为核心,Agent 则是上层应用,类似于一种资产发行平台,但本质上却是 AI 时代下涌现的全新基础设施模式。我们该如何看待这一全新趋势?本文将从框架的角度出发,结合自身思考,对 AI 框架对加密行业意味着什么进行解读。
一、什么是框架(Framework)?
从定义上看,AI 框架是一个底层开发工具或平台,集成了一系列预构建的模块、库和工具,用于简化构建复杂 AI 模型的流程。通常包含数据处理、模型训练、推理预测等功能。简单来说,可以将它视作 AI 时代的操作系统,类似于桌面端的 Windows、Linux,或移动端的 iOS、Android。每种框架都有自己的优缺点,开发者会基于需求来选择。
虽然“AI 框架”在加密圈仍是个相对新鲜的概念,但其发展在传统 AI 社区里可追溯至 2010 年的 Theano,已有近 14 年历史。谷歌的 TensorFlow、Meta 的 PyTorch、百度的 PaddlePaddle、字节跳动的 MagicAnimate 等都是当今学界和业界广泛使用的成熟框架,各自都在不同场景下有相应优势。
当前在加密领域涌现的 AI 框架项目,则基于 AI 热潮下对大量 Agent 的需求,又进一步分化到加密中的其他赛道,最终形成各自针对特定子领域的 AI 框架。我们先了解几款业内主流框架,以此更直观地说明。
1.1 Eliza
首先是由 ai16z 推出的 Eliza,一个多 Agent 仿真框架,旨在创建、部署并管理自治式 AI Agent。其主要编程语言是 TypeScript,优点在于兼容性良好,API 集成难度更低。根据官方文档,Eliza 更偏重社交媒体场景,提供对多平台的支持。它有完备的 Discord 集成功能(含语音频道),也可对接 X/Twitter 与 Telegram,能够进行直接的 API 调用。在多媒体处理层面,它能读取并分析 PDF 文档、提取与总结链接、进行音频转写、视频内容处理、图像分析与对话总结。
Eliza 目前支持四类应用场景:
- AI 助手类应用:客户支持 Agent、社区管理员、个人助理;
- 社交媒体角色:自动化内容创作者、互动机器人、品牌代言人;
- 知识型工种:研究助理、内容分析、文档处理;
- 互动角色:角色扮演、教育型导师、娱乐机器人。
当前可使用的模型包括:
- 开源本地推理模型:如 Llama3、Qwen1.5、BERT;
- OpenAI API 云端推理;
- 默认配置:Nous Hermes Llama 3.1B;
- 与 Claude 集成处理复杂查询。
1.2 G.A.M.E
G.A.M.E(Generative Autonomous Multimodal Entities Framework)是由 Virtual 推出的多模态 AI 框架,专注于游戏中的智能 NPC 设计。其特点在于,低代码甚至零代码的用户也可通过可视化试用界面,修改参数来设计 Agent。
在项目架构方面,G.A.M.E 采用了模块化设计,让多子系统协同工作。其详细结构如下:
- 代理提示词界面(Agent Prompting Interface):开发者交互界面,通过它可初始化会话并指定会话 ID、Agent ID、用户 ID 等;
- 感知子系统(Perception Subsystem):接收输入信息,并将其发送至策略规划引擎,同时处理对话模块的返回;
- 策略规划引擎(Strategic Planning Engine):框架核心,由高层规划(High-Level Planner)和低层策略(Low-Level Policy)组成。高层规划负责制定长期目标,低层策略则将规划转换为具体行动;
- 世界上下文(World Context):保存环境信息、世界状态及游戏状态,帮助 Agent 理解上下文;
- 对话处理模块(Dialogue Processing Module):负责处理消息与回复,产出对话或回应结果;
- 链上钱包运行者(On-Chain Wallet Operator):与区块链相关的应用,但具体功能尚不明确;
- 学习模块(Learning Module):根据反馈进行学习并更新 Agent 知识库;
- 工作记忆(Working Memory):存储近期行动、结果和当前规划等短期信息;
- 长时记忆处理器(Long-Term Memory Processor):根据重要度、新近度、关联度等指标提取并排序 Agent 的关键信息与工作记忆;
- 代理版本库(Agent Repository):保存 Agent 的目标、思考、经验和属性;
- 动作规划器(Action Planner):基于低层策略生成具体行动方案;
- 计划执行器(Plan Executor):执行由动作规划器生成的方案。
工作流程:开发者通过 Agent Prompting Interface 创建 Agent,感知子系统将输入交给策略规划引擎,后者结合记忆系统、世界上下文和 Agent 仓库进行规划并执行,学习模块对 Agent 的行为进行监控并实时调整。
应用场景:该框架主要聚焦虚拟环境中 Agent 的决策、反馈、感知以及个性等层面。除游戏外,在元宇宙领域也可应用。官方透露已有不少项目基于该框架构建。
1.3 Rig
Rig 是使用 Rust 编写的开源工具,旨在简化大语言模型(LLM)应用的开发工作,可提供统一接口让开发者方便地与多家 LLM 服务商(如 OpenAI、Anthropic)及多种向量数据库(MongoDB、Neo4j)交互。
关键特性:
- 统一接口:无论使用哪个 LLM 提供商或向量存储,Rig 均提供一致的访问方式,极大降低集成难度;
- 模块化架构:包含“服务提供商抽象层”“向量存储接口”“智能 Agent 系统”等关键组件,具备灵活性与可扩展性;
- 类型安全:基于 Rust 特性对嵌入操作进行类型安全校验,保证代码质量与运行时安全;
- 高性能:框架支持异步编程,内置日志与监控,方便运维与故障排查。
工作流程:用户请求先进入“服务提供商抽象层”,将不同提供商的差异做统一封装并进行统一错误处理。核心层中,智能 Agent 可调用各类工具或向量存储查询信息,最后采用 Retrieval-Augmented Generation(RAG)等机制综合文档检索和上下文理解,生成精准的回应返回给用户。
应用场景:适合搭建快速精准的问答系统,构建高效文档搜索工具,开发具备情境感知的聊天机器人或虚拟助理,乃至基于已知数据模式自动生成文本或其它内容的场景。
1.4 ZerePy
ZerePy 基于 Python 的开源框架,旨在简化 AI Agent 在 X(原推特)平台的部署与管理。其前身是 Zerebro 项目,沿袭了核心功能,但以更模块化、更可扩展方式设计,让开发者能轻松创建个性化 AI Agent,实现自动化任务、内容创作。
ZerePy 提供命令行(CLI)界面,方便用户管理、控制所部署的 AI Agent。其核心采用模块化设计,可集成的功能模块示例:
- LLM 集成:ZerePy 支持 OpenAI、Anthropic 等多家模型,让 Agent 能生成高质量文本;
- X 平台集成:与 X 的 API 直接对接,支持发帖、回复、点赞、转发等操作;
- 模块连接系统(Modular Connection System):容许开发者便捷添加对其它社交平台或服务的支持;
- 记忆系统(未来规划):当前版本还未完全落地,但目标是让 Agent 记忆以往对话与上下文,以生成更连贯、更具个性化的内容。
整体而言,ZerePy 与 a16z 的 Eliza 都致力于搭建与管理 AI Agent,但各自侧重点不同。Eliza 更偏向多 Agent 仿真及广泛 AI 研究,ZerePy 则专注在特定社交平台(X)的应用部署,具有更强的落地导向。
二、BTC 生态的“翻版”?
如果从发展路径看,AI Agent 与 2023 年底到 2024 年初的 BTC 生态颇为相似。BTC 生态的简要脉络是:BRC20-Atomical/Rune 等多协议竞争 — BTC L2 — 围绕 Babylon 的 BTCFi。AI Agent 虽然基于传统 AI 技术栈更成熟,但整体发展轨迹也体现出某种相似:GOAT/ACT — 社交型 Agent — 分析型 AI Agent 框架竞争。从趋势来看,围绕 Agent 的去中心化与安全性等基础设施项目,可能会接力这股“框架”浪潮,成为下一阶段重点。
那么,这条赛道会不会如 BTC 生态一样,最终陷入同质化与泡沫化?我认为不太会。首先,AI Agent 的叙事并不在于重走智能合约链老路;其次,无论现有 AI 框架类项目在技术方面是真材实料,还是 PPT 阶段、或者是简单的 Ctrl+C/V,好歹都给出了新基础设施思路。很多文章将 AI 框架比作资产发行平台,而将 Agent 比作“资产”。但我个人更倾向于认为,AI 框架对应着未来的“公链”,而 Agent 则对应未来的 DApp。
在今天的加密世界里,我们有成千上万条公链、数以万计的 DApp;通用链方面有 BTC、Ethereum 和各种异构链,应用链形态更是丰富,如游戏链、存储链、Dex 链等。公链与 AI 框架本质上有相似之处,DApp 则与 Agent 的角色高度对应。
所以,在“Crypto in AI”时代,生态很可能演变成这种形态,未来争论的焦点或将从 EVM 与异构链之争转向对“Framework”路线的讨论。当前更关键的问题是去中心化或“上链化”如何进行。我相信,未来的 AI 基建项目会围绕此基础继续演进。另一个重要问题是:把这套东西搬到区块链上,究竟意义何在?
三、上链的意义何在
不管区块链与什么结合,最终都会面临“有没有实际意义?”的问题。去年我就曾在文章中批评 GameFi 在基础设施进度上“跑偏”。在此前有关 AI 的文章中,也表达了对“AI + Crypto”当下落地价值的怀疑。毕竟,传统叙事驱动力的减弱已是大势所趋,而去年价格表现尚可的项目,往往能“硬扛”或超越行情。
AI 对 Crypto 有何帮助? 此前我只想到过 AI Agent 代替用户做任务、元宇宙、让 Agent 做“员工”之类比较常规但确实有部分需求的场景。可这些需求并不一定要全部上链,而且在商业逻辑上也难形成闭环。上篇文章提到的 Agent 浏览器虽可通过意图执行产生数据标注与算力需求,但这两点与区块链的结合并不紧密,而算力依旧是中心化占优。
回顾 DeFi 的成功,它能在传统金融中占据一席之地,是因为具备更高可及性、更好效率、更低成本与去信任安全。如果套用此框架,我推测 Agent 上链化或许在以下几方面有意义:
- 降低成本:Agent 上链化能否降低使用成本,从而实现更高可及性与更多元的选择?这或许终将使普通人也能享受到过去只有 Web2 AI 巨头才能提供的 AI“租赁”服务。
- 安全:从最简单的定义看,Agent 是能与现实或虚拟世界交互的 AI。如果能操纵我的虚拟钱包,那去中心化的区块链安全方案或许不可或缺。
- 区块链专属金融玩法:Agent 能否在链上形成一套独特的金融机制?如 AMM 模型中,LP(流动性提供者)让普通人参与自动做市,如果 Agent 需要算力或数据标注,用户可使用 USDT 投资这些协议,并凭对系统的信任来博取收益。或许针对不同场景的 Agent 会衍生出多种金融结构。
- DeFi 互操作性:DeFi 互操作性尚不完善,Agent 也许能通过透明、可追溯的推理过程来打通衔接,并填补目前的空白。
四、创造力?
未来的框架类项目还会提供类似“GPT Store”那样的创业机会。对普通用户而言,当前通过框架来启动一个 Agent 仍然较为复杂。不过,若能进一步简化构建过程,并组合更多复杂功能,这类框架将有不小竞争优势,也可能促成一种更有趣的 Web3 创造者经济,大大超越 GPT Store 的体验。
目前的 GPT Store 仍更偏向传统应用,爆款应用大多由 Web2 公司制作,收益也多由创作者“独占”。根据 OpenAI 官方说明,他们只是在美国范围内给优秀开发者提供资金扶持,额度有限。
从需求层面看,Web3 仍有大量空白,且在经济体系上也能让 Web2 巨头主导的政策变得更加公平。与此同时,我们可天然引入社区经济来进一步改善 Agent。围绕 Agent 的创造者经济,将为普通人提供更多参与机会。届时 AI Meme 会远比如今的 GOAT 或 Clanker 等 Agent 要更“聪明”、更有趣。
免责声明:本文提供的信息不是交易建议。BlockWeeks.com不对根据本文提供的信息所做的任何投资承担责任。我们强烈建议在做出任何投资决策之前进行独立研究或咨询合格的专业人士。