编者按:在这场 YC 最新 batch talk 中,YC 普通合伙人 Tom Blomfield 讨论的不是「如何用 AI 提高员工效率」,而是一个更底层的问题:当 AI 不再只是 Copilot,而是能够感知、决策、调用工具、接受反馈并自我修正时,公司本身应该被重新设计成什么样?
Tom 的核心判断是,传统公司仍然像「罗马军团」一样运转:信息依靠层级向上传递,命令依靠管理链条向下分发。但 AI 正在打破这一组织假设。真正重要的,不是让工程师多写 20% 的代码,而是把散落在邮件、Slack、会议、文档和人脑中的业务知识提取出来,变成 AI 可读取、可调用、可迭代的组织上下文。
在他看来,未来的 AI 原生公司会由一系列递归、自我改进的 AI loop 构成:系统从客户邮件、客服工单、产品数据中感知外部变化,再通过规则层、工具层和质量关卡执行决策,最后根据结果自动学习和修正。YC 内部已经在尝试类似机制:agent 不只是回答问题,还会监控哪些查询失败,判断是否需要新工具、新数据库或新索引,并自动提交代码、审查、合并和部署。也就是说,公司可以在创始人睡觉时继续优化。
这也意味着,AI 对公司的影响不会停留在工具层,而会进一步改变组织结构。Tom 提出「burn tokens, not headcount」——未来创业公司的瓶颈可能不再是员工数量,而是 token 使用、业务上下文质量和组织知识的可读性。中层管理承担的协调功能会被 AI 大幅替代,而 IC、直接负责人和能够与现实世界处理高风险判断的人类角色,将变得更加重要。
最值得关注的,不是 AI 让公司变得更高效,而是它正在改变「公司」这个组织形态本身。当软件可以临时生成、流程可以自动改进、经验可以被持续沉淀为公司大脑,创始人真正要构建的,可能不再是一支层级清晰的团队,而是一套能够持续学习和自我优化的智能系统。
以下为原文:
重写运转方式:公司不该再像罗马军团一样运转
这部分内容有一点基于 Diana 之前的一次演讲。周末那段视频已经上线了,非常精彩。另外,Jack Dorsey 大概两三周前发过一些推文,我觉得也很有意思,所以我「偷」了不少他的想法,塞进了这次分享里。
这场分享会比较概念化、比较高层次,主要是讨论我们应该如何重新思考公司建设。
罗马军团的设计,本质上是为了从罗马这个中心向外投射权力,覆盖两个大陆,甚至一直延伸到苏格兰附近的哈德良长城一带。它依靠的是一种嵌套式层级结构,每一层都有稳定的管理幅度。每一个层级都有明确的负责人,他们负责把命令向下传递,再把信息向上传回。
如果你观察今天大多数公司,会发现它们其实仍然像一支罗马军团:人是信息上下流动的通道。Jack Dorsey 那组推文里让我印象很深的一点是,我们一直默认,层级化组织就是组织经济价值单元的最佳方式。但我认为,AI 基本上正在打破这个假设。
一年前,如果你问大家 AI 有什么用,他们通常会谈「生产力」:比如 Copilot 让工程师效率提升 20%,把 Copilot 接入工作流,帮助团队交付更多软件。但我觉得,这其实是一种有问题的理解方式。这就像是在旧的工作方式上,装了一个更强大的引擎。真正值得思考的,不是如何给旧组织加一个 AI 工具,而是重新想象公司本身是什么、它该如何运转。
比如 Garry 刚才讲到的内容,我真的相信,他一个人现在能产出的代码,可能比一整个工程团队还多。真正让我一直在想的,是如何把公司内部的领域知识提取出来,并把它定义成上下文、技能集,或者任何你愿意称呼它的东西。
所谓领域知识、业务知识、know-how,原本散落在人脑里、Slack 消息里、邮件里、Notion 文档里。这些信息共同定义了你的公司如何运作。一旦你能让这些知识变得清晰、可读取,你就可以从层级化组织,转向一种由 AI 原生软件驱动的智能组织。
让公司在睡觉时变好:AI 闭环如何自动发现、修复和部署
AI 不是一个外挂在公司旁边的东西。它不只是给工程师用来提高效率的工具。我认为,我们可以把公司重新想象成一组递归、自我改进的 AI 循环。这个点非常重要,因为一旦公司走到这一步,它甚至会在你睡觉的时候持续自我优化。
举个例子。
Diana 在她的演讲里也提到过这个 AI loop。它首先有一个「传感器层」。这个词听起来很高级,但其实可以很简单:客户发来的邮件、客服工单、代码变更、用户取消订阅、产品遥测数据,这些都是传感器数据,用来从外部世界获取信息。
然后是策略层或决策层,也就是规则:AI 可以做什么,哪些事情必须请求人类许可,哪些操作必须记录。再往下是工具层,这有点像 Garry 提到的 skills 和 code,本质上是确定性的 API,例如查询数据库、查看日历等,也就是 AI 可以调用的一组工具。
接着是质量关卡,比如 Eva 提到的确定性检查、安全过滤,以及高风险事项的人类审查。最后是学习机制:系统与真实世界互动,发现自己哪里不起作用,然后把反馈重新送回循环的起点。
如果每一个步骤都能在没有人类干预,或只有极少人类干预的情况下运行,那么系统就会在你睡觉的时候变得越来越好。
我可以给你们一些我们现在实际运行中的例子。最开始,我们做了一个 agent,你可以向它提问,它有一些确定性工具,可以查询我们的数据库。比如一个很简单的问题:我上一次和这家公司做 office hours 是什么时候?
后来它变聪明了一点。比如我正在和某家公司做 office hours,他们需要认识石化行业相关的人。这个系统就可以用不同方式查询数据库,结合 RAG 等方法,找出五位相关创始人,推荐给你认识。
但这仍然只是一个 sidekick,一个助手型 agent。它还是去年那种 AI 使用方式:AI 让我作为 group partner 更有效率,让我的工作效率提升 20% 或 30%。
真正让我有「aha moment」的,是我们在这套系统之上加了一个监控 agent。它会查看每一位 YC 员工发起的每一个查询,判断哪些查询成功了,哪些失败了。然后它会问:为什么失败?怎样才能让这个查询成功?我们需要新的确定性工具吗?需要更新 skills 文件吗?需要一个新的数据库吗?需要新的索引吗?
这些事情现在真的会在夜里自动发生。它会写代码,提交 merge request 到 YC 的代码库,让另一个 agent 审查,然后合并、部署。于是第二天,当一个人类再来问同样的问题时,这个查询就能成功了。
对我来说,这才是关键时刻。它不只是让一个人类变得更有价值 20% 或 30%。而是 AI 自己走完了这个循环,找到了自我改进的方法。
我认为,如果你能识别出公司里哪些部分可以这样运转,并尽可能减少人类在其中的执行和监督角色,那么你就可以把 token 投入这个问题里,而公司本身会持续变好。
其他例子也很多。比如你有产品分析数据,就可以让一个 agent 分析产品数据,找出销售漏斗中摩擦最大的环节。它可以研究最佳实践,设置一个 A/B 测试,运行一周,选出表现最好的版本,然后部署上线。
这会一遍又一遍发生。你的产品就会拥有一个自我优化的产品循环。
客服也是一样。客户建议不断进来,你可以用一个 agent 来做分流。这个 agent 某种程度上像你的首席产品官和首席技术官,它要做判断:这个建议我们不想做,丢掉;但那个建议符合我们的路线图,可以今晚就完成。那就写代码、部署、上线,直接交付给客户,全程不需要人类介入。
所以,如果你能把公司每一个部分都看成一个自我改进的递归 AI 循环,它就会变成一种和「罗马军团式」层级公司完全不同的东西。
少堆人头,多烧 token:AI 原生公司会重塑组织结构
那么,如果你想这样做,它意味着什么?
第一点是:消耗 token,而不是堆人头。我们现在看到,很多公司到 Demo Day 时,人均收入已经比 18 个月前高出大约 5 倍。我认为这个趋势会继续延伸到 A 轮和 B 轮阶段。很快,你真正受限的不会是员工人数,而是 token 使用量。
现在最粗糙的做法,就是衡量每个人的 token 使用量。当然,这个指标在极端情况下很蠢,也很容易被游戏化。但方向上,我觉得它是对的。我们现在处在一个探索「到底什么是可能的」的阶段,所以每个人都应该最大限度地实验,看看这种疯狂的新智能到底能做什么。
一旦你把它做成排行榜,并且让晋升或解雇与这个指标挂钩,它当然会被刷,当然会失真。但从方向上说,搞清楚组织里谁在把 token 用到极致,谁没有,确实是判断你应该把时间花在哪些员工身上的一种方式。
我认为,中层管理结束了。至少对于这种协调问题来说,我不认为还需要中层管理,AI 应该来完成这件事。
对我来说,未来有两个重要角色。Jack Dorsey 提了三个,但我不太喜欢第三个,所以我删掉了。我认为真正重要的是两个角色:每个人都必须成为 IC,也就是个人贡献者、建设者、操盘手。并且关键在于,要有直接负责的个人。任何事情要推进,都需要一个明确具名的人负责,而不是一个委员会,也不是一群人。
我认为,公司完全可以建立在 IC 之上。中层管理真的结束了。而构建一家自我改进的公司,就是这个愿景。
顺便说一句,我觉得现在大家都还在这件事的最前沿。我也很想知道你们进展到哪里了。现在感觉所有人都还在探索边界。我不确定是否已经有人在每一个职能上都建立了真正自我改进的公司。也许我错了,你们可以证明我错了。
如果是我,我会先做什么?
第一件非常重要的事,是让整个组织对 AI 可读、可理解。这是什么意思?意思是你必须记录一切。
简单来说,现在我们所有 partner 的邮件,如果你给 YC partner 发邮件,这封邮件就会进入 YC 数据库。每一条 Slack 消息、每一条 DM、每一次 office hours,我们过去三四个月已经开始全部录音。所有发生的事情,只要被记录下来,对 AI 来说它就发生了;如果没有被记录下来,对你的智能系统来说,它就没有发生。
刚才我和一些创始人在这里聊天,我们聊了很多关于他们公司的好内容。每一次聊天我都会想,我真的应该把这段对话录下来。因为有个人刚才需要我帮他介绍一个人,现在我甚至已经记不清那个介绍对象是谁了。我当时答应了他说可以,然后又让他之后给我发邮件,因为我知道我肯定会忘,我接下来还要和 20 个人聊天。
所以,这件事可能需要靠手机、录音设备、智能眼镜,或者把每个房间都装上麦克风。总之,所有东西都需要被记录下来,这样 AI 才能读懂它。
然后,就像 Garry 说的,还需要做说话人分离和摘要整理。你不能把 10 万小时的录音直接塞进上下文窗口里。你必须把它们整理出来,聚合、压缩、提炼成重要部分,再给 AI 留下一些线索。
举个例子:你们有谁读过 YC 的用户手册?希望这个房间里每个人至少都打开过一次。没关系。那份手册大部分内容写于五到十年前,已经有点过时了。
上周末,Harsh 突然想到:既然我们过去三个月已经积累了大约 2000 小时的 office hours 录音,为什么不重新生成一版用户手册?
于是你可以给系统一组指令,先把录音整理、压缩、综合,再按照融资、招聘、联合创始人纠纷等主题分类,然后让它写一版新的用户手册。到周末结束时,他已经生成了一份 150 页的用户手册,质量明显好于现有版本。
更重要的是,现在我们可以每个月更新一次。于是我们的用户手册变成了一个自我改进的系统。每一条新的建议,都会和现有用户手册对比,要么被吸收进去,要么被丢弃。这样,用户手册就变成了一个持续更新的活的大脑,承载着我们每周给创始人的建议。
当然,它不会停留在用户手册这一层。你可以把它作为上下文输入给 AI agent。于是你突然就可以向一个超级智能 AI 提问,并获得 16 位 YC partner 的综合智慧。但前提是,这些知识必须对 AI 可读。所以你必须记录一切。
第二点其实类似:如果某件事能创造出一个可以自我改进的 artifact,并且能被 AI 读取,那就保留它;如果不能,就丢掉。
第三点是,每一个职能都应该能生成自己的软件。过去我们可能会说「仪表盘」,但现在不只是仪表盘,而是按需生成的软件。Codex 5.5 现在已经足够好,大多数简单的内部软件和仪表盘,你都可以一次性生成到相当高的质量。我周末用我们的一些内部东西试了一下,效果真的不可思议。
所以,所有内部运营团队都应该坐在这一层之上:拥有对业务的智能理解,然后自己生成仪表盘和工作流。
而且我会把这些软件视为完全可丢弃的东西。真正应该被非常珍惜地保存下来的,是数据。就像 Garry 说的,他把所有邮件都存成 Markdown,永远不丢弃任何东西。但软件本身是短暂的、临时的。你可以生成它,也可以重新生成它。
真正有价值的,是人脑里对业务的理解:这个职能是如何运转的,我们如何办一场 YC 活动,等等。至于真正用来执行活动的软件,你可以为这场活动生成一个,用完丢掉。一个月或两个月后,模型变得更聪明了,你就把旧软件扔掉,把原始指令重新给它,再生成一版新的软件。
所以我认为,有价值的是业务上下文和 skills。建立在它们之上的软件,是短暂的。
那么,在这个世界里,人类的作用是什么?
我认为,我们讨论的其实是一个「公司大脑」。我知道这个房间里有很多人正在做类似的东西。中间那一部分——你的所有数据、所有邮件、DM、技能、know-how——就是公司大脑。
人类则位于这个大脑的边缘,负责与真实世界交互。也就是说,人类是这个智能系统接触现实的地方。人类可以进入模型暂时还无法进入的场景。比如会议现场,或者一些新颖、复杂的情况。电话我本来想作为例子,但现在 AI 其实也很容易进入电话场景了。
更典型的是陌生情境、伦理判断、高风险时刻。比如一个创始人来找我们,说他正在考虑和联合创始人分开。这种真正高风险、高情绪浓度的时刻,你还是会希望有一个人类在场。
这就是人类的位置。对你们很多公司来说,销售对话也是如此。未来 20 年里,我认为销售现场仍然会需要一个人类在房间里。
所以,我认为人类会生活在公司大脑的边缘,负责把智能带到现实世界里。
我已经超时了,主持人可能快要把我拉下台了。最后我留给你们一个问题:如果你今天重新创办自己的公司,你会不会一开始就把它设计成这种形态?
你们大多数人公司还足够小,完全可以这样做。所以我觉得你们没有任何借口。而且我知道,现场也有几位正在拆掉并重建自己的公司。
那我就先讲到这里,把时间交给 Pete。谢谢大家。
[视频链接]
免责声明:本文提供的信息不是交易建议。BlockWeeks.com不对根据本文提供的信息所做的任何投资承担责任。我们强烈建议在做出任何投资决策之前进行独立研究或咨询合格的专业人士。