“Waymo 是公认的无人驾驶行业先驱者,如果你有异议,那我们暂时求同存异并保持微笑。”这是前 Waymo 员工夏飞在自己知乎专栏里写下的一句话。

  从最早期的 Waymo 华人第一人朱佳俊、小马智行北美负责人张一萌到轻舟系的于骞、侯聪、大方、汪堃、李栋,再到 90 后创业者高继扬和赵行,2009 年成立至今,Waymo 涌现出了几百位华人面孔。这群聪明、勤奋、嗅觉敏锐的人,成为十多年来中国智能驾驶以及具身智能的见证者与参与者。

  岁月如梭,斗转星移。当初与 Waymo 一同引领风骚的创业明星 Cruise、Argo AI、Motional 等等,或黯然下线、或委身他处,但 Waymo 仍在续写 L4 的江湖故事。

  分拆独立,走上正轨

  在 2016 年更名为 Waymo 之前,谷歌无人车内部一直用的是“chauffeur”这一名字(法语“司机”的意思)。

  Waymo 由谷歌X实验室孵化,跟总部不在一栋楼里。谷歌X最大的特点是,里面有很多造型奇特的硬件如机械臂、热气球、太阳能板。这栋楼的保密级别很高,谷歌的人无法进入。现在,这栋楼是 Deepmind 的人在办公,机器人团队也在其中。

  朱佳俊是 Waymo 最早期的五位创始人之一,本科毕业于复旦大学计算机系。

  在弗吉尼亚大学上学时,朱佳俊利用暑假来到 Google Street View(街景)团队实习。到了第三周,他就独立完成了一个新的基于计算机视觉的改进,并因此收获了自己在谷歌的第一份专利。

  此前,用户想接近一个特定街景,只能通过数次点击图中一个既定箭头,费时又费力;朱佳俊做出的“click-to-go”让图中任意点都能成为旅程起点。

  后来,朱佳俊在国际会议 SIGGGRAPH 上遇到了当时 Google Street View 团队的核心成员 Luc,朱佳俊与谷歌就此结缘。

  作为团队里的第一位华人,朱佳俊有着超乎年龄的成熟与老练。他写下了 Waymo 的第一版感知系统,在内部有着很高的地位。

  在 2016 年的架构融合前,感知和视觉是两个组。朱佳俊只负责感知,不负责视觉。除了感知,朱佳俊还领导仿真团队,仿真团队的名字叫“Crystal ball”(水晶球)。

  还有一个组名为 Magic,做的是视觉、预测和场景理解。这三部分任务都是要用机器学习去做,所以最早的机器学习不是应用在感知组,而是在 Magic 组。Magic 组的负责人是 Dave Ferguson,后来和朱佳俊一起创办了 Nuro。

离开 Waymo 的日子

(朱佳俊和 Dave Ferguson)

  2014 年,朱佳俊帮小组招募成员,他找到了谷歌搜索组的张一萌。

  硕士期间,张一萌在卡内基梅隆大学(CMU)的语言技术研究所。当时,计算机视觉(CV)比自然语言处理(NLP)更火,张一萌就找到了视觉领域专家陈祖翰教授,跟着他直到博士。陈祖翰教授现在是新加坡国立大学的常务副校长。

离开 Waymo 的日子

(张一萌)

  2012 年,张一萌获得计算机视觉和机器学习方向的博士学位,并加入谷歌。这一年,是人工智能的标志性年份,2024 年诺奖得主 Hinton 和其他两位作者发布的 AlexNet 在 ImageNet 挑战赛上一战成名,极大地推动了卷积神经网络(CNN)的发展。

  不过,此时的深度学习并没有在产业界引起大的波澜。张一萌回忆到,“我还在康奈尔的时候,AlexNet 还没有引起足够的讨论,效果远没有让人觉得可以应用在工业界。”

  张一萌当时所在团队的产品形态类似于 Zoom。当时,谷歌内部有很多这样创业性质的团队。遗憾的是,这个组的产品不太成功被高层取消,张一萌需要在公司里找其他项目。

  朱佳俊听到消息后主动找到了她,问:“要不要来了解一下无人车?”

  谷歌的无人车项目虽然从 2009 年就开始试水,但此时仍然是一个“Research Team”,离真正的产品比较远,算不上人人都想进的明星团队。

  但既然朱佳俊发出邀请,张一萌决定还是聊一聊。她问了朱佳俊一个问题:项目什么时候落地?

  朱佳俊回答:“两年,两年就可以对公众开放。”

  加入之后,张一萌才发现自己被“忽悠”了:无人车的办公室还没有原先的组规模大。感知团队只有 10 人左右,华人不多,早于张一萌加入的还有贾兆寅。

  贾兆寅是张一萌在康奈尔大学的师弟,后来在 2017 年加入滴滴任前沿业务技术负责人。贾兆寅是感知组的第一个 Manager,带了4-5 个人的小团队,被朱佳俊委以重任。贾兆寅走的时候,他的师妹江韵也一起离职。

  谷歌的精英文化,让这家巨头吸纳了诸多天才,包括 AI 大神——AlexNet 作者之一的 Alex Krizhevsky。当时,Alex 是从 Google Brain 被借调到无人车小组。

离开 Waymo 的日子

Alex Krizhevsky(中)

  Alex 是一个很特别的人。为了训练模型,他手写了一套深度学习框架——Cuda-Convnet。后来,贾扬清在美国加州大学伯克利分校读博士,看到了 Cuda-Convnet 爱不释手并且还找到了 Alex。虽然没有从 Alex 手上拿到代码,但这也促使贾扬清写出了日后大名鼎鼎的框架——Caffe。

  Alex 对于 Waymo 的贡献在于,帮助调试出了很多模型,最早的点云检测模型就是出自他手。

  2015 年 8 月,谷歌进行组织架构大调整,成立母公司 Alphabet,以广告为商业模式/盈利基础的成熟业务,包括 Search、Android、YouTube、Apps、Maps 和 Ads 被保留在谷歌旗下,诸多探索型业务则被划分到不同的实体继续推进,谷歌X实验室也就此成为 Alphabet 旗下的独立公司。

  站在高层角度来看,分拆 Waymo 是一个正确且必要的决定,既可以避免“追逐广告收入”的心态蔓延到 Waymo 优势项目,又可以寻求外部融资,给初创团队更多的股票和期权激励。

  不过,让谷歌高层没想到的是,早年间设立的一项激励计划却砸到了自己的脚。

  故事的起因是:为了留住技术人才,Waymo 曾经制定了一个薪资包,将薪酬分成四份。第一份在某一时间点发,如果能待到 2016 年年底、完成一些里程碑,就可以拿到剩下钱里的一大半。

  当时,Waymo 的项目估值 85 亿美元,谷歌拿出 45 亿美元当作奖金。谷歌的这一场造富运动,让很多人拿到数百万到数千万美元不等的回报,并且没有竞业协议的限制,这些钱成了 Waymo 元老们外出创业的底气。

  2016 年 1 月,时任谷歌无人车团队技术负责人的工程师 Anthony Levandowski 、谷歌地图原负责人 Lior Ron、硬件研发主管 Bryan Salesky、Dave Ferguson 和朱佳俊等人离职,这也让 waymo 有了持续半年左右的离职潮。

  8 月,谷歌无人车项目的灵魂人物——CTO Chris Urmson 离职。

离开 Waymo 的日子

  Chris Urmson 于 2009 年加入谷歌,当时谷歌尚未启动无人驾驶汽车项目,在他的带领下,谷歌确立了不要方向盘、不要刹车,开发完全自动驾驶的技术路线。Urmson 虽是 CTO 的头衔,却更多是以 CEO 的身份带领团队。

  但是,John Krafcik(原现代美国公司 CEO)的空降让 Urmson 不满,最终演变为 2016 年初 Urmson 和 Larry Page 大吵一架。在员工看来,作为接任者的 Krafcik 在内部的口碑并不差。Krafcik 有一头银发,非常有个人魅力。他永远都是站着办公,脚底下踩着一个平衡球。

  Urmson 走后,Dmitri Dolgov 接管了技术团队,成为了这支团队新的 CTO。轻舟联合创始人、前 CTO,现总裁侯聪回忆,Waymo 为了留住 Urmson,在一次全员会上专门给他过了一次生日。

  2016 年底拆分独立临近时,Waymo 在组织上做了一次大整合。

  被整合的有 ML(machine learning)组,这个组里分为 Reserach team、Infra team。后来,Reserach team 和视觉、感合并成了一个大的感知部门,从谷歌请了一个法国人做负责人;Onboard Infra、仿真、Offboard Infra,还有地图定位组成一个部门;决策、规划、控制、预测等划归在一个部门。

  三个部门直接向 CTO Dmitri Dolgov 汇报,而 Waymo 的技术风格、商业思维也越来越像一支正规军。

  侯聪 2013 年加入谷歌,2016 年加入 Waymo 后与张一萌做起了搭档,侯聪负责感知的系统开发。对于 Waymo 硬件能力的更新换代,他的感触最深。

离开 Waymo 的日子

  他回忆,从 2016 年起,Waymo 已经开始做第四代硬件,搭载了四个 GPU,算力得到大幅突破,很多模型(视觉、预测等)也开始跑起来。

  Waymo 沿袭了谷歌的做事风格,从软件到硬件力图全栈自研,雷达、激光雷达、相机、车载电脑这些都是由 Waymo 设计,交给台湾超恩、广达来代工。其中,广达和其他代工厂不一样的特点在于,不是使用车规级的相机,而是选择像素高的相机来保证整体效果。

  在具体数量上,第三代无人车的硬件约有 4 个摄像头,第四代增加到了 19 个摄像头,第五代硬件又猛涨到 30 个摄像头,被人称之为“武装到牙齿”。这些摄像头分布在车顶和车身的各个地方,通过红外线的方式检测盲区是否有行人。

  Waymo 和谷歌一直被外界贴以单打独斗、大包大揽、不计成本的标签,但其实很多操作都是为了更好的工程化效果。

  第一个例子是,无人车有一个容易被忽视的问题——相机的去污。Waymo 的第四代车顶上有一个圆形的罩子,里面包括了一个主雷达、16 个相机。但是由于是圆形,很多虫子、鸟粪、雨水沾在罩子上后,雨刮器无法去污,因此第五代硬件又回归了早期的平面形态。

  还有红绿灯的识别问题。目前很多交通灯都使用 LED 技术,会有频闪。如果曝光时间和频闪不一致,相机拍到的灯就会有亮暗相间的条纹。另外,由于与周围物体的亮度相差大,相机拍摄晚上的红绿灯容易过曝,尤其是左转或者右转的箭头,识别不清。Waymo 想了一个办法:给相机装上一个灰镜,强制延长曝光时间,以此解决红绿灯的识别问题。

  侯聪透露,“为什么 Waymo 一圈有 16 个相机,其中有 8 个都是为了看 LED 灯。不仅看红绿灯,还有警灯和消防车灯,以及一些牌子上面的文字。”

  第二个例子是激光雷达。

  在很长一段时间里,市面上没什么好的激光雷达可用,唯一可用的就是 Velodyne,但是 Velodyne 的要价太高,导致 Waymo 的成本居高不下。另一方面,Velodyne 的产能非常低且经常出问题,Waymo 曾试着找 Velodyne 沟通,但对方明确表示暂时没有改进计划,这让谷歌感觉受制于人。这也是 Waymo 在硬件上大搞自研的核心原因。

  侯聪表示,Waymo 几乎所有零部件都不是车规级的,比如相机用的是索尼消费级的传感器。当时的硬件条件下,车规级的相机只能达到 800 万像素水平,但是 Waymo 需要的是一个 4000 万像素、能有优秀夜间成像效果的相机,这就只能自研。

  降本,也是谷歌自研思路的一个考虑。Waymo 早期采用英特尔的芯片作为计算平台,主要是基于服务器 CPU 至强和 FPGA 加速卡。FPGA 具有非常高的带宽,但价格较高。为此,Waymo 甚至还计划自主研发芯片,但后来发现芯片研发的难度太大,技术迭代太快,难以实现固化而放弃。

  2017 年,侯聪日后的创业搭档于骞加入了感知组。

  于骞 2001 年从清华计算机本科毕业,杨士强教授是他的系主任,于骞和美团创始人王兴是同学(清华电子工程系无线电专业)。

  于骞读博时,计算机视觉(CV)还是个冷门学科,图形学比较热,因为可以用在电影制作方面,容易变现。但于骞选择 CV 是因为他在清华人工智能国家重点实验室,跟随张钹院士。于骞一直坚定地认为,“在人工智能领域,计算机视觉才是最接近智能的技术。”

离开 Waymo 的日子

  当时,于骞做的是基于双目视觉的无人车项目也使用单线激光雷达。在清华校园和周边的开放道路上,于骞和他的同学们做了各种实验。

  2013 年底,于骞加入了谷歌地图。一直到 2017 年 2 月,于骞做到了谷歌地图的街景组关键项目技术负责人,谷歌内部叫商业发现项目,目的是让地图不仅仅是给导航用,更要将大量的本地商业信息(类似餐馆、加油站、商店等)增加到地图元素中,尤其是通过谷歌大规模的街景数据高度自动化的完成本地商业信息的发现、定位、分类和匹配工作。

  当时很少有人相信可以通过街景信息高度自动化的产生最新的本地商业信息,这部分工作帮助谷歌地图完成面向本地化的转变,保持了谷歌地图的竞争力。

  在他看来,谷歌的工程师基础非常扎实。Waymo 团队中的大多数工程水平甚至比谷歌还要高,筛选过程非常严苛。

  于骞回忆,创始人 Larry Page 和 Sergey Brin 都对 Waymo 很重视。Waymo 内部创新和技术氛围很浓,特别是 Sergey, 有时会和大家一起开会。Sergey 穿着随意,会穿着短裤进来加入讨论。还有一次,于骞邀请了发明 GAN 网络的人 Ian Goodfellow 来做讲座,于骞是那次讲座的主持人。Sergey 特别感兴趣,陪着一起听完了整个研讨会,中午和大家一起吃午饭。

  “Sergey 对技术非常关注,所以谷歌的 demo 能烧这么多钱往前走,源自创始人的支持。”朱佳俊曾说到,“Google 的两个创始人 Larry Page 和 Sergey Brin 都很开放、也很有使命感,他们乐意为这些长线项目买单。”

  前 Waymo 感知组成员、美团无人车感知负责人夏飞也直言,“别的不说,Waymo 一次版本更新迭代就要花不少钱,还不算研发费用,国内很难有公司愿意砸钱评估。”

  在谷歌高层的支持下,Waymo 的商业化有了明显起色。2018 年 12 月,Waymo 自动驾驶打车服务的产品 Waymo One 正式上线。摩根斯坦利给出 Waymo1750 亿美元的估值,而前一年这个数字仅为 700 亿美元。

  投身创业大潮:智能驾驶与具身智能

  估值膨胀的背后,是 Waymo 正在一步步扩张与增员的事实。

  2018 年,Waymo 的感知组有将近 200 人,张一萌在内部的职级是 L6(Tech Lead),这个职级不低。然而,感知组的 L6 还有3、4 个。张一萌只能分到一部分项目,她坦言,“感觉自己能做更多的事情,但只发挥了 40% 的能力”。

  另一方面,组织架构的精细与流程化,意味着一个决策会牵动各方利益。

  2019 年 1 月,The Information 梳理了一份 Waymo 的组织架构。这时候的 Waymo 有 950 名员工,在内部被称为“Waymonauts”,还有至少几百名外包人员。工程部是规模最大的团队,占了员工总数的三分之二,其他部门的规模相对较小。在这 950 名员工中,有 350 人属于软件工程团队,260 人属于硬件工程团队。

  张一萌表示,“在 Waymo,想做出改变需要得到各个组的同意。真正实施的时候又要跟很多人沟通。发展到后期,Waymo 就已经是一个不可轻易调整的庞大‘系统’。”

  小马智行是张一萌接触比较早的公司。

  当时,张一萌和创始人彭军在一家咖啡馆见面,两人感觉不错。但张一萌还想看看其他机会,彭军对她说:“我们肯定不怕(你去其他家),这个自信还是有的,去聊吧。”

  后来,张一萌花了4、5 个月的时间广约面试,最终的选项只留下百度和小马,她在百度的最后一轮面试官是李彦宏。但最终在 2018 年 9 月,张一萌选择了小马。和她同一天入职的,还有现在小马副总裁、广州研发中心负责人莫璐怡。

  小马员工评价,张一萌早期给公司做出的最大贡献在于完善了小马的感知闭环。

  入职后,张一萌发现小马的短板在于,研发没有形成数据驱动的方式。在0-1 的创业初期,验证代码的最直接方式就是把代码部署到车上跑一圈。但从1-10 的阶段,各个版本之间的差异不大,路测无法作出准确的评价。这个时候,团队之间就会为了“上不上新的算法”而争论,拖累研发节奏。

  张一萌在内部提的概念是“Development Circle”,让数据不仅仅在训练过程中发挥价值,而是进一步在评价体系和仿真系统中进行流转。数据驱动的思维,也成为小马研发体系的关键基础,并一直延续至今。2024 年 11 月,小马正式在美股上市,市值超 45 亿美元。

  张一萌走后不久,于骞的本科同学、IDG 资本合伙人牛奎光找到了他。牛奎光告诉了他中国自动驾驶领域的创业机会。后续,于骞邀请侯聪一起组创业局。

  那时已是 2018 年底,侯聪觉得创业时间太晚,就考虑了半个月。

  一个小插曲是,早在 2017 年,侯聪就曾差点加入小马智行。当时,楼天城先联系了侯聪,后来彭军又找了侯聪三次,甚至带上自己的夫人和侯聪夫妇共进晚餐,但是最终因为各种原因,侯聪没有加入小马。

  在侯聪看来,彭军是一个很称职的 CEO,为了招人尽心尽力。后来,张一萌要去小马时,侯聪顺势推了一把说“这是一个很好的团队,是一个很好的机会。”

  后来,半个月时间一到,于骞再找过来时,侯聪就答应加入。最终,于骞、侯聪、大方、汪堃走到了一起,在硅谷一个深圳市政府做的名为“Shenzhen Lab”的孵化器里租了几个工位,在孵化器门口找来一个集装箱,买了一台林肯进行改装,轻舟的创业故事就此开始。

离开 Waymo 的日子

  轻舟分为 L2 量产和 L4(无人驾驶小巴)两条发展路线。在 L2 量产领域站稳脚跟,离不开地平线与理想的支持,一个是给投资,一个是给定点。

  最早的时候,于骞在 USC 的师弟黄畅(地平线联创兼 CTO)都在硅谷的 NEC Lab,地平线创始人余凯是当时 NEC Lab 的主任,于骞和徐健(地平线首席生态官)的关系也很密切。

  有意思的是,在进行智驾方案的芯片选型时,于骞最早见的人是黑芝麻智能的创始人单记章。当时,黑芝麻的华山芯片还在设计阶段,单记章问过于骞关于自动驾驶芯片的需求。不过,轻舟最终加入了地平线阵营。余凯给轻舟投了一笔钱,帮助轻舟度过关键的早期阶段。在此后的时间里,余凯经常会给轻舟站台,哪怕是轻舟自己的发布会。

  于骞对雷峰网说,“我们非常感激地平线和余凯,同时地平线也感激我们。因为在基于 J5 的中阶方案上,我们承载了他们最大的出货量。”

  轻舟和地平线更应该共同感谢的,其实是理想汽车。

  2020 年 9 月,地平线发布了 J3 芯片。8 个月后,J3 量产上车理想 ONE。为了响应理想的需求,余凯动用了地平线的全部精锐,组建了一支 300 人的团队派驻理想。在当时经历了大瘦身的地平线里,这几乎占据了总兵力的四分之一。理想 ONE 上市后一炮而红,地平线迎来了大规模放量。

  次年,地平线的“J5”系列产品也用了不到 7 个月在理想L系列上实现了量产。

  2023 年 3 月,轻舟开始与理想谈合作,直到 9 月份才正式确定合作,这中间有着漫长的考察过程。当时,理想正在考虑要把智驾芯片从 J5 换成英伟达的 Orin,但最终没有成行。由于联创的 Waymo 背景,轻舟开发了很多底层工具。与理想合作时,轻舟发现理想的工具质量还有很大的提升空间,帮着它一起优化。

  2024 年 8 月底,于骞向雷峰网表示,“有 40 万辆车装载了我们的智能驾驶软件。真正在车辆上应用的软件规模,我们还是最大的,这说明我们的稳定性可靠性得到真正市场的考验。”到了 12 月,轻舟官宣中高阶智驾解决方案量产交付上车正式突破 50 万套。

  2019 年从 Waymo 离职创业之前,于骞面试了一个人——星海图的创始人高继扬。

  两人见面是在 2018 年底,于骞是高继扬在 USC(南加州大学)的学长。高继扬在 Ram(Ram Nevatia,南加州大学计算机科学系计算机视觉领域的研究专家)教授组里,跟他同组的还有地平线的黄畅。当时黄畅正在念博士后,算得上是高继扬的大师兄。

  大四这一年,高继扬去商汤实习开始接触 AI。在商汤的时候,他认识了 Momenta 的创始人曹旭东。这个时候,高继扬已经感受到了 AI 的潜力,读博的时候切换了方向。在导师 Ram 教授的指导下,他仅用了 3 年半的时间就完成学业,成为 USC IRIS 计算机视觉实验室最快毕业的博士。

  因为用了很短的时间读完博,所以高继扬自认为没有特别引以为傲的论文。但好处在于,高继扬赶在了好的时间点进入自动驾驶行业。

  在 Waymo,高继扬作为高级软件工程师,参与了基于机器学习的行为预测项目,并和赵行、孙晨联合发表了著名的 VectorNet 模型。(孙晨是高继扬的学长,当初也是孙晨将高继扬引荐给 Ram 教授)

离开 Waymo 的日子

(从左往右为赵行、孙晨、高继扬)

  VectorNet 是一个基于神经网络的预测和规划算法。相比广泛使用的 ResNet ,VectorNet 在预测的精准度上提高了 18%。更重要的是,它在进行行为预测时占用的内存仅为 ResNet 的 29%,计算量也仅为后者的 20%。论文发表之后,不少公司开始用图神经网络的方式去做预测规划。

  2021 年 1 月,高继扬加入 Momenta。

  Momenta 是业内知名的“卷王”,去车企驻厂是一件非常平常的事情。高继扬向雷峰网(公众号:雷峰网)表示,“在服务客户这件事上,我们就是服务员,保质、保量、保时间。做技术的觉得技术过硬就可以,但没有给客户创造价值就等于零。”

  高继扬对 Momenta 的日子心存感激,高继扬进去之后向联创孙刚汇报。孙刚的管理风格是“无为而治”,但是他很会充分放权、捏合团队。在 Momenta,从感知、定位、规控、泊车、行车、AI Infra,所有的事情高继扬都经历了一遍。Momenta 的第一个自动驾驶量产项目——车位检测算法,就是由高继扬负责给博世交付。

  博世的研发中心在苏州。高继扬带领团队几乎把苏州一半的停车场跑了一遍。每个停车场采数据、训练,训完之后随机找停车场泊车。为了建立客户信心,高继扬向客户承诺:一周一发版,版版有提升,在这样的经历下,Momenta 慢慢建立起了交付方法论。

  2022 年 4 月份,Momenta 给上汽做第一次交付,交付的第一个功能是泊车和车道保持。但在 2022 年春节前,Momenta 的泊车成功率大概只有 60%,高继扬被指派来负责泊车。由于出入不便,高继扬楼上睡觉楼下调车,把泊车成功率从 60% 提升到了 95%。

  2022 年 6 月,高继扬正式开始负责 NOA 领航辅助系统系统,接手了规控、NOA 系统研发团队。等 2023 年 4 月份交付完成后,已经成为 NOA 负责人的高继扬在 5 月份提出了离职,正式投身创业大潮。

  而他的创业伙伴,正是他在 Waymo 前同事、VectorNet 网络的合作者——赵行。

  赵行本科在浙大,后在 MIT 取得了博士学位,师从 MIT AI&D (人工智能与决策)系主任 Antonio Torralba 教授——多模态深度学习的开创者之一。

  后来,赵行加入谷歌 Waymo 担任研究科学家,负责算法方面的工作,是 Research 组的研究员。2020 年底,赵行离开了供职一年半的 Waymo。当时,已经创业的于骞曾经向他伸出了橄榄枝。但赵行最终选择去清华大学交叉信息院担任助理教授。

  2024 年 3 月,在英伟达 GTC 2024 上,理想发布了智能驾驶方案——“端到端 +VLM(视觉语言大模型)快慢双系统”,其中 VLM 正是理想和赵行所在的清华 MARS Lab 的合作成果。VLM 的能力在于,即使遇到从未见过(训练过)的场景,也能像人类一样通过理解、分析、推理,最终安全应对。

  按照李想的话说,“不再需要养几千人的团队去搞 corner case,而且团队越多 corner case 越多了。”也正是从这篇文章之后,理想的智驾进度被大大提速,在 2024 年取得了肉眼可见的成果。

  赵行和图森未来的前 CEO 侯晓迪也是朋友。有一年 CVPR 上,侯晓迪找他喝酒,正好当时一位 MIT 的老师也在。侯晓迪口才出色,这位老师听后直接邀请侯晓迪去 MIT 讲课。

  高继扬也认识侯晓迪。刚毕业的时候,高继扬曾面试过图森未来,聊技术问题时侯晓迪的压迫感十足,这给高继扬的心理造成了“巨大压力”。他对于侯晓迪的印象是:“很犀利、很 sharp 的人,他是传统视觉出身,深度学习也很懂,两者结合非常好。”

  2023 年 5 月,赵行和星海图的另一位联创许华哲一起去非洲参加学术会议,当时许华哲还在清华,他听说赵行有具身智能方面的创业规划,就找赵行了解。赵行表示,“不如来聊聊?星海图现在也在筹建期。”

  于是,赵行就拉着许华哲跟高继扬一起吃饭,三人聊的非常投机。

  2023 年 9 月 5 日,星海图正式成立。十一假期的第一天,许华哲带组里的 PhD 去郊游,郊游那天他决定加入星海图。2024 年 11 月,星海图宣布完成超 2 亿元 Pre-A 轮融资。

  Waymo 的故事仍在续写

  Waymo 系出身的自动驾驶创业者,和“清华系”、“百度系”一样,是自动驾驶领域绕不开的存在。于骞向雷峰网说过,“Waymo 有一个中国人微信群,我在的时只有 20 多人,现在群成员已经增加到 500 人了。”

  这些在 Waymo 来来往往的华人,成为未来中国自动驾驶乃至具身智能领域的探路者。但是并不是所有人的离别,都是为了投身创业。Waymo 本身的一些问题,也是他们离开的重要原因。

  “架构比较复杂。”

  这是前 Waymo 感知组成员、美团无人车感知负责人夏飞谈及离开的主要原因。“Waymo 不得不处理大量的长尾场景。Waymo 需要下定决心简化现有系统,但这个取决于多方的认知。”

  与他持有类似观点是高继扬。在高继扬看来,Waymo 在 2021 年后走下坡路,人才密度有所降低,这是因为 Waymo 的大方向有问题,与 AI 行业技术的发展规律相悖。

  AI 有两个衡量维度:失效成本,泛化性要求。L4 级自动驾驶的失效成本高,泛化性要求高。大语言模型对泛化性的要求高,但失效成本很低;具身智能失效成本高于大语言模型,但是显著低于自动驾驶,同时对泛化性的要求也较低,因为具身智能的商业化过程是一个以岗位替代为核心逻辑的过程。

  高继扬表示,Waymo 开城思路是从区域 L4 起步,这就决定了需要围绕各个目标城市来拆解任务,系统里就产生了几十个模型,每个模型背后都是一个小团队支持,在“人比事多”之后,大家会出现抢项目或者相互掣肘的现象;其次,Waymo 是 Google 的子公司,CEO、CTO 是职业经理人,这对于一个没有稳定业务的创业公司不利,因为出错之后无人负责,也没有人可以强力纠偏。

  也有人不太认同高继扬的观点。

  张一萌认为,谷歌整体的文化是 bottom up(自下而上)不是 top down(自上而下)。

  2014 年,张一萌加入时,是 Chris Urmson 和 Dmitri Dolgov 在管理方向。但当时 Waymo 是走在最前端的公司,没有任何的参照可言。作为技术引领者,不像追随者一样有清晰的方向。在探索新东西的时候,自下而上会有更多创新的灵感。

  张一萌认为,以现在的眼光去审视过去 Waymo 的做法有失妥当。从 2016 年到 2020 年的这段时间里,最可用的方法就是将任务分成一个个小模型。当时有很多学术论文确实是从研究大模型开始,但那个时候的 GPU 条件受限,不足以去支撑大模型。

  “Waymo 这样的公司包袱会重一些,但是也在改变。小马当年也是多个模型,前两年才慢慢换成一个大模型的方式。如果小马在 2021 年成立,肯定直接走大模型的路线。”

  对于特斯拉与 Waymo 的不同开城思路,张一萌仍然认为,L4 必须一个个城市去开,特斯拉的方式更适合 L2。即使今天特斯拉去做 L4,也一定是如此操作。

  有 Waymo 前员工赞同这一说法:“AI 背景的人,或许对 Waymo 开城思路有所质疑。可以很明确的感觉到,大部分人都是盲人摸象,只能看到自己领域里的东西。无人系统很复杂,虽然代码都是公开的,但是很少有人能够全部知道其他人在做什么。核心在于 Waymo 卖服务,特斯拉卖车,不是 Waymo 傻或者笨,而是两者的目标不一样。”

  两种不同的观点对应的是在不同历史阶段的技术路线选择。对于 Waymo 来说,能走到今天已经殊为不易。

  2023 年,智能驾驶行业进入低谷期,Waymo 裁员 137 人且裁员范围大部分集中在技术岗位。加上 1 月份的首轮裁员,Waymo 共裁员 209 人,占到其员工总数的8%。

  不久前,通用宣布由于开发成本过高,将停止 Cruise 自动驾驶出租车业务。同时,其合作伙伴日本本田汽车也宣布将停止向 Cruise 提供资金。Waymo 的同行者少了一位,当初引领行业热潮的 Cruise 匆匆下线。

  只有 Waymo 还在一直坚持。

  2024 年 10 月,Waymo 完成一轮 56 亿美元的融资,这是 Waymo 迄今为止筹集的最大一轮融资。根据规划,新的投资将用于加速与 Uber 的合作,并宣布将于 2025 年在美国奥斯汀和亚特兰大推出 Robotaxi 服务。

  自动驾驶是一场马拉松,不是百米冲刺。时至今日,Waymo 的成败难以定义,但它是当之无愧的自动驾驶之王。

  “Waymo 有一帮特别聪明的人,做事非常认真、专业,代码质量非常高。在全世界,你想找到第二个这样的团队是不容易的。”

  从 Waymo 离开的这些人,正在继续书写智能驾驶和具身智能的江湖故事。