小马智行楼天城:自动驾驶已经没有技术阻碍|36氪专访
发布日期:2024-10-06 23:24
来源类型:福建日报 | 作者:李缨
【494949澳门今晚开什么】 【2024新澳免费资料】 【新奥彩火麒麟资料】 | 【澳门金牛版正版资料大全免费】 【新澳开奖记录今天结果】 【2024年新澳门王中王资料】 【管家婆最准一肖一码】 【新澳彩开奖结果查询】 【2024年澳门特马今晚开码】 【4949澳门免费资料大全特色】 【2024今晚澳门特马开什么号】 【澳门精准资料期期精准每天更新】 【2O24澳彩管家婆资料传真】
文|李安琪
编辑|李勤
陷在价格战泥潭的汽车公司们终于看到了差异化突围之路,就是AI大模型对智能驾驶的塑造。
“新的时代到来了。”9月10号,理想汽车CEO李想在朋友圈如此呐喊,今年开始,借助大模型能力,他们在智能驾驶中部署了端到端+视觉语言模型VLM+世界模型的新技术体系。华为、蔚来、小鹏等同航道选手,也无不将“端到端”“世界模型”等技术奉为圭臬,开始重新整肃智能驾驶团队和技术。
用AI改造智能驾驶,汽车公司似乎看到了“通往自动驾驶之路”。他们雄心勃勃,喊出“每年10亿美元”的投入计划。更早采用“端到端”技术的特斯拉更为激进,已经宣布在10月份发布Robotaxi(自动驾驶出租车)。
似乎“端到端”成了智能驾驶行业的“银子弹”。车企有制造、现金流和里程数据,如果再手握自动驾驶技术栈,无疑是另一番产业图景。
对此,小马智行CTO楼天城表现出了冷静。作为成立第一天就锚定L4自动驾驶技术的公司,楼天城明确表示,今天的高阶智能驾驶,即便采用了端到端技术,上限也只能做到L2.99,难以抵达L4。在行业中,L2通常指智能辅助驾驶,需要人类司机承担驾驶责任,而L4则为自动驾驶,车辆是驾驶责任主体。
楼天城认为,根本原因在于大语言模型自身的属性,“端到端或者大语言模型的本质,只是拟合现有数据,并没有给出某些智能逻辑。所以模型的能力会被数据的表现所限制。”
8月下旬,我们在小马智行北京办公室见到了楼天城。小马智行作为国内头部的L4级自动驾驶公司,同时也是车企的L2智驾方案供应商,站在两条路径的激烈交汇处。
近2个小时交流中,楼天城谈论了端到端的不同形态、世界模型的重要性、Robotaxi商业化、人类与AI共存等话题。
小马智行是国内的自动驾驶明星公司。2016年,楼天城与好友和百度同僚彭军离开百度,共同成立了小马智行。创业之前,楼天城是编程竞赛圈中的风云人物,“楼教主”的称号也由此得名。
楼天城告诉36氪,他对智能驾驶的认知出现较大分水岭的时间点是2019年。在此之前,他也认同数据量多寡对自动驾驶系统训练的重要性,但有一天他忽然意识到,过度的数据可能会造成负担。
他表示,L2作为辅助驾驶,驾驶表现只要表现得跟人一样就行,所以用大量的数据训练,能够灌出L2级别的智能驾驶,但天花板也相对很明显;
而L4自动驾驶系统的表现,要好于正常人类认知的10倍,因此,大量平庸的数据其实没有益处。
“行业现在对数据的盲目依赖,是没有意识到靠数据其实没法越过这条线(人类司机的线)。当真正接近这条线时,会意识到其实越不过去。最顶尖的人其实都知道,比如Waymo就从来没有说过要纯依靠数据。”
他打了一个比方:如果自身乒乓球水平不够,很难培养出一个能拿奥运冠军的选手。这也类似于跟一个棋艺不高的人下棋过招,自身水平也难以精进,“类似臭篓棋子的数据越多,数据就会变成负担,垃圾数据越多,干扰越大。”
更好的办法是找到出色的教练——也就是先训练出一个足够好的世界模型。
“这是最重要的事情,没有之一。”楼天城说。
世界模型可以理解为对真实世界的仿真与建模,可以真实准确地还原比如十字路口等场景的变化。
比如鬼探头时被遮挡的行人轨迹;车辆碰撞瞬间的行人与他车反应;甚至反应出人在跑步时减速度可以达到重力加速度等各种细节。
同时,世界模型还可以充当一个评分体系,对自动驾驶系统的表现做出评价。“虽然不知道哪个自驾系统是最好的,但可以知道A比B好。”
在新势力中,蔚来与理想等也强调世界模型的重要性。但楼天城认为,因为L2与L4产品属性不一样,后者对世界模型的要求更高。
在创业之前,楼天城常常参加编程竞赛。他说编程竞赛圈有个习惯,大牛们会经常分享自己的解决思路,叫题解。“大家都是先把题做出来了后再写题解,而不是自己还没做出来就开始教别人怎么做。”
楼天城也给出了自己的“自动驾驶题解”。去年8月,小马智行已将感知、预测、规控三大传统模块打通,统一成One Model端到端自动驾驶模型,目前已同步搭载到L4级Robotaxi和L2级量产智驾中。
楼天城认为,当下自动驾驶已经没有了技术阻碍,技术进程已经过半,技术的商业化是另一项重要工作。对于Robotaxi的大规模落地,他表示在明年的时间节点,公司可以做到单车盈利转正,这将让公司进入良性的正反馈之中。
楼天城对AI依然抱有相当高的天花板期待。“Robotaxi是AI第一个最大的应用,后面AI应用绝不局限在此,还有更高更颠覆性的发展空间。”
“人其实也是AI。别觉得自己跟他们有本质不同,一个新的AI Agent做的一些事情,跟人相比,有些地方平分秋色,甚至平级,甚至更好。”站在人类的角度,他认为,应该好好思考如何与AI一起以更好的方式去驾驭它,而不是逃避。
以下是36氪汽车与小马智行CTO楼天城的对话,略经编辑:
谈端到端:世界模型是最重要的事情,没有之一
36氪汽车:L4公司似乎普遍比车企智驾团队对端到端有更早关注?
楼天城:因为L4的挑战更大,更需要端到端的加持,需要用所有能想到的办法来加持。端到端好处是,解决了信息丢失的问题。以前不同的模块非要描述一些东西,其实在一定程度上限制了给下游传递的信息。
对L2来说,端到端更多的价值在于成本下降等,但对L4来说可能是从0-1的价值,意义更大,所以L4公司对端到端接触会更早。
36氪汽车:您是什么时候开始关注到端到端方案?
楼天城:端到端有非常广义和非常狭义的定义。早些年传感器的前后融合,就有端到端的概念了,严格讲,前融合是端到端的开始。因为前融合就是解决传感器信息丢失的问题,跟端到端强调的东西是一样的。
2016年也有公司提出了狭义端到端概念,其实不一定要基于Transformer才能做端到端,但Transformer架构确实让端到端变得非常好。
36氪汽车:“端到端大模型”这个词您是怎么理解的?
楼天城:端到端有常见的基本过程,很多公司都是从感知BEV开始,慢慢把感知和预测做在一起,然后Planning(规划模块)用AI来做,然后再combine(联结)到一起,慢慢发展到One Model端到端的状态。
小马没有跳过某个阶段,我们端到端走的很快的原因在于,不在于端到端模型本身,而是我们用于训练端到端的东西,一个基于仿真的世界模型,这是个很好的基础。
但端到端不是大模型。如果以模型参数多少来衡量,确实让一个更大的模型缩小,比直接去做一个小的模型效果要好,先做大再做小没有任何问题。模型有大有小,但没有一个东西叫做大模型。
36氪汽车:L4端到端跟L2端到端有什么不一样的地方?
楼天城:L4的端到端有很多不同之处,可能其他玩家不做、也没有考虑到。端到端跟数据有关系,但我提过,过度的数据是burden(负担),端到端或者大语言模型的本质,只是拟合现有数据,并没有给出某些智能的逻辑。所以模型的能力会被数据的表现所限制。
说更明确一点,你跟一个臭篓棋子学下棋,那你就是他的水平,不会更高了。如果类似臭篓棋子的数据越多,数据就会变成负担,垃圾数据越多,干扰越大。
更深一层来讲,这些数据已经教不了模型了。就像教小孩儿乒乓球,你水平都不如他那不是瞎教吗?所以要找教练。现在的做法是,训练一个很好的模型来训练端到端。而能训端到端模型的模型,本身就是一个很难的东西。
36氪汽车:所以对自动驾驶来说,世界模型是更重要的东西?
楼天城:对,可能都没有之一。我觉得我们在世界模型上做的还不错,反正比我教的好。
这也是L4公司不一样的地方,如果做L4,一定会走到这天。我是从2018年开始想这件事情,那时候我有预感未来我可能教不了自动驾驶,的确,到2020年我已经教不了了。
36氪汽车:教不了自动驾驶,具体是什么样的表现?
楼天城:就是我水平不如他了。先说明一点,端到端的黑盒和不可解释性是对的,只是它做的事情可能挺对的,只是我当时没有想到而已。跟早年看阿尔法狗下棋是一样的,我看不懂罢了,所以我得慢慢培养一个世界模型来帮助我判断驾驶模型的水平。
世界模型帮助我们一步步走过来,世界模型是最重要的事情,没有之一。车辆的好坏表现也是由这个世界模型决定的。
36氪汽车:怎么看现在车企提出的L2级别世界模型?
楼天城:如果是L4,那系统表现要好于正常人类的10倍;但L2不需要,L2本来就是人类驾驶辅助,只要跟人想的一样就行了。但L4的系统可能你都不知道哪个更好,但又不能限制它,所以需要一个更好的教练。
这跟技术管理是一样的,作为公司技术管理层,千万别觉得自己是公司技术最好的,如果天天这么想公司早完蛋了。最重要的是找到比自己厉害的人,培养他们,给他们发挥的空间。
36氪汽车:所以L2没有办法进化到L4?
楼天城:过度的数据没有帮助,但其他的东西比如车端芯片、云端芯片还是有帮助进化的。数据是里面关键的部分,拿数据去灌输一个世界模型是很容易的,但灌出一个好的世界模型很难。就像找一个教练容易,但找一个能教出世界冠军的教练很难。
我也是意识到这件事情之后,才做了很多其他的事。比如选择更好的数据,比如做一种比较的方法,虽然不知道哪个自驾系统是最好的,但我知道A比B好。
就像2018年腾讯的绝艺(AI围棋)对战AlphaGo一样,我哪里评判得了他们的水平,都比我好太多了,哪知道哪个更好对不对?
36氪汽车:怎么看待当下行业讨论的分段式端到端跟One Model,两者之间有本质区别吗?
楼天城:区别还是有的,还是信息传递和丢失的问题,分段式的话,模型与模型之间肯定会存在信息丢失,所以整个模型表达能力确实不如one model。但好处是,训练的难度会低一些,每段之间会有明确的输出披露。one model的模型表达会更强,但训练难度也更大。
36氪汽车:端到端的黑盒、不可解释性的挑战要怎么应对?
楼天城:看用户接不接受黑盒,如果要输出是可以输出一些意图的,比如要左转右转,或者掉头这种,用户如果需要就可以做。端到端确实解释性差,但没有差到让你不安心。它不是一个blocker(阻挡者)。
谈进化:L4需要的东西,L2根本不用
36氪汽车:传统基于规则的多模块方案已经完全走到头了吗?
楼天城:进展上确实不如端到端,BEV加规则的方式,差的其实不是运动员,而是教练。写规则的人就是教练,是教练水平不够,不是运动员不行。
假如rule based方案能力在最下层,L2在中间水平,L4水平往上走。基于端到端,智驾水平可以提升到L2天花板,但更往上,我们不叫端到端,而是叫foundation model (基础模型)。对L4来说,资源是个加速器,可以提升更快,但资源不改变天花板。你的做法,团队的能力,才是天花板。
36氪汽车:小马有L4的产品,也有L2的产品,你们怎么平衡?
楼天城:我们有不同的团队,大家已经走过了当年的分歧点。2020年的时候,我们意识到要有不同的技术和产品,于是把技术往回退到2018年水平,拆成不同的技术和产品方向。L2走端到端模型,L4的东西叫基础模型。
36氪汽车:两个模型之间有明显的区别吗?
楼天城:完全不同。L4需要的东西L2根本不需要,L2的做法是拼命灌数据,L4要做的是先训练世界模型。
L2考虑的是成本、用户体验之类的需求,L4还是考虑安全性,更注重精确操作和答案。L2是辅助,要很好的交互,操作不了就人来接管,但L4不行的时候要做得特别好。两者刚好互补。
36氪汽车:从rule based到端到端,到基础模型的训练,你们的工具链发生了什么变化?
楼天城:其实是反过来的,工具链的成熟度,决定了最后模型做的好坏的关键。比如仿真的好坏,影响着系统的好坏。世界模型的本质,可以理解为是对世界的建模,可以认为它是一个评价体系。它是更重要的,它关系到L4基础模型的天花板,也关系到L2端到端的学习速度和一定天花板。
36氪汽车:L4的世界模型,跟之前用的仿真工具有什么不一样?
楼天城:世界模型必须要更好反应世界上其他物体的真实状态。比如在十字路口,红绿灯的变化,行人怎么过马路等行为。
比如著名的鬼探头问题,在十字路口绿灯,左边有个巴士停着,前面是空的,但它不走,可能是因为他前面有人。我们虽然看不到,但是车会减速,这个可以被表述成端到端逻辑。但另一个维度,世界模型会真正模拟一个人在车前走,只不过被挡住了。
再举个例子,我到美国的时候,有个在美国开了很多年车的老师傅告诉我,美国行人过十字路口不看车的。他只说这一件事,所以我开车就得注意旁边的人。我就是端到端模型,老师傅就是世界模型。
36氪汽车:但反应世界真实情况本身,是不是就很难?
楼天城:对,但必须做到。
36氪汽车:假如说世界模型是端到端的评分体系的话,那世界模型本身的好坏怎么评价?
楼天城:这很有意思,严格讲没有明确的体系,他们俩互相之间纠结,然后通过实际路测来评价。现在通过模型来训练和评价模型都是常见的事情。今天,chatbot(聊天机器人)水平已经不比人低,所以也需要训练模型来评价chatbot水平。
36氪汽车:您觉得特斯拉现在遇到的问题是什么?
楼天城:特斯拉现在能也很好达到L2.99的水平,这是今天已经公开的,但还有它还没公开的部分。
从去年末Elon的直播来看,45分钟美国路程接管了1次,但我们无人车的里程是50万公里出一个事故,不同的世界模型教出来的学生水平差了1万倍。智驾系统的差距,光着急是没用的,真正的差距会在世界模型这一侧体现出来。
36氪汽车:世界模型起来之后,对智驾系统的泛化能力有什么帮助?
楼天城:用大语言模型帮助建立世界模型的好处巨大,因为大语言模型的数据源于世界上各种各样的数据,比如欧洲的很多路牌我都不认识,大语言模型其实都看过。
甚至都不需要是多模态大模型,只要是大语言模型就可以。当然多模态大模型会更好,比如SAM模型就行。
36氪汽车:什么时候可以见到小马世界模型训练出来的量产智驾?
楼天城:我们不太方便透露主机厂的进度,但小马的L2也有个世界模型,它训出来的产品叫PSD,它的水平也是30公里左右接管一次,这是L2普遍的水平。
训练一个这样的世界模型,不需要太多数据,把我们L4的数据拿出来灌一灌就行了。我们用的都是高质量数据,大概3000多万公里。我们大概训练了半年,没花多少人在这上面。
谈投入:资源是门槛,人才会拉开差距
36氪汽车:之前连rule based(规则为基础)的方案都没有做过的车企,有可能通过端到端弯道超车吗?
楼天城:可以,但只做到L2天花板这里。资金投入不是小数目,特斯拉买了这么多万张卡,它一买,英伟达的股票都能长,但不是所有车企都有这样的投资意愿。
关键是,还要有配套的人和团队才能发挥出最大价值。如果这方面很差,整个投资性价比很低。所有投入下来几个billion(十亿)不止,有钱才有资格这么玩。没钱的话,换个办法吧。
36氪汽车:世界模型的训练,会对车端、云端芯片硬件有多高门槛要求?
楼天城:云端显卡我们也有,加上预训练环节,投入也非常大。
当车端算力少且传感器少的时候,对世界模型的要求就很高。车端算力多一些肯定有好处,但今天L2 双Orin也还ok,L4也最少要千TOPS。
行业现在对数据的盲目依赖,其实是没有理解一些事情的,至少没有意识到靠数据其实没法越过这条线(人类司机的线)。当真正接近这条线时,会意识到其实转不过去。最顶尖的人其实都知道,比如Waymo就从来没有说过要靠数据。
36氪汽车:大家对高质量数据会有清晰的画像吗?
楼天城:比如50万公里出一次事故的水平,拿200万公里才出事故的数据来训练不过分吧。50万公里的可能好找一点,某种程度上这是更可怕的司机,基本上都是被别人撞才有事故。
我们L4日常的数据采集司机,都是经过几年训练的,我们还专门提醒说好好开,不要瞎开,还不够,因为每个人擅长的东西不一样,我们专门开发了一些系统帮助辨别司机开的好坏,所以高质量数据是有门槛的。
当年ChatGPT出来的时候,OpenAI也在印度找了标注团队。你能感觉它说话是很nice的,这就是标注好的数据的结果,否则就是胡来。
36氪汽车:这种属于长时间不出错的数据,像碰撞瞬间这种case的数据怎么获得?
楼天城:这个的难点是在于,碰撞那一瞬间,其他车的行为是什么?因为碰撞的瞬间,其他车的行为也不是正常行为,大家也会下意识避开,所以平时积累的数据加进来可能会添乱。
非常急的情况下,人在跑步时减速度可以达到重力加速度。所以一定要对这些东西有正确的认识,世界模型才会教出好东西。这样的仿真建模其实挺难的,我们做的还不错。
36氪汽车:端到端之后所有的模块要一起训练?会不会出现负优化的情况?
楼天城:这是端到端全局梯度传递问题,但其实梯度消失不是负优化,梯度消失是可能的,需要想办法让梯度变正,这是大语言模型或者模型中最难的部分,早年深度学习的出现,其实就是为了防止梯度消失。
这个有点复杂,就是你的训练数据,没有办法帮助系统认识到,某个地方应该朝着局部最优以外的地方走,它停在那里。得想办法让它走出去。
比如模型结构变化、数据增多,模型表达能力提升,反正要想办法给它一些prompt(提示),才可能跳出原来的局部最优。训练过程中99%的时候都是负优化,只有偶尔找到正确的路往前走。
36氪汽车:现在会有一些新的技术方案出来,可以避免负优化吗?
楼天城:很难,而且负优化现在是越来越严重。随着模型变深,参数更大,问题会越来越严重。或者说梯度优化太小,模型就只在一个范围不动了。
但反过来,这个东西更难了,解决问题的能力就是一个团队能力的体现,聪明的脑袋可以又派上用场。我的观点是,端到端其实拉开了不同能力团队的差距。
36氪汽车:您怎么看特斯拉说下一代模型参数量扩大了5倍?
楼天城:特斯拉是个很优秀的公司。我猜他的5倍指的是世界模型的参数扩大五倍,而不是FSD(特斯拉的全自动驾驶)的参数放大5倍,其他东西提5倍是没有用的,因为天花板不在这边。
谈落地:遗憾Waymo不进中国,小马远比它好
36氪汽车:您会把Waymo和特斯拉的体验做对比吗?
楼天城:一个是极致的L4,一个是极致的L2。
36氪汽车:从技术或者商业运营来看,今天你们跟Waymo还有明显区别吗?
楼天城:我很遗憾它不能进中国,所以我很遗憾我不能向世界证明,其实小马远比它好,包括在安全性、体验、市场效、成本这些方面。
36氪汽车:你们的L2与特斯拉的产品相比呢?
楼天城:我们在做车企的项目,但不能说名字。这事其实不用崇洋媚外,特斯拉进了中国,也不见得能比得过中国这几家。
在创业之前,我在编程竞赛圈,竞赛圈有一个习惯,我们经常会分享自己的解决思路,叫题解,竞赛圈的人都是把题做出来了再写题解,而不是还没做出来的时候教别人怎么做。我说我做到,来给大家说怎么做到的,没做到的人请做到再说。
36氪汽车:Robotaxi大规模商业化,需要等到世界模型出现之后再到来吗?
楼天城:这个可能跟端到端都没有关系,或者端到端有帮助但不是最直接的决定。L4的量产跟成本、运营、政策这些都有关系,如果有世界模型可能会让成本进一步下降,会更好。
一些L2的说法,我不太认同的根本原因是,今天L4已经到了没有技术blocker的状态了。当大家技术都没做到的时候,可能说有个做法将来更好;但当技术已经做到的时候,我们考虑的是真正商业化,你们还没做到的话,我不会再等几年了。
36氪汽车:Robotaxi的量产现在卡在哪里了?
楼天城:所有的车辆量产都需要时间,仅此而已。
36氪汽车:预计一年内做到什么样的规模?你会对什么样的节点比较满意?
楼天城:1年30倍,这是车企标准的车辆数量增长的速度。路上跑几万辆车,我觉得还比较满意。
36氪汽车:现在Robotaxi的技术已经达到你的理想状态了吗?
楼天城:技术本身是过半的,觉得其他方面还要再努力。量产我们正在做,今年我们和丰田成立了合资公司,他教我们怎么量产、成本控制,和运营。技术上也还有改进的空间,但它已经过半了。
36氪汽车:过半是指什么水平?
楼天城:好于人类驾驶10倍以上。
36氪汽车:那终极目标是什么水平?
楼天城:我觉得需要接近驾驶的极限,但极限不是无穷大,极限可能是几十万公里才被撞一次,因为我不撞人,别人也可能会撞我。
36氪汽车:现在自动驾驶似乎变成了耐力赛,量产智驾公司有数据闭环作为养料,像Waymo和小马这种技术公司怎么保证耐力不断?
楼天城:Waymo有Google的支持,严格讲这不是它担心的问题,但问小马很合适。所以量产对我们来说有很重要的意义,一年上多少量不是说有多少实际盈利,而是保证整个公司进入了正反馈节奏。
车辆规模越大,就能够支撑研发、支撑车辆规模增加,公司也快达到这个状态了,时间上就是今明两年。
36氪汽车:有更具体的指标吗?比如现金流为正之类的?
楼天城:比如单车盈利至少为正,百度萝卜快跑也提到这个概念,单车为正已经是很大的milestone,只要车量上去,就能把研发的钱填过来。今天很多新势力其实也还没有达到单车盈利转正。
当然,从长期发展来看,公司研发才是真正关键优势体现,我并没有觉得非要这么急,让整个公司盈利回正,这是一种平衡关系,不是一个商业化成熟的关系。我们明年会达到单车层面盈利回正,这是我们期待的。
谈AI:人也是AI,没有本质不同
36氪汽车:近年来AI领域迸发的技术特别多,像pony这种技术公司,怎么判定要不要把技术拿到车上用?
楼天城:关注最新技术是公司很重要的事,所以基本上技术被媒体或大众朋友关注到的时候,我们其实早就已经研究过,甚至已经在用了。
我对AI天花板看得很高,我觉得Robotaxi是AI第一个最大的应用,后面AI应用绝不局限在此,还有更高更颠覆的发展空间,肯定要积极拥抱。
站在人类的角度,人们更容易接受AI作为辅助帮助人类,但AI的真正意义价值远不止,人要思考怎么跟技术配合,人如何在新的AI环境中主导事情,不要逃避。
36氪汽车:下一个大的AI赛道会属于哪一块?
楼天城:最近资本圈火的市场很明显,首先chatbot就很火,还有“地上无人,天上也无人”也很火。通过很多技术,短期让人看到AI的能力,这个是很好的起点。
拿chatbot来说,平时它他帮我写点东西。很多行业大家的AI起点找得很好,但AI的天花板可能不能被起点的形式所限制。AI可能会颠覆人的很多创新,甚至人的很多职业,这是真正有价值的地方。
36氪汽车:听说内部有个AI team,近期哪些技术会让你感到比较兴奋?
楼天城:像仿真、类似Sora视频生成的技术我们还是很感兴趣。因为车的传感器数据本身还是很多的, 生成模型其实也很多年没有这么长足的进步了。
像Sora这种虚拟现实是很可怕的,它在一定程度上颠覆了人类能区不能区分是虚拟现实的点,你甚至都看不出来它是不是虚拟现实的东西。
36氪汽车:这种技术竞争似乎面向更广泛AI行业?小马会想往机器人发展吗?
楼天城:我们会先把自动驾驶做好,显然AI技术在很多相关领域都有应用,但自动驾驶模式更成熟,是大家更能接受、有真实需求的方式,它可能应该是所有AI应用中最容易落地的。
所有的人最后都会遇到同样的问题,如果我这块没有走通,很难让其他资源方支持我,反过来说这块走通了我有更多立场,要求更多支持。
36氪汽车:对于AI展现出来的高水平,你发现教不会它更好的东西时,是什么样的感受?
楼天城:我个人目标驱动这一点还是抓得很准,我们要把它做好,方法不同就不同,我不会对一个方法上有太大的坚持。回到2019年,当时我还强调我们一年采集了多少实验数据,在那之前我一直说数据多好,现在我就不说了。就是突然有一天发现,其实不是这样的,但这种东西只能意会,自己明白了才明白。
36氪汽车:所以2019年,你发现AI的发展超过了你的预期?
楼天城:最近几年尤其超过预期。
人也是AI。别觉得自己跟他们有本质不同,一个新的AI agent做的一些事情跟人相比,有些地方平分秋色,甚至平级,甚至比你高,在公司也是这样,要来找比自己更牛的人来加入公司,给他们展示空间,这才是公司CTO该做的事情。
36氪汽车:公众会对AI的到来有一种恐慌认知。
楼天城:恐慌没有用,它一定会来,应该好好思考如何跟AI在一起以更好方式去驾驭它。恐慌可能世界上最没用的东西,没有问题是靠恐慌解决的。
徐晗:
2秒前:99的水平,这是今天已经公开的,但还有它还没公开的部分。
安妮·哈尼:
7秒前:36氪汽车:您怎么看特斯拉说下一代模型参数量扩大了5倍?
王双宝:
9秒前:楼天城:好于人类驾驶10倍以上。
徐帅:
9秒前:这跟技术管理是一样的,作为公司技术管理层,千万别觉得自己是公司技术最好的,如果天天这么想公司早完蛋了。