01a0d79462bf4de86a41d94ec29285f3.gif

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

这些年来马斯克画过的“饼”,大大小小的不在少数,如今终于实现了一个。

网友:“Elon,先别管跟小扎格斗的事了,你啥时候在能在 X 上直播测试 FSD Beta V12 啊?”

马斯克:“下周。”

于是乎,上周末马斯克如期在 X(原推特),首次直播演示了备受期待的全自动驾驶系统 FSD V12:没有任何剪辑,直播时长为 45 分钟,共吸引了 1000+ 万人观看。

fb32ed1f4fbb9054e0057ec85d8fe59e.png

c7a59cf664f34cd60c85730684a770d4.png

45 分钟直播,只有一次人工干预

在这次直播中,马斯克驾驶的是基于 HW3 硬件的 Model S 车型,之所以没有使用 HW4 硬件,是因为目前 HW4 尚不支持 FSD V12。

马斯克解释称,由于 FSD V12 采用端到端的架构,即输入视觉等传感器信号,输出转向、刹车、加减速等车辆控制信号,跟现有版本有巨大差距,与 HW4 的数据不完全兼容,因此仍需针对 HW 4 硬件进行重新优化。

这趟长达 45 分钟的试驾由 FSD V12 全程接手,起点是位于帕洛阿尔托的特斯拉总部——整个过程中,除了手动输入目的地之外,马斯克只进行了一次人工干预。

首先,马斯克随机选择了斯坦福大学作为目的地:“让我们看看它是如何做到的,出发吧!”

开始还没多久,这辆特斯拉就顺利经过了一个施工路段。

在路口要变道转弯时,特斯拉也准确移动到了正确的车道。

甚至,它还懂得在减速带前提前减速,尽可能保证乘客体验良好。马斯克表示:“从直播中可能很难看出,但实际上汽车行驶得非常平稳。”

到达第一个目的地后,或许想到了与小扎之间还没实现的格斗之约,马斯克选择的第二个地点,是小扎的家。

再次启程的 Model S,没多久就遇到了非常复杂的环形交叉路口:它静静等着前面的车辆先走,然后再慢慢地转弯。

到达新目的地后,马斯克并没有真的冲去小扎家里,而是又随机选择了一个地点。而这辆 Model S 在到达地方后,自行选择了一个合适的地方停在路边。

整个 45 分钟直播过程中,在 FSD V12 系统驾驶下的特斯拉行驶得十分顺利,马斯克几乎只充当了一个“输入目的地”的工具人。

不过还是有一处失误,让马斯克旁边跟着试驾的同事亲自上手干预:在直播约 20 分时,Model S 本该等着直行的绿灯,但当对面信号灯转为左转状态时,Model S 突然也跟着启动了。

对此,马斯克笑着调侃道:“好的,现在你知道为什么它(FSD V12 )还没有向公众发布了。”

8542faced919cf806e208b83f8c7b7e1.png

FSD V12 完全“基于视频培训”

在这场直播中,马斯克反复强调了一点:特斯拉工程师们,没有在 FSD V12 系统中写过任何一行有关车辆行路规则的代码。

不论是“遇到减速带要减速”,还是“要给骑自行车的人让路”,亦或是“环形交叉路口要等其他车辆驶过”等等,马斯克一直表示:我们没有对此进行编程,没写过任何一行有关的代码,FSD V12 的所有表现完全“基于视频培训”。

  • “看这减速带,汽车需要放慢速度……它做到了。我们没有编程,没有一行代码说减速带要减速,它(FSD V12)完全是基于视频培训来做到这一点的。”

  • “刚刚还遇到了一个骑自行车的人,也没有任何一行代码规定要给骑自行车的人让路。”

  • “同样,也没有任何一条代码规定要在停车标志前停车或等待其他车辆,也没有要等待 X 秒之类的规定。”

  • “我们从未针对环形交叉路口的概念进行编程,只是向它展示了一堆关于环形交叉路口的视频。”

也就正如马斯克之前所说的:“新的 FSD V12 版本,是端到端的输出!”

最新的 FSD V12 系统,不再依赖传统的高精地图和导航数据,抛弃了传统的 “if else” 规则驱动的触发方式,而是通过车载摄像头和神经网络,使用 AI 算法来识别道路和交通情况。

马斯克介绍道,FSD V12 主要通过 AI 对 8 个 HW3 摄像头的视频进行实时判断,从而对车辆进行控制,以此实现端到端的自动驾驶。这 8 个摄像头以每秒输入 36 帧的最大速度运行(实际运行速度应该高达每秒 50 帧,只不过摄像机只能达到每秒 36 帧),通过纯 AI 计算更快地处理这些图像。

8932454b6b3cbbfdec98450ea5c49dcf.png

减少了 30 万行代码,功率仅需 100W

令人惊叹的是,据马斯克透露,这样一套 FSD V12 系统的功耗只有 100W:“在特斯拉设计的 AI 计算机上,以 36FPS 的速度运行 8 个摄像头所需的推理计算功率,仅约为 100W——这微不足道的功率,足以实现超人驾驶!”

除此之外,FSD V12 通过将 AI 与机器视觉相结合,就不再需要传统的预训练了,也无需再对每个道路元素或情况进行单独编码,只要给大模型喂饱了相关视频数据,它就会自己慢慢理解并做出决策。

所以,FSD V12 的代码量也减少了超过 30 万行:“在第 11 版的显式控制栈中有 30 多万行 C++ 代码,第 12 版中基本上没有。”但没有代码并不意味着不可控,在马斯克看来,只要有数据就能控制想要的东西。

在直播中,马斯克提到为了帮助 FSD V12 做出正确的决策,特斯拉内部非常重视喂给大模型的数据质量:“大量平庸的数据并不能改善驾驶水平。我们要确保所有输入的数据都是优质正面的驾驶数据,而这就是为什么数据管理非常困难的原因。”

同时,由于对 FSD V12 输入大量视频数据后,它会自主分辨最佳行驶操作,因此 FSD V12 的推理都在本地进行,即它不需要连接互联网连接也能正常工作,在不熟悉的地形上也能应对自如。

尽管 FSD V12 的直播表现可圈可点,但当前 V12 仍处于测试版,马斯克也表示特斯拉目前在全球各地都有 FSD V12 测试人员,包括新西兰、挪威、泰国或日本等。

等到未来 FSD V12 足够安全流畅后,不知马斯克是否会兑现他之前画过的另一张“饼”,将其免费试用:

“一旦 FSD 体验足够丝滑(不仅是安全)后,我们计划在北美给所有车主开放一个月免费试用。在确保全球其他地区功能正常并且法规允许后,我们也会推动 FSD 的用户免费试用。”

那么,你对于 FSD V12 的看法如何,对其又是否看好呢?

参考链接:

https://twitter.com/elonmusk/status/1695247110030119054

https://twitter.com/treb5475/status/1695289700620341311

推荐阅读:

c000e089d8bd5667a07982fe91b88516.png

滴滴放弃自己造车,小鹏以总对价 58.35 亿港元收购其智能汽车开发业务!

▶科大讯飞董事长刘庆峰:华为GPU已可对标英伟达A100;Windows 11 文件资源管理器支持 RAR 等格式|极客头条

▶成本和效率能否兼得?凌云光对GPU管理方案的探索和选型

Logo

助力合肥开发者学习交流的技术社区,不定期举办线上线下活动,欢迎大家的加入

更多推荐