大神养成计划 大神养成计划删减部分
2023-04-12 17:21 ca 蜻蜓之家 浏览: 8062 作者: tiger
特斯拉放弃激光雷达改用纯视觉都因为这个人!安德烈·卡帕西。了解一下他的经历就知道特斯拉为什么如此崇尚纯视觉,为什么会放弃激光雷达,甚至为什么要去做机器人。
特斯拉的纯视觉虽然已经开始大规模应用了,但在放弃激光雷达时也招来了众多议论。其实特斯拉的创新很多,就连使用的ERP也是自研的,感兴趣可以参考下面的文章:
真正的创新买不来,特斯拉为啥不用SAP,只因为他
中国为什么没有自己的编程语言?哲学、数学和语言学基础是关键
今天咱们来聊聊马斯克背后的男人,深度学习大师安德烈·卡帕西。反正特斯拉的机器视觉都需要巨大的算力和精良的算法,那么索性再搞一个机器人吧。从汽车到机器人都差在哪儿?能识别,能行走,能思考,可是能聊天么?安德烈·卡帕西是如何做到这一切的呢?
安德烈·卡帕西的简历
安德烈·卡帕西(Andrej Karpathy,1986 年出生)是特斯拉人工智能和自动驾驶视觉的主管,是有名的深度学习科学家,看看他的经历就知道师出名门多么重要。
原来是帅哥一枚
Andrej Karpathy 出生于捷克斯洛伐克,15 岁时随家人搬到多伦多。在那儿上过深度学习创始人Hinton教授的课,可以算是师出名门。
深度学习教父辛顿
2009 年前他在多伦多大学拿到了计算机科学学位。后来去斯坦福大学读博士,出生于北京的李飞飞那时担任斯坦福大学深度学习的教授,也正是他的博士导师,他在那儿专注于利用深度学习去进行自然语言处理和计算机视觉识别。
深度学习是视觉识别的基础
安德烈原来是在马斯克的Open AI当科学家的,后来于 2017 年 6 月成为特斯拉人工智能总监。他和马斯克的关系非常紧密,在FSD发布新版本期间,经常要进行细致的讨论。安德烈大概是个工作狂,经常在办公室熬夜,只是不希望“思路被打断”。
安德烈还是个小说写作爱好者,有兴趣可以看看他写的短篇科幻小说。
http://karpathy.github.io/2021/03/27/forward-pass/
这个短篇科幻小说讲的是一段程序具备了人类的意识,如何对话如何思考的小故事。你要是仔细读了上面的文章,大概就知道安德烈上博士期间自然语言处理(NLP)没白学,特斯拉做机器人没准就是他的主意。毕竟专业完全对口啊。
安德烈构建的 特斯拉的Autopilot 神经网络由 48 个网络构成,需要 70,000 个 GPU小时来训练,识别内容超过 1000 万个图像/视频。这些网络部署在我们 100多万辆车上,在车的使用过程中,它们会实时地输出 1000 个不同的张量(预测)以帮助驾驶汽车。
纯视觉与激光雷达之争
特斯拉真的容不下激光雷达?传感器多些真的保平安?咱们从猜想、实验与结论的科学角度来聊一聊。有30个摄像头,是不是更好?最好再加上10个激光雷达。
很多人一听特斯拉icon取消了激光雷达,都非常激动,人命关天,你居然只考虑省钱,资本家的丑恶嘴脸啊……人多力量大,传感器多了力量也大吗?这些都是咱们的猜想,到底行不行?还是得看实践。
我们的实验和路跑数据怎么样,自动驾驶厂家应该都有,但是大家是不是系统化地做过实验,咱们不知道。用什么方法对数据进行分析?如何得出的结论?结论可不可靠?这些都是需要我们下结论之前搞清楚的。
视力很好,反应快速,头脑敏捷是一个好司机所需要具备的能力,是能够满足道路驾驶的基本要求的。因为汽车这种东西就是人发明出来需要人配合驾驶的,他和飞机,火箭什么都不一样,虽然速度没那么快,但是路况信息却复杂得多。
所以要替换人,要先研究人是怎么工作的?人类工作主要是依靠视觉加大脑,因此特斯拉用摄像头加神经网络。这个逻辑没有错,咱们也不一定非要超越人,先达到人的水平就不错了。仔细琢磨一下这个思路也算中规中矩,但如果要是直接使用激光雷达难度更大。很多朋友说加个麦克风,我觉得这也是需要的,要不别人滴滴你或者是叫声你听不到。但这些都是我们的猜想。
那是不是在视觉基础上一定要再安装激光雷达呢?我从另一个角度猜想一下。
假如你就是这样一个司机,你旁边还坐着一个姑娘,这姑娘会微波和激光雷达,她会不停地把她发现的东西告诉你,我估计大多数人会让这个姑娘闭嘴,因为你可能实时处理不来这么多信息,而且发现她说的绝大部分都是你知道的,有一小部分你不知道,也不理解,还需要花时间仔细琢磨。你俩坐一块驾驶风险反而更大了。你可能会说计算机速度快,但车上的CPU总体应该赶不上人脑,但车上的激光雷达可比姑娘能说多了。
车上的美女会激光雷达
车上计算也耗电,计算需要代价,实时计算需要更大的代价。
假如有一车传感器,就相当于后面坐着30个姑娘,她们都想把发现的新东西和想法告诉你,你怎么办?
那是不是晚上下雨下雾就不能开车了,这个可是众多老司机的痛点啊,你这是不是就解决不了了?看来可能还真是解决不了。人这么聪明都解决不了这些问题,你指望几个板卡芯片就想保护我们的生命,是不是要求有点高啊?退一万步说,就算你装上了很多传感器,可是别的车装没装啊。当对面的大货车呼啸着向你冲来,你只有0.1秒了,你还想再往车上加点什么吗?
驾驶是高速运动的事,风险是本质性的,我们可以想办法识别风险,降低风险,保护周全,但风险它就在那里无法消除。
当然也没有必要大惊小怪,世界上没有绝对的安全,因为意外死在家里的人比例也不小。
不是说激光雷达不行,也不是说多配传感器不好,但一切都需要时间和数据的检验,可能加上这些会做得更好,但是要有两个前提条件,一是能充分得融合还不能添乱,确实发挥作用,不能当南郭先生(是不是南郭先生咱们说的都是猜测,必须要通过数据证实,实践出真理);二是你处理这个事不会带来驾驶操作延迟等别的问题,造成更大的风险。
特斯拉原来采用雷达的,为什么去掉我也不知道,可能出于成本考虑,也可能是数据比对后发现跟姑娘一样,安静些更安全。但我想不管是不是资本家,只要是真正能够提高安全等级的措施,不管多贵客户都是愿意买单的。资本家要是想挣钱,就得更认真地考虑客户的需求。
据说他们已经上路开测了,咱们客户不用着急下结论,可以让子弹多飞一会儿。
特斯拉还要搞机器人
看过威尔史密斯主演的电影 &34;I,robot&34;么?不知道你还记不记得里面的机器人形象,就是下面这个样子。显然埃隆·马斯克 (Elon Musk)也记住了。
在详细介绍了特斯拉在人工智能方面所做的无可否认的令人印象深刻的工作之后,马斯克带来了一位身着氨纶套装的舞者,尬舞之后马斯克说明年一定能带来个真的。特斯拉的Tesla Bot,也称为Optimus, 身高1.7米,体重56 公斤,拥有“人类水平的双手”,可以重复做“危险,重复、无聊的任务。”
特斯拉机器人示意图
这个机器人可以说是特斯拉汽车技术的副产品,具体就是神经网络及其 Dojo 超级计算机方面的副产品。 Dojo听上去像是日本名字,实际上也是,就是”道场“。Dojo 是身临其境进行学习、冥想的大厅或者场所。
Dojo是日语“道场”的意思
TESLA Dojo 是一种神经网络训练计算机。可以把它想象成一台强大的计算机,它使用从数百万英里的驾驶行程中收集的数据来“学习”如何自行执行操作,即无需使用预定义的算法进行显式编程。然后可以通过无线更新将经过 Dojo 训练的软件推送到特斯拉汽车。TESLA正在开发自己的计算机芯片来为 Dojo 提供动力,其中最新的芯片被称为 D1。该芯片采用 7 纳米制造工艺,功耗低且具有强大的处理能力。
D1不仅仅是单个芯片,还能够连接起来协同工作。Tesla 计划将 25 个这样的芯片放置在单个磁贴上,最后将120 个磁贴放在多个服务器机柜中,以创建 Tesla 为 Dojo 提供所需的计算能力。
特斯拉的D1芯片不仅强大,还能组合使用
马斯克说,机器人只是一辆没有轮子的特斯拉。马斯克表示,建造一个替代人类的机器人——世界上没有一家公司能够实现这一目标——但是特斯拉开发自动驾驶汽车推动这一工作向前迈出了合乎逻辑的一步。
“我们的汽车是带轮子的半智能机器人,把它放在人形上是有道理的。我们在传感器、电池和执行器方面也非常擅长,所以我们认为我们可能会在明年某个时候推出一个基本上看起来像这样的原型。-------马斯克”
Tesla在机器视觉上采用摄像头的韧劲全世界有目共睹,也确实带来了巨大的技术收益,是不是很难想象装着激光雷达的机器人在大街上行走?激光雷达是车辆专用技术,要想变得更聪明,就要模仿人类。
因为毕竟大脑+视觉的解决方案是人类在地球生存两百万年进化出来的结果,别忘了生物学家怎么说的:
”如果我们的大脑非常简单,简单到我们可以理解它,那么,有着这种简单大脑的我们实际上会非常愚蠢,愚蠢到我们根本无法理解自己的大脑!”
博士聊IT,感兴趣加关注!
「博士聊IT」一文看懂编程的本质,程序员有前途么?
低代码无代码平台的未来在哪里?编程语言的进化史告诉你答案
软件架构师必读:面向对象编程思想(OOP)的由来与本质
中国为什么没有自己的编程语言?哲学、数学和语言学基础是关键
七步成诗,软件是如何把人类思维翻译成机器代码的
版权声明
本文仅代表作者观点,不代表蜻蜓百科-做你身边的百科发动机立场。
本文系作者授权蜻蜓百科-做你身边的百科发动机发表,未经许可,不得转载。