人工智能技术的快速发展,加快了汽车产业的智能化进程。智能汽车将成为未来汽车产业的主流发展方向,为人们带来更加安全、智能和便捷的出行体验。
2022年11月30日,美国OpenAI公司发布了一个全新的对话式AI模型ChatGPT,它由GPT-3.5系列大型语言模型微调而成,不仅能与人类进行自然的多轮对话,给出高效、精准的回答,还能生成编程代码、电子邮件、论文、小说等各类文本,引起了全世界的广泛关注。
美国哲学家约翰·塞尔曾将人工智能划分为弱人工智能和强人工智能。能够完成某一项特定任务的人工智能是弱人工智能,也被称为专用人工智能或狭义人工智能,这样的人工智能包括机器翻译、计算机下棋、图像识别等。在记忆(存储)、推理、计算方面,计算机的能力很接近甚至超过人类。能够在任何领域或任务中都表现出超越人类的能力的人工智能则是强人工智能,也被称为通用人工智能或广义人工智能。还有人将“感知”和“认知”的区别看作划分弱人工智能和强人工智能的标准。
ChatGPT使用互联网上大量公开的语料(Token)信息,对公众开放模型,收集用户的反馈并不断迭代优化模型,形成“数据飞轮”,强化机器的自我学习能力。作为生成式人工智能的典型代表,ChatGPT无疑向强人工智能迈进了重要一步。
2023年3月,新一代GPT-4正式发布。它利用深度学习大模型的优势,据说是用1.8万亿条参数来模拟人类语言的模型,支持文字、图像等多模态输入,可以应用于考试、问答、写代码、翻译等方面,表现超过了先前发布的GPT-3.5。2024年2月,OpenAI公司发布了由文字输入到1分钟视频输出的Sora,表明人工智能发展又取得了新的进步。对比来看,人脑大约有800亿个神经元和高达百万亿级别数量的神经元触突,但是一天的功耗只有200多瓦时,而ChatCPT每天的功耗却高达50万千瓦时。
OpenAI是一家位于美国硅谷的人工智能公司,成立于2015年,起初公司定位为非营利机构。Open就是开源、开放的意思。创始人包括萨姆·阿尔特曼、彼得·蒂尔、里德·霍夫曼和埃隆·马斯克,他们共同的目标是开发出一款机器人来帮助完成基本的家务劳动。后来,马斯克希望将OpenAI置于特斯拉公司内,这与其他创始人的合作理念产生了分歧,他一气之下退出了OpenAI公司,宣布要在特斯拉公司内部开发一款面向家庭的人形机器人。
在马斯克退出后最关键的时刻,微软公司于2019年投资了10亿美元,才使得OpenAI公司存活了下来。微软公司为OpenAI确定了发展目标:能够与人类进行交流并帮助人类完成各种创造性的工作,公司的性质从非营利机构转变为营利主体。人工智能的大模型也从早期的开源变成不开源,OpenAI在GPT-1、GPT-2时期采用开源方式快速发展,在GPT-3时期转为闭源。
2021年8月首届人工智能日(AI Day)活动中,特斯拉公司发布了正在开发人形机器人Optimus的消息。在2022年10月特斯拉第二届AI Day活动中,Optimus正式亮相,它重73千克,高1.72米,能够完成搬运重物和给植物浇水等工作。特斯拉公司在设计这款产品时,尽可能利用其汽车产品上已经使用的技术以降低成本,预计售价为2万美元。但是这个产品的上市时间一拖再拖,近来变得语焉不详了。
回过头来再说OpenAI。经过几年的发展,微软公司除了通过10亿美元投资得到丰厚回报,还利用股东的优势,将ChatGPT的应用导入微软公司的产品中,例如,在搜索引擎Bing、办公软件Office、协同应用Team中导入ChatGPT以增强软件功能。微软公司还用基于大模型开发的智能辅助办公系统Copilot代替原来的语音识别系统Cortana,除了继承语音识别功能,Copilot也是软件开发工具。利用这个工具和微软公司的云Azure,软件开发者可以开发出智能辅助技术的软件,供用户使用。
以ChatGPT为标志,人工智能技术的发展开始进入全新的发展阶段——强人工智能阶段,从过去的“感知”世界转变为开始“认知”世界,除了传统的记忆(存储)、分析、判断功能,它还具有一定的模仿创造功能。只要是在互联网上出现的信息,它都可以迅速地将其收集归并,按照一定的逻辑形成最终的作品。目前,ChatGPT以语言文本的功能为主,也提供绘画、图像等功能。但是模拟不是创造,距离真正实现“认知”功能还任重道远。举例来说,它可以按照人类给定的主题模仿齐白石的作品风格画一幅画,尽管不是出自齐白石之手,却完全可以乱真,但这毕竟是模仿,人工智能缺少创造性,因此不可能绘出与齐白石齐名甚至超越齐白石的画作。当然,ChatGPT绘画也好,作诗也罢,都不如它的文本表达那么出色,不过这也为之后的发展留出了空间。人工智能最终不可能超越人类,当然这只是我个人的理解和看法。
人们一般把参数数量达到数亿或数十亿级甚至更多的深度学习模型称为大模型,如Sora和GPT-3。从GPT-3到GPT-4,其参数数量就增长了约10倍,从1750亿增长至约1.8万亿。后续的AI大模型要超越GPT-4,其参数数量还将以指数级规模增长。当大模型参数足够大的时候,经过不断学习与训练,就可以实现人工智能的应用。当然,从规避公司风险的角度出发,这种大模型的设计,必须在政治、宗教、法律、种族、道德、风俗等方面设定一些限制。
像ChatGPT这样的通用大模型,采用了深度学习等算法,基于神经网络架构来处理和生成自然语言,其本质是通过大规模的文本数据的学习、训练和微调,掌握语言的模式和规律,产生了改变人机互动模式的颠覆性结果。
在通用大模型发生重大突破的背景下,专用大模型的行业应用,尤其是在汽车行业这样的重点行业中的实际应用是可以预期的。例如,专用大模型完全可以利用大量的驾驶数据和传感器数据进行训练,以帮助开发自动驾驶技术。这些模型应用于行驶路径规划、交通感知、障碍物检测和驾驶决策等方面,可以提高自动驾驶系统的准确性、可靠性和安全性。
这一轮由OpenAI引领的生成式人工智能的发展非常迅猛,各类大模型、应用场景涌现。人工智能对国内汽车企业来说既是机遇也是挑战。
人工智能是如何由边缘走向中心的?
早期的人工智能研究聚焦于机器的记忆和逻辑推理,机器在这方面很早就表现出比人类更强的能力。在第二次世界大战中,交战方都使用了飞机和火炮,要想打得准,必须精确计算以确定炮口的方位和角度,才能保证射出去的炮弹命中目标。1946年初,在美国国防部的支持下,宾夕法尼亚大学研究出世界上第一台计算机ENIAC(如图1-3所示)。当时美国正在研究原子弹——就是当年绝密而后来轰动世界的“曼哈顿计划”——原来计划用这台计算机来精确计算原子弹爆炸的高度和波及范围,以便更好地发挥原子弹的威力,但是当这台计算机研发成功时,第二次世界大战已经结束了好几个月,它失去了用武之地。这台计算机占地150平方米,总重30吨,使用了18000只电子管、6000个开关、7000只电阻、10000只电容器,耗电量140千瓦,每秒可以进行5000次加法运算,比人类最快的计算速度快了1000倍以上。
图1-3 世界上第一台计算机ENIAC
在计算机发明之前,有三位杰出科学家对计算机理论做出了突出贡献。
第一位是约翰·冯·诺依曼,他创立了早期计算机的系统结构,就是把程序指令存储器和数据存储器合并到一起的计算机架构,即冯·诺依曼架构。冯·诺依曼也参加了“曼哈顿计划”,他的任务就是精确计算原子弹爆炸的高度,以便美国空军做好相应准备。
第二位是图灵,他是英国数学家和密码学家。第二次世界大战期间,他为英军培训了许多密码破译人才,为破译德军密码设计了多种方法,其中最为人称道的是他发明了破译机,用它破译德军密码又快又准,为盟军最终打败德军立下了汗马功劳。图灵对计算机“思考”问题非常热衷,设计了“图灵测试”,也就是让一台计算机和一个人分别回答测试人员的提问,采用盲测方式,最终由测试人员根据回答判定哪个是计算机、哪个是人类,以此探究机器是否能模拟出与人类相似或令人无法区分的智能。其实图灵关心的是如何让机器代替人类完成一些工作,只要能够做到这一点,就说明机器是具有智能功能的,机器还是要靠人类为它编制的程序去完成任务的。
第三位是克劳德·艾尔伍德·香农,他是一位美国数学家,也是信息论的创立者。图灵和冯·诺依曼分别在41岁和53岁去世,香农则继续探索,推动人工智能成为专门的学科。20世纪90年代,他开创的信息论在世界各地被应用于计算机领域并获得快速发展。不幸的是,他本人晚年患上了阿尔茨海默病,世界上最聪明的人之一却饱受精神疾病的折磨。
人工智能在发展的早期,主要用于处理一些遵循明确规则的事务,这与人类的逻辑思考方式相似。人们通过编制计算机能够识别的程序来让其工作,例如计算、下棋等。随着运算速度的提升,计算机在计算方面的能力远远超过了人类。但是,鉴于人类大量处理的是没有固定规则的事务,根据这类处理的需要,人类发明了神经网络(或称神经元)计算。
杰弗里·辛顿是一位谦逊的英国计算机科学家,是现代神经网络计算最重要的开创者之一。他通过模仿人类在形象思维时神经元之间的联系,发明了利用大数据计算分析得出结论的方法。计算机将存储在计算机内不同位置的数据联系起来进行协同处理,与人类的神经元处理信息很相似,所以这被称为神经网络计算。
传统人工智能的局限在于计算机只能按照一系列基本规则运行。杰弗里·辛顿和另一位研究人员发明了“反向传播”算法,这后来在神经网络中广泛使用。它使得神经网络通过调整连接权重来学习,从而实现自学习、自组织,当计算机输出的结果与正确的结果相同时,计算机就会记住赋予的权重,形成“记忆”,永远不会错了。如果输出的结果与正确的结果不符,神经网络就会设置一个错误信号,然后将其返回输入端,流程会更改原先设定的权重,这时再次检测输出端结果,循环往复,直到结果正确为止。
一般而言,计算机所拥有的神经元越多,它能够处理的信息就越复杂,更大的神经网络通常能够更优地得到正确的结果。举例来说,如果要让计算机识别一幅图像上的宠物是猫还是狗,那么就该想想人类大脑是如何识别这两种动物的:显然,我们并不是依据动物的定义进行识别的,而是依据模糊的经验进行判断,从而得出结论的。事实上,我们也没有完全搞明白这样的识别机制。一个计算机神经网络的前几层会对图像进行抽样,选取图像重要的特征,删除背景等非关键内容,分析特定内容,只要神经网络参数足够多,计算机得出的结论就会更大概率地接近真实结论。这就是人工智能大模型参数的意义,“大力出奇迹”。
随着计算机运算能力的快速提高,人们可以对运算进行分层处理,人类只需要训练第一层特征,之后的训练都由计算机自己完成。每次得出的结论是对还是错,计算机可以通过与在互联网上找到的猫的图像进行比对,如果不符合猫的特征,计算机会将结果反馈到上层神经网络,通过调整权重重新计算,直到得出正确的结果。对于各种各样的类似猫而不是猫的动物,比如老虎,计算机可以一层一层地分析,确定该动物不是猫而是老虎,进而分清它是哪种类型的老虎。
在整个分析过程中,深度学习网络能够识别出许多特征,其中一些可能与当前的任务无关,而另一些则高度相关,机器会记住这些高度相关的特征,以便在未来遇到相似图像时能快速识别。除了上述的图像识别,语音识别技术也已经成熟并大量应用于日常生活中。识别不同语言并充当翻译对计算机来说实在“易如反掌”,只需一本字典加上语法规则就足够了。计算机最难识别的是人名和小地方的地名,因为它们大多没有命名规律。
人工智能的发展并非一帆风顺,而是经历了沉浮起落。
1956年,达特茅斯会议第一次提出“人工智能”这个概念。这次会议中,众多学科中最杰出的10位科学家在新英格兰地区汉诺威市的达特茅斯学院齐聚一堂,其中有香农、约翰·麦卡锡和马文·明斯基,他们在最后的会议文件中定义了人工智能:“人们将在一个假设的基础上,继续进行有关人工智能的研究,那就是学习的各个方面,或智能的各种特性,都能够实现精确描述,以便我们能够制造机器来模仿学习的这些方面和特性。人们将尝试使机器读懂语言,创建抽象概念,解决目前人们的各种问题,并且能自我完善。”
20世纪60年代形成了人工智能的第一次热潮。这一时期的发展以符号逻辑为主要特征,用某种符号逻辑来表示已有的知识和要解决的问题。几何定理证明程序、国际象棋程序、跳棋程序、规划系统等一批有影响力的成果陆续产生,感知机器模型出现,而神经网络受到很多研究者的关注。1958年,人工智能的创始人之一赫伯特·西蒙曾乐观预测10年内计算机将打败国际象棋世界冠军,不过这一预言并没有如期实现,直到约40年之后,IBM的“深蓝”国际象棋计算机才最终完成这一壮举。事实证明,人工智能发展的难度远远超出当时科学家的预测。很快,人工智能的第一次热潮退去,进入了10年左右的低谷期。
人工智能第二次热潮的标志性事件是在1982年,日本启动了雄心勃勃的第五代计算机工程,准备在10年内建立可高效运行的Prolog智能计算系统。20世纪80年代中期,神经网络计算也迎来了一次革命。反向传播学习算法的提出,使得神经网络成为研究重点,这是与符号逻辑并驾齐驱的一种连接方法。20世纪80年代末,人工智能开始结合数学理论,形成更实际的应用。但是随着1991年日本第五代计算机工程宣告失败,人工智能的发展又进入了长达20年的第二个漫漫寒冬。
2006年,杰弗里·辛顿和鲁斯兰·萨拉赫丁诺夫在《科学》杂志上首次提出了多层神经网络系统的概念,即通过多层神经网络,机器可以更多地代替人来标定答案对错,借助无监督的逐层初始化方法,可以解决神经网络训练困难的问题。正是这篇论文,将深度学习导入人工智能系统,开启了人工智能第三次热潮。图1-4示出了深度学习相比传统算法的突破。深度学习神经网络使得计算机的识别率越来越高,在语音识别、图像识别、机器翻译等方面的应用越来越广泛。2016年,基于深度学习的人工智能围棋程序战胜了围棋高手李世石,进一步掀起了人工智能发展的热潮。
图1-4 深度学习相比传统算法的突破
我们经常在媒体上、在文艺作品里知悉有关人工智能的五花八门的表述,如人工智能、机器学习、神经网络、深度学习等,很容易混淆。按照我国人工智能专家陈云霁等人所著《智能计算系统》中的定义,人工智能是一个很大的范畴,包括机器学习、计算机视觉、符号逻辑等不同的分支。其中,机器学习分支又有许多子分支,如神经网络、贝叶斯网络、决策树、线性回归等。目前,主流的机器学习方法是神经网络计算,而神经网络计算中先进的技术是深度学习。
现在国际上正在研究新一代人工智能的发展方向。究竟什么是新一代人工智能,还没有形成统一认识。比较一致的看法是,新一代人工智能是基于神经网络的智能计算系统。具体来说,每个神经元都可以从外界输入数据,科学家为每个神经元赋予一个权重,计算机对所有的神经元进行加权计算之后,通过一个非线性函数得到该神经元的输出。几十年来,通过感知机模型、反向传播训练方法、卷积神经网络、深度学习等方法,人工智能研究不断深入,应用越来越广泛。从图1-5中可以看到70多年来人工智能研究历程中的一些重要里程碑事件。
图1-5 人工智能研究的重要里程碑事件
按照陈云霁的观点,新一代人工智能将不再单纯追求智能算法的加速,而是通过近乎无限的计算能力,给人类带来前所未有的机器智能。这里的核心问题在于如何通过高计算能力提升智能。如果只是把一个深度学习模型做大、做复杂,那么高计算能力也仅能将某些模式的识别精度再提高几个百分点,难以触及智能的本质。因此他设想,未来的新一代智能计算系统将是一个通用人工智能发育的沙盒虚拟世界,通过近乎无限的计算能力来模拟一个逼近现实的虚拟世界,在虚拟世界中,人工智能发育、成长、繁衍出海量的智能主体(或者说人工生命),智能主体可以在虚拟世界中成长,通过和外界环境的交互,逐渐形成自己的感知、认知和逻辑能力,甚至理解虚拟世界、改造虚拟世界。这就是通用人工智能追求的最终目标,实现这个目标可能需要三五十年甚至三五百年,但是为了人类的进步,仍然值得朝这个目标努力。
我国的人工智能的发展过程非常曲折坎坷。在20世纪50—70年代,人工智能还没有被纳入科学范畴,反而经常被认为是唯心主义的伪科学而遭到批判。1978年,全国科学大会召开,我国科技工作迎来了“科学的春天”。改革开放后,我国真正认识到我们的经济、技术已经大大落后于国际先进水平,于是奋起直追。数学家吴文俊提出的利用机器证明几何定理的研究(国际上称为“吴方法”)获得了全国科技成果奖,标志着人工智能被正式认定为科学,也是从那时起,国外人工智能被引进国内,令业界瞩目。
吴先生的主要成就表现在拓扑学和数学机械化两个领域,后者实际上就是使用计算机帮助解决数学推理等问题。他在应用数学领域解决了一系列科学问题,与此同时,把中国古代数学思想的精髓总结出来,除了向世界介绍中国五千年文明的历史,他还鼓励国人将中华优秀传统文化应用于当代实践中,比如他将中国算术中的“术”与人工智能的算法进行比较,认为二者有异曲同工之妙。他不仅开创了用计算机来证明几何定理的先河,还用开普勒定律推导牛顿运动定律、解决化学平衡问题等。吴先生是中国人工智能的第一位开拓者,我们理应尊他为“中国人工智能之父”。
事实上,在20世纪70年代,虽然我国没有使用“人工智能”这个词,但是用机器代替人工识别文字、图像的工作却一直在进行,有一些成果也得到了推广应用。比如,当时在全国范围内推广邮政编码,这为邮政局用机器代替人工分拣信件提供了可能。寄信时要在信封左上角画好的方框中填写数字,人们只能手工填写,由于笔迹不一,这就产生了让机器识别手写数字的实际需求。经过攻关,问题得到解决,信件分拣效率大大提高。这正是从简单的图像识别开始,一步步完善技术,机器识别复杂图像的能力也在不断提升。
在20世纪80年代,系统论、信息论、控制理论被正式引入中国,这“三论”揭示了客观事物是由物质、能量与信息交互作用的统一整体和动态过程。
当时人们对物质、能量有了很深刻的认识,但是对信息的了解却十分肤浅。其实信息不仅是与物质、能量并列的组成世界的三大基本要素之一,而且是对客观事物的特征、关系的一种反映。信息输出通常伴随两种反馈机制:一种是正反馈,会使信息不断增强;另一种是负反馈,会使信息不断减弱。信息论揭示了控制某一系统而不是控制某一事物的本质特征,使人们认识世界从过去的以实物为中心转变到以系统为中心。
这些理论为我国人工智能的发展奠定了基础,为科研人员提供了全新的研究方法,对广大群众来说也是一次认识世界的科普教育。钱学森先生对“三论”的引进和普及做出了突出贡献,他也是中国人工智能事业的重要奠基者和推动者。
2006年是世界人工智能诞生50周年,这一年的人工智能国际会议在北京举办。大会期间,中国人工智能学会理事长钟义信教授接受采访时表示,中国在用机器证明数学定理方面在世界上独树一帜,在模式识别领域创造性地提出了仿生识别方法,与传统方法相比,结果更好。过去,国外人工智能应用方面不处理矛盾的问题,中国科学家提出了可拓学理论,较好地处理了矛盾的问题。可以说中国在人工智能研究领域不再是简单地跟踪国外水平,而是开展了创新性研究,取得了不错的成果。
据钟教授介绍,人工智能的发展,既有成功经验,也有失败教训。智能专家系统的水平已和人类专家的智能相差无几,比如智能专家系统对病人的诊断比一般医生更准确,“深蓝”多次战胜国际象棋世界冠军,这样的成功案例不少。然而,很早就出现的关于人工智能可以解决各种问题的预言并未实现。人工智能太复杂了,研究者们从不同角度去探索,有点像盲人摸象,在方法论上谈不上成功。中国的人工智能研究与世界先进水平的主要差距体现在应用方面,我们尽管在人工智能的软件方面水平不低,但在硬件、机器制造方面水平不高,这是今后需要努力提高的方向。
在国际人工智能发展的低谷期,特别是第二次低谷期,我国的人工智能受到的影响不大,一直在持续发展,主要是因为整体起步晚,与以美国为代表的技术先进的国家差距太大,低谷期反倒是我们奋起直追的好时机。由于国外先进的理论和技术能够快速传播到国内,加上计算机的普及和互联网的应用,我国人工智能的发展如虎添翼。大市场的优势也逐渐显示出威力,一大批大学和研究机构加入人工智能研究的队伍。我国关于人工智能的论文数量,在2020年就已经超过美国,位列世界第一。据国家知识产权局的信息,截至2023年底,我国人工智能发明专利有效量达37.8万件,同比增速达40%,是全球平均增速的1.4倍。
2014年6月9日,习近平总书记在中国科学院第十七次院士大会、中国工程院第十二次院士大会上发表重要讲话,对我国人工智能发展指明了方向:“由于大数据、云计算、移动互联网等新一代信息技术同机器人技术相互融合步伐加快,3D打印、人工智能迅猛发展,制造机器人的软硬件技术日趋成熟,成本不断降低,性能不断提升,军用无人机、自动驾驶汽车、家政服务机器人已经成为现实,有的人工智能机器人已具有相当程度的自主思维和学习能力。国际上有舆论认为,机器人是‘制造业皇冠顶端的明珠’,其研发、制造、应用是衡量一个国家科技创新和高端制造业水平的重要标志。机器人主要制造商和国家纷纷加紧布局,抢占技术和市场制高点。”
从2013年开始,中国超过日本成为全球工业机器人销量第一大国,这是我国制造业保持世界第一制造大国地位的必然结果。虽然我国的工业机器人制造水平在加速提升,但是与国际先进水平相比还有差距,特别是在精度保持性和可靠性方面。基础零部件方面有很多还依赖进口。
2017年7月8日,国务院发布了《新一代人工智能发展规划》,提出了面向2030年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施等。该规划确定了我国人工智能产业三步走的战略目标:到2020年人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点,人工智能技术应用成为改善民生的新途径,有力支撑进入创新型国家行列和实现全面建成小康社会的奋斗目标;到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力,智能社会建设取得积极进展;到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。
汽车产业正经历“新四化”(电动化、智能化、网联化和共享化)的变革,在很大程度上体现了人工智能技术在汽车相关领域的具体应用,例如,利用人工智能技术优化行驶路线、预测零部件可能发生的故障、精确识别实际场景。而汽车的智能化升级从辅助驾驶开始,经过部分自动驾驶阶段,最终将实现无人驾驶。智能汽车是人工智能技术的最大应用场景。
美国汽车工程师学会(Society of Automotive Engineers,SAE)在2014年制定了自动驾驶技术分类标准(SAE J3016),将自动驾驶系统分为L0~L5六类,并且对每一类都给予了明确定义。图1-6详细描述了从L0到L5各级别驾驶系统与驾驶人的不同分工。各国参照这一分类标准制定了自己的标准。2021年8月,我国也发布了《汽车驾驶自动化分级》(GB/T 40429—2021)国家标准,对比SAE对L0~L5的分类,基本与其相同,区别主要在于对L0~L2定义的描述有所不同。
图1-6 L0~L5各级别驾驶系统与驾驶人的不同分工
(资料来源:SAE)
L0一般意义上可以认为是没有辅助驾驶功能的汽车。但有时也将一些预警和应急辅助功能,如驾驶人状态监测、自动紧急制动等,加到汽车产品中。
L1、L2是初级的辅助驾驶功能。车辆行驶过程中主要还是由驾驶人来操控,但是驾驶系统(机器)可以帮助驾驶人实现一些辅助功能,L1和L2的主要区别在于L1只能提供横向或纵向单一方向的控制,而L2则可以同时实现两个方向的控制。
L3、L4属于部分自动驾驶功能,这时驾驶人可以在特定情况下将驾驶汽车的操作交给机器完成,区别在于,L3的自动驾驶功能是有限的,一旦超出限定条件,驾驶人必须接管,而L4一般不需要接管,但是当驾驶人有意愿时,机器也可以随时退出操控。无论是L3还是L4,驾驶人都可以随时接管操控车辆。
L5是真正的无人驾驶功能,这时候汽车已经没有驾驶人操控了,所有的功能都由机器来完成。
随着传感器技术和计算机技术的不断进步,大约在2015年,辅助驾驶技术逐渐在整车上得到应用。激光雷达摄像头、超声波传感器等成为辅助驾驶车辆的“眼睛”,通过传感器,汽车可以实时获取周围的环境信息,同时,机器学习和人工智能算法的发展,使得汽车能够准确地理解和应对复杂的交通环境。截至2023年底,我国汽车新车型上几乎都配装了L2及以下级别的辅助驾驶功能软件,包括自适应巡航控制,它可以根据前方汽车的速度自动调整车速,保持安全距离;自动紧急制动,在检测到前方有障碍物时自动刹车(即制动),以避免碰撞;车道保持系统,通过摄像头或传感器检测汽车是否偏离车道并自动调整方向;自动泊车辅助,它可以帮助驾驶人在泊车时自动控制转向盘转向和刹车(即制动器),使汽车停入停车位;盲点监测,检测汽车两侧的盲区,并在有其他车辆进入盲区时发出警告;倒车警报,在倒车时检测后方是否有其他车辆或行人,并发出警告;交通标志识别,通过摄像头或传感器识别道路上的交通标志,并在驾驶人需要时提供相关信息;夜视辅助,使用红外线或热成像技术,在低光照条件下提供更好的视野;驾驶人疲劳监测,通过监测驾驶人的行为和生理特征,判断驾驶人是否疲劳,并发出警告。现在,新车型若没有这些辅助驾驶功能软件,在市场上绝对不可能有好销量。
我国最早应用L2辅助驾驶技术的车型是2016年的长安CS75,这款车配备了自适应巡航控制、车道保持系统、自动泊车辅助等功能软件,随后吉利博越、比亚迪唐等车型也陆续开始配备各种辅助驾驶功能。
到了部分自动驾驶阶段,汽车必须打通车载系统和车控系统,形成整车的控制系统。在自动驾驶状态下,由传感器感知周边的各种信息,控制系统根据道路交通法的规定对各种信息进行计算分析,然后形成供决策的信息,由机器下达指令给各子系统,子系统接到指令后执行动作,完成整个操控。
近年来,人工智能的快速发展为自动驾驶汽车增添了“翅膀”,“端到端”的人工智能技术可以利用各种不同的状况所形成的场景来训练机器学会处理复杂情况,形象地讲,就好像把一个新司机培训成经验丰富的老司机。由于机器有过目不忘的特点,只要我们能够保证让它“见多识广”,它最终肯定会比老司机开得好。本书后续章节还将对相关话题展开详细说明,这里点到为止。