让人工智能拥有了类人的智能以及专家级决策能力水平的时候,也就意味着机器拥有了超级大脑。但这仅仅是解决了超级大脑的问题,并不能取代人类社会的大量重复、危险性的工作。因此,机器人就被再次重视。简单来说,就是打造一种类人,或者是其他形态的物理躯体,以人工智能这种超级大脑来实施、执行、完成大量的具体工作。比如,当基于GPT的智能医生具备了诊断的能力,但没有物理躯体的时候,机器就无法实现对于外科手术的操作。而要想让人工智能真正的取代人类社会的一些工作,尤其是一些重复性劳动力工作,机器人就是必然的选择。
机器人的概念看起来简单,其实是非常矛盾和多元的,我们会发现,问不同的人能得到不同的答案,一些人认为机器人就是类人的机器,一些人则认为机器人是具备智能的自动化工具,甚至世界各地的组织机构和出版物,给机器人的定义也是五花八门。比如基于AI技术的GPT是不是机器人?还是说必须是具有物理实体机器形式的智能设备才叫机器人?又或者说只有人形一样的躯体与AI智能大脑的才能被叫作机器人呢?其实都对。为什么都对呢?因为我们人类社会至今对于机器人的定义还是模糊不清的。
如果一定要找一个相对认可的定义,那就是联合国标准化组织采纳了美国机器人协会给机器人下的定义,认为机器人是一种可编程和多功能的,用来搬运材料、零件、工具的操作机,或是为了执行不同的任务,而具有可改变和可编程动作的专门系统。
那么美国机器人协会给机器人下的这个定义准确吗?正确吗?其实也不准确,只能说是基于之前AI和人形机器人技术都还没有获得突破之前,我们站在之前技术的视角来看待机器人图景所描述的一种定义。
从“机器人”这个词的起源来看,一般认为,“机器人”一词来自出生于波西米亚的剧作家卡雷尔·卡佩克(Karel Capek)在1921年的剧作《罗萨姆的万能机器人》( Rossum’s Universal Robots )。在这部作品中,一位哲学家研制出一种人造劳工,这些人造劳工外貌与人类相差无几,被资本家大批制造来充当劳动力。因此,大部分人认为,卡佩克就是“机器人”一词的创造者。虽然在卡佩克之前,就有人设想和制造过类似于机器人的概念和物件,比如中国古代多个朝代都有人制作类机器人的物件、达·芬奇设计的一款能动的骑士,但后来,这些都被逐步纳入卡佩克使用的“机器人”这个概念之下。
在当前机器人技术的实现上,我们可以看到,机器人在概念上具备的一个重要特征,就是为人类服务,主要是从替代人类劳动力工作的设想角度出发的。
到目前为止,这种设想依然是我们对于机器人的设想,是人类设想中机器人的本质特征。不过要注意的是,这种设想只是我们人类对机器人的设想,并不代表着拥有类人的灵活物理躯体,以及拥有强大的AI大脑之后的机器人它们自己的设想。
现在,随着技术的发展和应用的丰富,包括软件的AI层面,以及硬件的物体躯体层面的不断成熟,机器人的概念也在不断被完善。除了为人类服务之外,当前的机器人和其他自动化机器的另外一项重要区别,就是机器人具有一定的智慧性和自主性。
如果用一句话来定义,在当前的技术趋势下,到底什么才是机器人?就是拥有自我意识,具备人类智能逻辑能力,以及拥有类人灵活性的人形机器躯体,或者其他形态躯体的智慧机器。
从机器人发展角度来看,机器人的发展可以被分为三个阶段。
第一个阶段,是机器人的电气时代。1950年,约瑟夫·恩格尔伯格(Joseph Engelberger)读到了艾萨克·阿西莫夫(Issac Asimov)的小说集《我,机器人》( I,Robot ),爱不释手,随即产生了制造机器人的念头。凑巧的是,1956年,在一场酒会上,格尔伯格偶遇了发明家乔治·德沃尔(George Devol)。两人的想法一拍即合,当即决定合作创立一家生产机器人的公司。两年后,两人创造出了人类历史上第一个真正的机器人。这是一个可以自动完成搬运的机械手臂。虽然这个机械臂庞大而笨重,并且只能完成很简单的任务,但它却开创了机器人制造的先河,使得机器人进入电气时代。
为什么说是电气时代?因为在这个阶段,机器人更多是以机械臂为主的一种形态。这些机器人主要用在工厂里替代部分工人完成一些复杂的工作。这个时期的机器人基本上不具备什么智能化,我们可以简单地理解为自动化生产的一些操作,相对比较简单,就像电梯一样,执行简单重复的机器任务。人类通过简单的程序设置,让机器干什么,它就干什么,只会点到点的完成对应的操作。
第二个阶段,是机器人的数字时代。这个阶段基本上是在2000年之后,这个阶段的机器人,主要得益于传感器与芯片产业技术的突破,让传感器与芯片越来越微型化、精准化。这就使融入了各种传感器之后的机器人,已经能够感知环境,并具有一定的智能了。但这个阶段的机器人所具有的智能依然是非常有限的,主要是模仿人类的思维活动并在一定程度上能够替代雇佣工人的脑力劳动。
较之于电气时代的机器人来说,数字时代的机器人只不过是在过去的基础上增加了一个具有学习、感知、识别、判断与决策等功能的智能控制系统,数字时代的机器人贯彻的仍然是“程序化地分解工序——标准化的工作流程——机械化的生产方式”的工作原理。
简单来说,这个时期的机器人虽然具备了一定的智能化,但总体来讲,这种智能化并不具备自主性,没有很强的思考能力,更多的还是需要人工预先去完成一些视觉识别功能的编程,再让机器人去完成对应的工作,核心还在于缺乏一个智能大脑。
举个例子,这几年一直备受关注的自动驾驶,就可以被视为具有一定智能和感知能力的机器人。它们搭载了各种传感器,如摄像头、激光雷达、超声波传感器等,用于感知车辆周围的环境和其他道路用户。这些传感器收集到的数据被传输到一个中央智能控制系统中。在这个控制系统中,算法和程序分析感知数据,做出关于车辆行驶的决策。例如,当自动驾驶汽车感知到前方有障碍物时,智能控制系统会通过分析数据来判断是刹车还是绕过障碍物。这个控制系统还能够学习和适应,根据不同的驾驶环境和交通状况作出合理的决策。但是,尽管具有一定的智能,目前的自动驾驶汽车能力仍然有限,更多的是基于预先编程的算法和规则。这与早期机器人相比有了显著的进步,但仍然不足以完全模仿人类的复杂智能和判断能力。
到了第三阶段才是真正的智能机器人时代,也是目前机器人正在经历的阶段。我们可以看到,2016年之后,大量的智能化算法出现,这些智能化算法一个很好的落地场景就是机器人。因为机器人是非常普及或者未来会更加普及,并且能够适应非常多样的设备载体,所以大量的智能化算法都会与机器人相结合。
智能算法让机器人变得更加智能和灵活,使机器人可以通过传感器感知环境,利用智能算法分析感知数据,做出更加智能化的决策和行动。智能机器人不仅可以执行预先编程的任务,还能够从经验中学习,不断优化自己的表现。这种自主学习和适应能力使得机器人能够在复杂、不确定的环境中更好地发挥作用。
机器人的发展受到两方面技术的制约,一方面是机器人的物理躯体层面,另一方面是机器人的大脑。而现在,以GPT为代表的AI大模型技术已然实现了机器人智能大脑技术的突破,这也进一步加速推动智能机器人的实现。那么,为什么说以GPT为代表的AI大模型的爆发,对于智能机器人来说是一次重大突破,大模型的突破对于机器人的发展有怎样的影响?
究其原因,虽然在更早以前,智能算法就赋予了机器人一定的“智能”,但根本上来说,智能算法在类人语言逻辑层面并没有真正的突破,这就使基于智能算法的机器人和智能依旧没有什么关系,依然停留在大数据统计分析层面,超出标准化的问题,机器人就不再智能,而变成了“智障”。可以说,在以GPT为代表的AI大模型出现以前,市场上的机器人在很大程度上还只能做一些数据的统计与分析,包括一些具有规则性的读听写工作,所擅长的工作就是将事物按不同的类别进行分类,与理解真实世界的能力之间,还不具备逻辑性、思考性。
因为人体的神经控制系统是一个非常奇妙系统,是人类几万年训练下来所形成的,而此前的机器人不论是在单纯的AI思考性方面,还是在与机器人硬件的协调控制方面,都还只是处于起步阶段。也就是说,在ChatGPT、GPT-4这种生成式语言大模型出现之前,我们所有的人工智能技术,从本质上来说还不是智能,只是基于深度学习与视觉识别的一些大数据检索而已。
但GPT技术却为机器人应用和发展打开了新的想象空间。GPT为机器人带来最核心的进化就是对话理解能力,同时具备与拥有了类人的语言逻辑能力。
那么为什么说具备类人的语言逻辑能力,拥有对话理解能力是GPT为机器人带来的最核心、最重要的进化?因为语言理解不仅能让机器人帮助我们安排日常的生活和工作,而且还能帮助人类直面科研的挑战,比如对大量的科学文献进行提炼和总结。
无论是谁,仅凭自己的力量,都不可能紧跟科学界的发展速度。比如,在医学领域,每天都有数千篇论文发表。哪怕是在自己的专业领域内,目前也没有哪位医生或研究人员能将这些论文都读一个遍。但是如果不阅读这些论文,不了解最新的研究成果,医生就无法将最新理论应用于实践,就会导致临床所使用的治疗方法陈旧。在临床中,一些新的治疗手段无法得到应用,正是因为医生没时间去阅读相关内容,根本不知道有新手段的存在。如果有一个能对大量医学文献进行自动提炼和总结的机器人,就会掀起一场真正的革命。
而GPT之所以被认为具有颠覆性,其中最核心的原因就在于其具备了理解人类语言的能力,这在过去我们是无法想象的,我们几乎想象不到有一天基于硅基的智能能够真正被训练成功,能够理解我们人类的语言。
目前基于GPT的智能大脑技术获得了突破,并且到了可以落地应用的阶段,能赋予机器人真正的智能大脑,这将会加速机器人应用时代的到来。
我们有望实现人类梦想中,不仅具有人类语言、逻辑、沟通能力,还拥有理解人类情感,感知人类情感的智能人形机器人——这将对社会生产和生活的各个方面都产生深远影响。
比如,2023年4月,ChatGPT的母公司OpenAI就领投挪威人形机器人公司1X Technologies(以前称为Halodi Robotics),这是OpenAI在今年第一次领投机器人相关项目。1X果然也不负OpenAI的期望,在最近举办的一场人形机器人比赛中,1X出品的EVE,击败了特斯拉的Optimus机器人。而其中,EVE机器人的部分软件功能就是由ChatGPT提供支持,也就是说将ChatGPT实体化已经应用在现实场景中了,并且展现出不弱的实力。这就意味着,目前对实现类人的智能人形机器人最大的制约,并不在于智能大脑,而是在于物体躯体的灵活性方面。
再如,在医疗领域,目前,谷歌和亚马逊都已经出手了。
谷歌声称自己发布了首个全科医疗大模型——Med-PaLM M,不仅懂临床语言、懂影像,还懂基因组学。而在246份真实胸部X光片中,临床医生表示,在高达40.50%的病例中,Med-PaLM M生成的报告要比专业放射科医生的更受采纳,Med-PaLM M用于临床可以说是指日可待。谷歌自己也做出了评价,说这是人工智能在通用医学史上的一个里程碑。
亚马逊则发布了AI医疗应用HealthScribe,HealthScribe可以帮助总结医生就诊的情况并创建临床文档,包括转录并分析医患讨论、添加人工智能生成的见解等。
可以说,医疗机器人很快就会真正落地,从问诊机器人到手术机器人,医疗行业将会经历一场全面的AI化。这不仅将非常有效地解决当前医生医疗水平之间的差异,还会最大程度地解决就医难的问题。大部分常规疾病的诊断都将由机器人医生所取代,那么,未来是不是可以基于人形机器人技术,打造一个基检查、诊断、手术,也就是内外科为一体的全能型机器人医生呢?
这是完全有可能的。至于为什么会是基于人形的机器人,主要的核心是站在我们人类的认知与情感接受度层面来看待,如果将机器人医生设计成机器狗的样子,尽管在医疗能力上与人形或者其他物体形态的机器人之间并没有什么差别,但是我们人类的认知情感上总会难以建立情感信任与信赖,所以要将机器人设计成人形,不仅具有人形,而且是一个具有权威专家形象要素的人形机器人。
在未来的服务业领域,基于人形的智能机器人有望取代保姆、保安之类的职业。随着机器人技术的发展,机器人不仅可以当助手、管家、厨师,还可以为我们提供专业的护理服务。尽管目前的智能大脑可能还不具备超级智能和自我意识,但这丝毫不影响智能机器人以其强大、专业、友好的知识能力成为我们可以信赖的朋友。
比如,我们之前看到一些公司前台或展区设有导览机器人,很多是根据配置的问题答案库调取回答。这给我们留下的印象,这些机器人其实只是一个机器,跟我们设想中的机器人的概念还有很大的差距。但未来,接入类GPT技术的前台机器人不仅能做一些演示效果,还能真正与访客进行深入对话,通过深入交流解决来访者的实际问题。
当机器人进入工厂的时候,对制造业而言,意味着我们将真正进入一个无人工厂的时代。因为机器人不仅能够按照要求完成各种标准化工序的作业,而且基于超级大脑的机器人,还可以完成智慧工厂的管理。当然,更重要的是管理智慧工厂的能力远在我们人的能力之上。因为AI机器人在接入智慧工厂的数据之后,在算力能够支持的情况下,就可以实现实时的数据分析与决策,而我们人类的信息与数据处理能力根本无法达到AI机器人的能力程度。
而工业机器人相对人形机器人,将会更快实现普及,因为工业机器人更多的是实现定点的自动化生产工作。从目前全球的工业机器人市场行业格局来看,中国市场作为全球工业机器人最大的消费市场,占据全球出货量50%以上,但在全球最大的单一市场(国内市场),国外厂商依旧占据明显优势。核心原因就在于我们制造业的格局,主要还是附加值较低的中低端制造业占比较大的比重,而这些产业目前都要实现机器换人的升级战略,这就催生出了对工业机器人的庞大需求。而在这个需求过程中,工业机器人的国产化率,在低端低精密要求领域国产化率较高,占据超过50%以上的市场份额。但是在自由度高且精度控制难度较大的高精密度机器人领域,目前我们的市场占有率比较低。
从工业机器人的核心技术来看,主要受制于三种上游核心技术,分别是减速器、控制器和伺服系统,但是这三者合计成本占据工业机器人总成本的约60%以上,直接影响着工业机器人的定价权。尽管我们在工业机器人这三大件国产化率方面近些年均有不同程度的上升,但国外厂商依旧占据一半以上的市场份额。如果拆分来看,减速器的国产化率较高,并且每年的渗透替代幅度也最为明显,而伺服系统与控制器的国产化进程表现都相对比较缓慢。而国产化比较好的减速器产业,目前在中高端领域依然存在着技术上的困难。目前的工业机器人减速器主要分为谐波减速器和RV减速器。谐波减速器方面,国产谐波减速器易发生筒体断裂、柔轮输出轴扭转刚性不足、齿面磨损等情况。使用寿命和精度主要受制于金属原材料、设计专利、加工工艺、零件装配等方面的制约。比如最基础的装配,我们在零件组装标准化程度方面欠缺,同时也缺乏经验丰富的技工。而相比谐波减速器,RV减速器的结构更为复杂,由于其承载能力大等特点,对加工工艺的要求更为苛刻。目前,国产的RV减速器仍面临零部件定位不精准、精度标准化低、难以量产等问题。
这也就让我们看到,一方面机器人换人是大势所趋,先从工业领域开始,再随着人形机器人技术的突破而延伸到我们人类生活的方方面面中进行替代。另一方面,不论是从机器人的零部件硬件本身,还是控制系统等软件层面环节,我们国家都还存在着一定的提升空间,目前都还没有掌握技术的定价权。
不论是人形机器人先获得突破,还是工业机器人先获得突破,都将为我们实现机器人进入家庭的梦想提供帮助。比如,开车有自动驾驶的加了四个轮子的机器人,我们回家的时候有人形机器人,回家了跟机器人说“你帮我找点喝的”,机器人在接收到我们的信息后,会结合我们的习惯与我们的对话,根据我们日常的习惯判断我们可能想喝甜的还是酸的,哪个不适合我们,并且还会将水取出递给我们。这样看来,我们人类很快就将迎来一个人机协同的时代,不论从工业制造还是到日常生活,我们人类社会一切有规则的工作,都将被不同形态的机器人所取代,甚至连我们的宠物都将会被智能机器宠物所取代。