购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3 人形机器人是怎样炼成的

基于人体的构成,我们可以将人形机器人分为三大结构,分别是智慧大脑、物理躯体和感知系统。当人形机器人的构成系统都获得突破之后,也就意味着人类社会将全面进入一个人机协同的新时代、新纪元。

1.3.1 人形机器人的智慧大脑

作为人形机器人的核心,智慧大脑发挥着与人类大脑类似的作用,既是行为决策的中心,又具有独特的技术和功能。它是整个机器人的智能引擎,是信息处理、学习和决策制定的关键。智慧大脑是否智慧,就决定了机器人是否智慧,以及具有何种程度的智慧。智慧大脑的技术本质,其实就是人工智能——智慧大脑的构建依赖先进的算法和人工智能技术,包括机器学习、深度学习、神经网络等,这些技术在不断演进和迭代中,为人形机器人的智能化提供了强大的支持,使机器人得以接收并处理各种传感器提供的信息,具备视觉、听觉、触觉等知觉。

简单来说,人形机器人的智慧大脑需要感知和理解外界信息,并向物理躯体下达应该执行的指令,即具备“任务级交互”能力。通俗地说,我们只需要告诉它目标是什么,它就能明白并采取行动。但这并不是一件容易的事,举个例子,我们对机器人说“去接杯水”,对于人类来说这是一件非常简单的事情,对机器人来说却是一道难题。它不仅需要理解“接杯水”的含义,还要知道水龙头长什么样,如何打开,以及怎样接水才能不让水溅出来。毕竟,水龙头的样式有很多种,开启的方式也不尽相同。

用水杯接水,对机器人来说需要经过烦琐的编程,涉及的每一个指令、步骤,以及可能存在的风险都需要分解为相应的程序。而人类一旦在编程的过程中没有对相关的风险进行充分考量,以及机器一旦出现识别与理解的错误,就可能造成失误。

糟糕的是,这类事件已经发生了。2023年11月,韩国一名男子在工厂工作时因机器人识别错误而被压身亡。当时,机器人正在传输箱装的甜椒,而这名男子正在检查机器人的传感器,机器人出现了某种故障,误将男子识别成了甜椒。随即,机器人用机械臂将男子提到空中并摔到传送带上。男子被送往医院后,不治身亡。类似的事件并非首次上演,2022年3月,一名50多岁的男子在汽车工厂被机器人困住,导致身受重伤。2022年7月,俄罗斯一名7岁男孩在莫斯科参加一场国际象棋比赛时,手指被机器人“对手”夹住,造成指骨骨折。

因此,对于智慧大脑来说,必须解决的一道难题就是让机器人在执行任务时能灵活应对问题,像人类一样调整计划,而不是在明明出现了错误的识别和理解后依然执行设定的指令和算法。

其实,当前大部分的机器人仍主要依赖预先设定的指令和算法。还是这个例子,如果我们让机器人接水,程序会告诉它先走向水龙头,打开水龙头,用器皿接水,然后关闭水龙头。但如果在执行过程中出现意外,如水溅出来了,机器人并不能像人类一样灵活地处理这个问题。这是因为它的程序只告诉它如何打开水龙头,而没有涉及如何应对水溅出来的情况。所以,机器人只能按照程序执行,如果出现程序之外的问题,它无法实时做出调整。

为此,工程师需要提前考虑可能遇到的各种情况,然后将这些情况纳入机器人的程序。这可能涉及将各种情况作为程序的一部分,告诉机器人如何在不同情况下采取何种行动。比如,出现水溅出来的情况,机器人能够在程序中学习如何关闭水龙头或调整接水的方式。但这样的编程方式存在局限性。因为面对现实生活中的各种变化和复杂环境,即便是工程师也无法穷尽所有可能的情况。并且,这需要大量的时间和资源来编写、测试和完善程序。

当然,要想让机器人具备接近人类的感知能力,我们还需要对感知系统进行完善,如给机器人配备类人皮肤以及相应的皮肤感知系统。当机器人被冷水或热水溅到之后,机器大脑的指令会让其做出相应的情绪与肢体动作反应。当然,更重要的是能够有效、及时地调整相应的行为,包括对溅水环境的清洁处理等。

就像人脑对人类的意义一样,机器人的大脑对机器人来说也具有同样重要的意义,只有具备真正的智慧大脑,才能诞生具有智慧的人形机器人。

1.3.2 通向智慧大脑的三种路径

那么,如何才能让人形机器人拥有能够充分理解外界信息、处理信息,同时具有学习和决策制定能力的智慧大脑呢?基于技术来看,主要有以下三种实现路径。

第一种是基于人工智能大模型的迭代实现智慧大脑。这一路径的核心是利用先进的算法和强大的计算能力,通过对海量数据的学习和对模型参数的优化,逐步提升人形机器人的智能水平。事实上,就连ChatGPT的研发人员也没有想到,人工智能大模型会获得今天的成功。而ChatGPT的成功,根本上就是技术路径的成功。

在OpenAI的GPT模型之前,人们在处理自然语言模型时,用的是循环神经网络(Recurrent Neural Network,RNN),再加入注意力机制(Attention Mechanism)。所谓注意力机制,就是将人的感知方式、注意力的行为应用在机器上,让机器学会感知数据中的重要部分及不重要的部分。

但RNN+Attention的模式,会让整个模型的处理速度变得非常缓慢,因为RNN是逐词处理的。所以才有了2017年谷歌大脑团队那篇名为《自我注意力是你所需要的全部》的论文的诞生,简单来说,这篇论文的核心是“不要RNN,而要Attention”。而这个“没有RNN,只有Attention”的自然语言模型就是Transformer,也就是今天ChatGPT的技术基础。

只有Attention的Transformer模型不再是逐词地处理,而是逐个序列处理,可以并行计算,所以计算速度大幅加快,使训练人工智能大模型、超大模型、巨大模型、超巨大模型成为可能。

人工智能大模型路线的成功,也使机器人的智慧大脑成为可能。在人工智能大模型之前,几乎所有的人工智能产品都还有许多局限性以及“不智能”之处,但人工智能大模型具备了强大的逻辑能力。未来,随着人工智能大模型的持续进化,加上其强大的机器学习能力,以及在与人类互动过程中的快速学习与进化,人工智能大模型有望具备更高级的认知和决策能力,并成为人形机器人的智慧大脑。

第二种实现智慧大脑的路径,就是直接模拟人脑的结构和功能,构建更接近人脑的机器智能系统,即“类器官智能”。众所周知,人工智能的诞生,其实就受到了人脑机制的启发。比如,人工智能的深度学习模式就像生物神经大脑的工作机制一样,通过合适的矩阵数量,多层组织连接在一起,形成神经网络“大脑”,进行精准复杂的处理。深度学习的出现,让图像、语音等感知类问题取得了真正意义上的突破。

可以说,模拟人脑机制的人工智能在今天获得了前所未有的成功。尽管如此,今天,人脑在许多方面仍优于机器。比如,人脑的神经元能够以千赫兹的频率来发放动作电位,速度超过计算机100万倍。并且大脑是高度并行的,而计算机是线性机器。同时,大脑耗能非常低,但计算机耗能极高——训练AlphaGo所花费的能量远超过保持一个成年人思维活跃十年所需的能量。

那么,如果我们直接用人脑类器官模拟计算机呢?基于这样的设想,2022年2月,美国约翰斯·霍普金斯大学组织了第一个类器官智能研讨会,由此形成了一个类器官智能研究社区。科学家希望能用人脑类器官模拟计算机,并探索生物计算新形式。这项研究一旦成功,通过类器官智能,利用大脑的计算原理,科学家就可以以不同的方式完成机器智能的构建,为人形机器人的智慧大脑带来更多可能。

最后一种智慧大脑的实现路径,就是脑机混合。通过植入或外部接入脑机接口等手段,将人脑的信号与机器人的控制系统相连,实现人脑对机器人的直接操控。这一路径的优势在于能够充分利用人脑高度发达的感知和认知能力,实现对机器人更为精准和灵活的控制。当然,这一路径相较于前面两种也需要面对更多的问题,即便在技术可行性的基础上,我们还需要面临安全性、隐私保护等问题,以及随之而来的各种伦理挑战。

1.3.3 人形机器人的物理躯体

有了智慧大脑后,人形机器人还需要一个物理躯体,否则依然停留在程序层面。人形机器人的物理躯体,其实就是人形机器人的运控模块。在运控模块中,指令对关节的控制是核心,包括角度、力、速度等控制要素,保持动态平衡、行走跳跃奔跑、手部抓取等则是难点所在。

运控模块主要由驱动与传动系统、执行机构等构成。驱动与传动系统是使机器人发出动作的动力机构,目前主要有电机驱动、液压驱动、气压驱动三种主流的能量转换方式。其中,电机驱动的使用最为普遍,也最成熟;液压驱动效果好但存在成本高且维护困难的问题;气压驱动占用体积小、安全性高但控制精度和稳定性较低。

具体来看,电机驱动是利用通电线圈在磁场中受力转动的现象将电能转化为机械能的。由于产生的运动为高速旋转运动,通常需要搭配减速器来降低转速、提高转矩。现有的绝大多数人形机器人都采用电机驱动方案。

液压驱动是采用液体作为介质,通过液体压力实现驱动的方式。具有小型轻质、响应速度快、传动平稳等优势,但维护难度较大。液压驱动系统在大型、重载、特种机器人中存在一定的应用。波士顿动力公司开发的机器人Atlas采用的便是液压驱动方案。

气压驱动与液压驱动的结构和原理类似,将空气作为压力传导介质,各组成元件可参考液压驱动系统。气压驱动系统较液压驱动系统更小、更轻,但控制精度不高,响应速度不够快,运行噪声较大,多应用于仿生机器人等部分领域。

执行机构是机器人实现行走、完成各类操作时的四肢等运行部位,其运行主要依靠内置的伺服系统、减速器等零部件。

其中,伺服系统是一种可以精准输出运动状态的驱动装置。伺服电机广泛应用于机器人关节部位,对机器人的性能参数有直接影响。伺服电机主要由定子、转子和编码器组成,可以将电压信号转化为转矩和转速以驱动控制对象,具有体积小、质量小、机电时间常数小、线性度高等特性。

在电机旋转过程中,需要在设备与电机之间连接一个装置,实现输出速度减速,才能够收放自如,而这个装置就是减速器。精密减速器是人形机器人的重要核心零部件,具有传动链短、体积小、功率大、质量轻和易于控制等特点。人形机器人减速器主要包括RV减速器和谐波减速器两大类。两种减速器优势互补,应用于不同部位。

RV减速器具有刚度好、耐冲击能力强、传动系统稳定、高精度等特点,主要用于大臂、肩部、腿部等重负载位置;谐波减速器体积小、构造简易紧凑,一般用于小臂、腕部或手部等轻负载位置。

RV减速器拥有两级减速机构,分别为行星齿轮减速机构和差动齿轮减速机构。在第一级减速机构中,输入轴的旋转从输入齿轮传递到直齿轮,按齿数比进行减速。在第二级减速机构中,直齿轮带动偏心轴旋转,成为输入轴。

谐波减速器由固定的内齿刚轮、柔轮和波发生器组成。谐波减速器利用柔性齿轮产生可控制的弹性变形波,引起刚轮与柔轮的齿间相对错齿传递动力和运动,从而实现减速。当波发生器带动柔轮转动时,柔轮在长轴处与刚轮接触,在短轴处与刚轮分离,导致柔轮上的齿依次与刚轮上的齿进行啮合,达到传递扭矩的目的。

尽管人形机器人在物理躯体的搭建方面取得了不错的进展,但距离真正的类人形态还有一段路要走。比如,就传动系统而言,行走、跑步及跑到一个位置停下来,对于健全人来说是非常简单的肢体运动行为。但对于机器人而言,这是非常复杂的,并且涉及高精密的机械控制,如在跑步的时候需要高速传动,包括齿轮的高速运转及传递出相应的力。但当机器人要从跑的动作切换成停的动作时,就需要使这些处于高速传动运动中的各种机械装置,实现快速制动,并且要达到类人形态的平稳、精准的制动水平。

这不仅对传动系统的制动提出了很高的要求,同时对于机器人内部的零部件的精度、材料的使用寿命和承受强度等方面都提出了空前的挑战。尤其是对于人类机器人而言,在与人类共处的情况下,任何与人协作的行为,如果不能精准、有效地控制好机器输出的力量,机器“轻轻一碰”,就可能造成人类严重的骨折。

1.3.4 骨骼、肌肉和皮肤

人形机器人的运控模块,就像是人形机器人的“骨骼”,让人形机器人像人类一样自如活动,是其物理躯体的重要组成部分。但显然这是远远不够的,我们除了骨骼,还有肌肉、皮肤等,因此,想要真正像人一样,人形机器人也需要一个包括肌肉、皮肤等在内的物理外观。

其实,肌肉对于人体,不仅仅关系着人的外表,在日常活动中,肌肉收缩牵引骨骼进行关节运动时,还起到了重要的杠杆作用。也就是说,人类之所以能保持身体平衡、灵活运动还能搬运沉重的物品,很大一部分原因来自我们身上复杂的肌肉结构。那么,这样的结构如何才能复制到机器人身上呢?

事实上,从20世纪40年代以来,科学家就一直在进行人造肌肉方面的研究,试图将肌肉组织的优势应用到机械设备中。

目前,人造肌肉的形式大致可以分为以下三类。

第一类是气动类。气动类人工肌肉就是通过柔性材料模仿肌肉组织,加上气压的驱动来模仿肌肉的柔软、灵活和轻便。想象一下,在自己的手臂下放置一个气球,通过对气球不断充气,手臂自然就被气球胀大的体积抬了起来,这就是气动类人工肌肉的原理。麻省理工学院曾推出过一种人造肌肉,模仿折纸结构的弹性发力,能够提起比装置本身质量重1000倍的物体。

第二类是智能材料类。智能材料有很多种,如可以通过高压静电驱动的电活化聚合物,或者能够通过环境温度变化而伸缩的凝胶——就像一块橡胶被包裹在液体之中,通过液体温度的改变产生热胀冷缩。科罗拉多大学博尔德分校的科研学者就研究出了这样的一种材料装置HASEL,利用廉价的塑料制品填充绝缘液体,再连接电极,就可以在电压通过时做出动作。在实验中,这种柔软的材料有69%的拉伸度,并且能轻柔地抓起树莓、生鸡蛋这些脆弱的物体,不会像机械装置那样对物体产生破坏。

第三类是人工培养类。日本东京大学的研究团队研发出了世界上第一个生物肌肉机器人。附着在树脂骨骼之外的并不是气囊或凝胶,而是在培养皿中利用小鼠骨骼肌细胞培养出来的“真·肌肉组织”。在电流的刺激下,单侧肌肉可以进行收缩运动,带动关节进行弯曲。

不过,仅有骨骼和肌肉还远远不足以使机器人达到人体的仿真水平。人类除骨骼和肌肉外,还有皮肤,这是与外界环境进行交互的重要器官。机器人模拟人体的“皮肤”就显得尤为关键。这种“皮肤”不仅要具备感知外界环境的能力,还要能够与人类进行自然的互动。

根据不同的功能和作用,机器人的皮肤也有分别,其中,机器人的“感知皮肤”通过集成感知技术,使之能够感知外部环境的温度、湿度等信息,从而更好地适应和响应周围环境;通过“表情皮肤”模拟人类表情的机器人,能够展示丰富的面部表情,从而提高其在情感交流中的表达能力。

这也让我们看到,除智能大脑外,人形机器人的物理躯体也是一个非常复杂的系统,想要做到真正的“类人”,不仅仅需要骨骼,还需要肌肉、皮肤等,而这些让人形机器人更具人类形象的生物学特征,也能够推动机器人更自然地执行任务、更好地融入人类社会,与人类进行更为紧密的合作。

1.3.5 人形机器人的感知系统

有了智能大脑,人形机器人就可以实现决策,有了躯体,人形机器人就可以执行动作,但在这中间还需要完成一个步骤,那就是机器人的感知,只有躯体感觉到外界的环境,才能反馈给大脑做出决策,大脑再指导躯体做出行为反应。

人形机器人的感知系统是其与外部环境互动的重要纽带。类比人体的感官系统,机器人的感知系统主要依赖传感器,如里程计、陀螺仪、加速度计、摄像头、麦克风等,以实现视、听、触等多方位感知。这些传感器充当着机器人的“感官器官”,为智能大脑提供关键信息,从而指导机器人执行特定的任务或动作。

机器人的机械视觉系统类似人类的视觉系统,包括摄像头和图像处理技术,能够捕捉和分析周围环境中的视觉信息。这使机器人能够识别物体、辨认颜色、判断距离和形状等,为其决策和行为提供重要依据。当然也包括识别人类的喜怒哀乐等各种表情,以及识别人类社会中的各种生存环境。

另一个重要的感知方式是触觉。机器人的皮肤就相当于机器人的触觉系统,使机器人能感知和反馈外部的压力、温度、形状等信息。通过触觉传感器,机器人能够感知外部环境的接触力度和纹理,进而调整自身动作或者与外界进行交互。这是设计人形机器人非常重要的一个环节,也是决定着机器人是否会与人类产生情感的关键技术之一。当人形机器人有了感知系统之后,在与人类相处的情况下,就能基于人类的生理需求提供相应的舒适状态,如机器人体温的设定,在夏天可以将其皮肤设定为相对清凉的温度,在冬天可以将其皮肤设定成相对温暖的温度。

语音传导技术则对应人类的听觉,使机器人能够接收和理解声音信息,包括语音识别、语音合成等技术,从而同人类进行语言交流,了解指令并做出反应。简单地说,机器人能借助于智能大脑,与不同人群使用不同的语言,并且以让特定对象感到舒适的声音模式开展语言对话与交流。

此外,在类似人类的嗅觉、味觉等方面,机器人也有对应的传感器。嗅觉传感器可以检测空气中的化学成分,味觉传感器则能够模拟或检测液体或气体的成分。这些传感器拓展了机器人的感知范围,使其在特定任务中表现得更为出色。

其他种类的传感器也起着重要作用。力传感器是将力的量值转换为相关电信号的器件,被广泛用于机器人各关节处。根据所测力的维数不同,力传感器可被分为一维至六维力传感器。较为流行的六维力传感器能够在笛卡尔坐标系中同时测量三个方向上的力和力矩,并将它们转换成为电信号。位置传感器可防止机器人在启动时产生过于剧烈的运动,滑觉传感器用于检测物体滑动信号,距离传感器用于导航,加速度传感器用于测量机器人的运动速度等。这些传感器不仅扩展了机器人的感知范围,同时也提高了机器人在不同场景下执行任务的准确性和效率。

可以说,人形机器人的感知系统通过多种传感器技术构建了其全面感知的基础。这些感知器官为人形机器人提供了丰富的信息,使其能够更加智能地与外部环境互动,并为智能大脑做出更准确的决策,最终指导物理躯体做出相应的行为反应。 CPwD8lYrR/bhAZ6lpp+Wcex6pRLiDG1zW1C/XOCBIBA0OgRU+9toBdw5Hmlt3JYt

点击中间区域
呼出菜单
上一章
目录
下一章
×