



下面详细介绍具身智能的传统研究方向。
“基于行为的人工智能”这一研究方向,由罗德尼·布鲁克斯首创,强调通过简单行为的层叠来创建复杂动作,重视与物理世界的互动。这种观点反对构建复杂的内部模型或依赖大规模计算的智能设计思路,提出智能可以从简单行为生成模块与环境的互动中产生。
也就是说,布鲁克斯提出了一个与传统人工智能研究不同的观点。他认为,智能不应依赖复杂的理论模型和计算,而是可以通过简单的感知和行为模块与环境的直接互动来产生。
首先,布鲁克斯批评了传统人工智能过于依赖复杂内部模型和推理机制的思路,认为这种思路忽视了环境中的动态变化和实际问题的不确定性。
其次,布鲁克斯提出了一种基于行为的人工智能系统,强调智能可以从机器人与环境的实时互动中自然产生,而不是通过预先编程的动作实现。这种系统通过感知模块的输入直接触发行为,而不是依赖存储的大量数据或状态实现。
再次,布鲁克斯主张简化认知过程,通过物理互动直接解决问题,而非通过复杂的算法或模拟。他认为,智能行为更多是对环境刺激的直接响应。
最后,布鲁克斯还提出智能系统需要具备适应不断变化环境的能力,通过不断试错和环境反馈进行学习与进化。
布鲁克斯的工作为日后具身智能的发展奠定了基础。
该研究是从生物大脑的实际结构和发展过程中汲取的灵感。研究者尝试模拟动物感知并与世界互动的方式,目标是在人工智能系统中复制类似的架构和功能,特别是实现机器人的情感感知与表达。
基于神经生物学的机器人情感研究的核心观点如下。
❑情感的普遍性:如果动物可以拥有情感,那么机器人理论上也能够具备情感。相关的研究论文批评了将情感视为人类特有的狭隘观点,并提倡通过比较动物与人类的情感来深入理解情感机制的生物学基础。
❑情感的神经机制:该研究反对传统观点,即情感完全由大脑的特定中心(如“边缘系统”)产生,强调神经调节机制在情感的形成、维持及情感在行为、认知协同中的重要作用。
❑情感的功能性:研究情感的功能比深入探讨情感的本质更有成效。情感的主要功能是实现信息的多级交流。这些信息虽然经过简化,但仍然具有高度的影响力。
❑情感在机器人中的实现:理解情感的功能与机制将有助于在机器人技术中模拟并应用情感,从而提高机器人的适应性和互动性。
此外,该研究同样面临挑战,例如:产生情感的个体差异极大;情感常常在刺激消失后依然持续存在,保持动态特性。该研究提倡通过实验验证情感的各种理论模型,并通过跨学科合作进一步探索情感的复杂性和实用性。
该方向以模仿人类发展心理学的方式探索机器人如何从环境中学习。它结合发展心理学、神经科学和认知科学的见解,研究机器人如何通过感知-运动和社会互动经验逐步学习和适应环境。这个方向的一个重要理论是动态系统理论。
具体来说,该理论提出了以下核心观点。
❑认知是即时事件:认知是与当前环境紧密相关的即时事件,每一次思考都是独特的,依赖于不断变化的外部世界和内部认知系统。传统的认知理论倾向于使用固定的概念或命题性表示来解释人类认知的稳定性,而动态系统理论则认为这些概念可能会过时。
❑认知嵌入物理世界中:认知不是孤立存在的,而是通过身体与物理世界的持续互动而变得适应并与环境紧密相关。智能的发展依赖于身体与环境的互动以及感知-运动活动的结果。
❑认知是非静态系统:认知系统是非静态的,其行为和内部机制会随着与物理世界的互动而发生变化。要想理解认知发展,就需要理解嵌入物理世界的认知系统是如何通过自身活动发生变化的。
❑多模态感知:认知的发展会受到多种感官系统的影响,这些系统为我们提供了对于同一外部世界的不同角度的输入。这些不同的感官系统的输入在时间上对齐,相互作用,从而推动认知系统内部的变化和发展。
❑探索和社会互动:婴儿通过探索和社会互动来学习及适应环境。例如,婴儿通过触摸和移动来了解物体的属性和空间关系;而社会互动,如与父母的面对面交流,也为婴儿的认知发展提供了丰富的学习机会。
动态系统理论可以用于解释认知如何通过实时过程与物理世界紧密结合。这一理论挑战了传统认知发展理论中对概念和常态认知机制的依赖,提供了一个更为综合和动态的认知发展视角。
在进化机器人学中,机器人系统的设计受到模拟自然选择过程中进化算法的指导。机器人或其控制器被迭代选择、复制和变异,以改善任务性能,使其能够适应复杂环境而无需显式编程
。进化机器人学灵感来源于达尔文的适者生存原则,将机器人视为在与环境的密切互动中自主发展技能的人工生物,无须人类干预。进化机器人学大量借鉴生物学和行为学的理论,使用神经网络、遗传算法、动态系统和生物形态工程等工具。由此产生的机器人与简单的生物系统共享了许多特性,如稳健性、简单性、小尺寸、灵活性和模块化。
这个方向的论文“Embodied Intelligence via Learning and Evolution”探讨了学习和进化在复杂环境中如何协同作用,通过形态学的演变产生智能控制的可学习性。论文中提出了一种名为“深度进化强化学习”(Deep Evolutionary Reinforcement Learning,DERL)的计算框架,用于模拟智能体的形态演化过程,并通过强化学习使其在生命周期中学习智能行为。
该研究的主要观点如下。
❑环境复杂性与形态智能的关系:研究发现,环境的复杂性可以促进形态智能的演化,即形态的演化能够提升新任务学习的速度。
❑形态鲍德温效应:研究表明,在形态演化过程中,进化机制会优先选择那些具备更快学习能力的形态,使其在复杂环境中更具适应性。
❑形态学的稳定性和能效:演化过程中,形态的物理稳定性和能效对智能上的学习和控制有所帮助。这些形态能够更有效地利用“身体-环境”间的被动动力学机制,简化控制问题,从而在新环境中更好地学习。
这个研究方向强调人工智能的物理形态及其与环境的互动在认知过程中的作用,认为认知过程深深植根于身体与其周围环境的互动中。
这个学术方向也为具身智能提供了启示。它的核心理论是,看似大脑控制身体,但是身体实际上对我们的思考方式有重要影响。也就是说,思考并非独立于身体存在,身体与环境的互动可以改变思考方式,使其更适应环境。
该研究的主要观点如下。
❑具身与思维:我们能够形成的思维类型基于我们的具身性——我们的形态和身体的物质属性。这种观点是理解人工智能领域过去二十年根本性变革的关键。
❑通过构建来理解智能系统:如果我们知道如何设计和构建智能系统,我们就能更好地理解智能的本质。
通过认识思维与身体的密切关系,我们可以从新的角度理解智能的工作机制和发展潜能。这些洞见和理论强调身体与认知过程之间不可分割的联系,为我们提供了全新的视角来考虑智能的本质,对未来人工智能技术的发展具有深远影响。