第三波人工智能浪潮在自然用户接口(Natural User Interface, NUI)上有突破性的进展,包括影像(Image、Video)、语音(Voice)与文字(Text)的辨识/生成/分析,机器学会人类日常生活中所使用的沟通方式,与使用者的互动不仅更具亲和力,也能对周围的环境做出更合理、更有智慧的判断与反应。将这种能力附加到产品上,可使产品的应用发展爆发无限可能,包括自动驾驶(Self-Driving)、无人机(Drone)、智能家居(Smart Home)、制造/服务机器人(Robot)、聊天机器人(ChatBot)等,不胜枚举。
从这一章开始,我们逐一来探讨影像(Image、Video)、语音(Voice)、文字(Text)的相关算法。