购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

诠视科技:自研感知交互技术突围多维体验市场

摘要: VSLAM技术是感知交互与人工智能的核心底层技术,未来虚拟现实及人工智能技术将渗透各行各业,拥有千亿美元的市场空间。上海诠视传感技术有限公司(以下简称“诠视科技”)作为一家以VSLAM算法为核心的AR/VR感知交互整体解决方案提供商,致力于向客户提供包含VSLAM算法定制、算法跨平台硬件部署、核心交互系统方案定制、应用SDK开发和整机解决方案在内的定制化服务,降低AR/VR产品开发门槛,缩短产品开发时间,满足极其碎片化的AR市场需求,帮助客户快速实现数字化转型。

关键词: VSLAM AR/VR感知交互 人工智能


1.背景描述

1.1 市场背景:千亿规模市场广阔

VSLAM技术是人机交互的底层技术,更是人工智能、虚拟现实的核心底层技术。从AR/VR便携设备、机器人到无人机,应用场景众多,拥有巨大的市场空间。VSLAM应用场景的潜在市场规模预计将高达千亿美元(来源Artillery Intelligence),随着以AR/VR为代表的可穿戴设备近年来的快速发展,受到业界的高度重视。

苹果、谷歌、微软、Meta等产业巨头纷纷投入重金收购相关技术公司,加速产品化进程。根据《IDC全球增强与虚拟现实支出指南2020V2》,至2023年,中国AR/VR市场支出规模将达到652.1 亿美元。

1.2 行业背景:业界领先的核心单元技术赋能产业升级

从AR/VR底层单元技术方面看,行业普遍的SLAM方案只是主控系统中的一个标准模块,授权收费门槛和支持费用均较高,不仅无法为客户提供完整到落地的技术服务,更不能向客户提供定制化开发与服务支持。

而诠视科技商业模式更加灵活,可根据客户不同行业和场景需求,提供从VSLAM算法定制到算法跨平台硬件部署、到核心交互系统方案定制、应用SDK开发和AR眼镜整机解决方案的各种不同层次的定制化服务。为广大不具备自研能力,以及没有长期行业经验与技术积累的企业与资本降低了快速进军AR/VR行业的门槛,帮助企业实现AR/VR产品的快速研发、迭代与升级,推动整个人工智能、虚拟现实产业的技术发展与升级。

SlimEdge Robot Vision Kit 80X

2.创新描述

诠视科技强大的VSLAM端处理能力和底层单元技术模块化的分布式结构,解耦了AR眼镜复杂的系统链路,把感知层和交互层进行分离,当客户需要进行主控平台迁移时,底层的传感器处理,SLAM算法,以及所有传感器的驱动都不需要重新部署,标准化接口可以帮助客户进行主控单元模块的快速更替部署,将传统的一年至一年半的产品开发周期,压缩至以周为单位的研发时长。

2.1 VSLAM技术创新:集空间感知VSLAM、认知AI、深度、音视频、手势眼控交互能力于一体的端处理平台

诠视科技在美国硅谷及欧洲设有产品设计及算法研发子公司,拥有7位业内顶尖博士及10余项中美专利,其自研的VSLAM技术基于高性能VPU的端处理解决方案,集VSLAM引擎、深度引擎、AI引擎、音视频引擎、手势眼控于一体,拥有丰富的环境感知传感器集群处理能力。其可灵活适配光波导,BirdBath,自由曲面等光学显示引擎,独立完成系统标定;并可协同5G的高带宽实现端与云的结合,在端设备上完成所有AR/VR所需的交互处理,支持基于端面的ATW系统时延优化,提供更优质的用户体验,帮助AR/VR智慧应用场景落地。

2.2 VSLAM产品创新:功能丰富的SDK和工具链,快速实现概念验证及产品开发

诠视科技的SLAM不仅可以支持SLAM、CSLAM模式,还可以支持Edge模式、主控处理模式以及MIX处理模式,其基于强大的底层算法能力,可以针对不同的行业应用场景进行应用SDK的定制化开发,目前已有的应用SDK包括高速VSLAM、平面检出、高精度深度图、实时三维重建、空间锚定、实时物体检出、虚实叠加、手势交互、多人地图共享。另外,诠视科技使用的新一代VPU芯片,基于其强大的算力和AI能力,可支持客户快速完成其离线训练模型的部署。此外,用户可以在该平台上进行CV应用的便捷开发,让传统的CV工具在AR的工作形态中再放光彩。该平台支持Windows、Android、Linux系统,通过USB Type C对接PC、手机和独立计算单元,涵盖了共轴空导(BirdBath)、自由曲面、光波导等光学显示方案,可广泛适用于工业、教育、医疗、建筑、安防、文娱等领域,为用户提供即插即用的体验,可快速验证概念或指导产品开发。

基于EPSON VM40光机的E34RB AR眼镜

2.3 VSLAM服务创新:高度定制化的功能开发,灵活的平台模式,涵盖产业链上下游的各个环节

基于强大的原生IP,诠视科技向客户提供高度定制化软硬件方案与服务。面向有设计能力的ODM客户,提供硬件产品;面向有系统集成需要的OEM客户,提供系统集成服务;面向应用集成商,提供Turkey解决方案。灵活的商业模式覆盖产业链自下而上的环节。响应速度快,为客户省钱省时。差异化的产品定位,解决目前行业痛点(成本高、局限大、VSLAM所需系统算力及功耗、系统集成难度大、链条长、现有市场欠缺国产替代解决方案等痛点),提供高度定制化方案开发和系统集成服务,填补市场空白。

具有眼控功能的衍射光波导AR眼镜K40RE

3.项目运行节奏

3.1 第一阶段:选定主流硬件平台,完成与硬件厂商的前期技术对接以及系统架构建设

在现有可对接Intel Movidius等平台解决方案的基础上,诠视科技打造一个以VSLAM端处理技术为核心,可对接国内主力硬件平台厂商的软硬件应用平台。该平台可搭载国产主流硬件平台的高速、高精度端处理VSLAM引擎、深度引擎、AI推理引擎、视频处理引擎及手势交互引擎等AR/VR所需的功能。其拥有丰富的环境感知传感器集群处理能力,面向开发者提供丰富的SDK,支持多种SLAM模式,以及平面检出、三维重建、三维物体识别与追踪定位和快速AI模型部署能力,可针对用户需求进行高度定制,适用于分体式和一体式XR设备。在此解决方案的基础上,诠视科技亦将现有核心技术及系统集成能力扩展到市场上更多的主流芯片平台上,如海思、瑞芯微、展讯等,并与该硬件平台厂商进行前期技术对接,并完成平台的系统架构建设。

3.2 第二阶段:完成基于更多主流芯片的算法部署,进行概念验证,逐步完善平台交互功能

在此阶段,除了进一步完善平台的交互功能外,诠视科技完成算法在国内、外主流VPU/DSP硬件平台上的部署:研发针对国产主力芯片的VSLAM算法,以完全国产化的VSLAM感知交互核心单元输出。其并打造一个相当于高通845计算能力的主控系统,使其具备与国内主力芯片平台的适配与对接能力,实现AR/VR设备系统层面的时延优化以及整机标定能力。

3.3 第三阶段:基于该平台的算法性能及产品级验证,实现整机交付能力

在这一阶段将进行基于该平台的算法性能及产品级验证,包括算法单元测试、单元性能验证、功耗调优、环境测试,基于芯片平台的分体式及一体式头显的验证等,最终打造一个面向AR/VR设备及应用市场的VSLAM感知交互核心技术服务平台,具备强大的主流硬件平台兼容性,并实现AR/VR设备及应用系统层面的整机交付能力。

3.4 第四阶段:投放市场,联合生态伙伴打造应用案例,助力产业发展

此阶段,诠视科技将与众多行业知名标杆企业建立深度合作,借助现有合作伙伴将该平台推广到目标市场,将其应用在工业、教育、医疗、To G等具有深度交互需求的重点领域,并联合生态合作伙伴共同拉动行业生态,助力企业数字化升级。

4.市场应用及未来展望

4.1 市场应用

4.1.1 “5G+AR/VR”,引领全新沉浸感教学体验,赋能智慧教育

随着“AI+教育”时代的来临,人工智能将在5G及超高清技术的引领下,不断深化场景应用,更好地辅助老师教学、学生学习、学校管理。借助“5G+AR/VR”技术,将打造多空间场景,多人互动的智慧教学模式;然而随着AR/VR设备的逐步介入,可穿戴化、解放双手、突破场所限制,将颠覆传统教学模式,真正实现随时随地、沉浸式、强交互、趣味性的智慧教学。

4.1.2 支持To G、To B、工业应用场景中的远程指导、协同作业;探索更多方案,降本增效

诠视科技VSLAM感知交互核心技术服务平台运用于G端、B端、工业领域,主要的价值体现在四个方面:一是实现场景、模型、设计、线路图纸等信息的实时展示和共享,使得处于异地、多人、多任务的协同作业可以实时互动。二是可将多款设计模型或方案,通过AR眼镜进行数字化展示,以便用户可以更全面、更有沉浸感地对不同方案进行评估及决策。三是可为方案研发或制定者提供预先的演示环境,以便通过虚实结合的场景进行预演,用以预判实操时的合理性。四是可将标准作业流程、操作指南等信息显示给使用人员,大幅提升工作效率。

4.1.3 智能制造、BIM可视化应用,风险直观预判,缩短工程交期

传统工程项目管理和信息查看局限于二维屏幕上的文字图纸,使用该平台方案可以通过AR眼镜实现沉浸式可视化技术,全面了解规划中的任务、施工进度、潜在风险以及安全要求,以便于提前制定应对预案;也可以在现实环境中查看未来每个阶段的工程三维效果,第一视角,效果更直观。

4.1.4 运用于医疗领域,模拟手术方案,提高医生的诊断效率

在诊疗过程中,医生可以通过AR虚拟3D建模,模拟整个治疗过程,便于直观地看到每个阶段、每个疗程的治疗结果,也可以进行手术前的虚拟演练,提高手术的成功率,还可设计多个手术方案,然后再从多个手术方案中选出更适合患者的方案为其进行治疗;同时,基于极高精度的虚实叠加技术,将患者的患处进行事先3D建模后,在手术中与患者真实肢体进行高精度叠合,赋予手术医生一双透视眼,最大可能优化手术路径,等等。

4.1.5 文化娱乐、展览展示,提升游览体验

作为B端和C端的桥梁产业,AR在文旅领域的应用落地起到了示范作用,在线下娱乐场景利用AR技术提供虚实叠加的娱乐内容,成本低、见效快,使顾客获得更丰富、更具沉浸感的体验,同时也可缓解游客排队难、游玩指南不明等运营问题。在博物馆内,利用AR设备,可以让顾客从多角度多维度去观赏和体验艺术作品,并与其互动,使其更生动、更全面地了解知识,获得高质量的游览体验。

4.2 未来展望

AR/VR行业真正起飞在于硬件上要具备两大核心:一是感知交互,二是虚拟场景的近眼显示。在“两个核心”的硬件需求之外,第三是要丰富内容,要有与应用场景匹配的、重度交互的内容。AR/VR行业的发展需要成熟、可量产化的产品:首先要在多领域足够成熟,共同推进;其次需要依靠眼镜等便携产品量产推动产业链成熟,从而为下游客户提供高性价比服务。

诠视科技致力于突破VSLAM对算法要求高、产业链长、研发门槛高、自主可控等问题,将为国内市场上大量不具备VSLAM自主研发能力的中小型企业,以及没有长期行业经验与技术积累的企业打开快速进军AR/VR产业的大门,促进相关产业的发展与升级。

编委会点评

1.社会效益

AR/VR技术的成功应用作为“数字经济”的有机组成之一,技术创新与5G带来产业变革的窗口期,其中技术创新为底层,应用标杆为突破,产业融合为趋势。核心基础技术的深入建设与市场开拓,将有望通过成熟应用赋能城市建设、工业制造、商业服务、智慧文旅、智慧医疗、线上游戏、社交电商等多维场景,实现更加丰富多彩的智慧生产生活。

2.创新价值

诠视科技以VSLAM技 术为关键核心,从底层算法到平台应用,在“软硬兼备”的角度上进行了积极的行业探索,运用灵活多样的服务模式提升产业数字化能力。诠视科技具备丰富的系统集成产品与服务经验,重视适配度、扩展度、场景多样性的齐头并进,以及产业纵深与跨产业的协同发展,通过定制化开发来缩短相关领域产品开发周期和降低开发成本,加速产业应用场景落地。 DGD2sNvQJOpF9O07GiEAwM4av7Xj7qjitrUrIK16x5HmfGJVwllmw9pTa1+lu7dd

点击中间区域
呼出菜单
上一章
目录
下一章
×