百度视觉技术实现交互升级 将深入地赋能智慧生活场景

国内新闻 浏览(1783)

2019年,百度的视觉技术不断完善,并在重大国际赛事中赢得多项冠军。在上周结束的百度AI开发者大会上,百度的视觉技术再次升级。在体验了从世界到理解世界的1.0时代之后,百度的视觉语义平台将进入2.0时代,互动升级和硬件与软件的结合。实现主要领域的突破。在交互式升级方面,百度视觉语义平台依靠领先的视觉基础技术,实现两种增强现实技术的系统级创新:集成的人机交互和大型场景物理世界交互。

img_pic_1562665108_0.jpg

百度视觉技术部门和增强现实技术部门主任吴忠钦表示,小型视频应用中常见的美容滤镜,贴纸等功能,以及手机相机中的AR拍摄,都离不开祝福AR特效。在这个新发布的综合人机交互系统中,它带来了AR功能的创新变化,如面部,人体,手势和环境影响。通过单点功能升级和游戏组合,它将是视频拍摄,游戏互动等。场景提供了更丰富的创作空间和互动体验。

据吴忠钦介绍,百度AR从自建人脸数据库的海量数据中提取出东方人脸基础,并在此基础上构建了一个稳定高效的用户脸部三维重建算法,实现了精致的人脸特征和实时稳定的皮肤。水平。跟踪效果。在手势交互方面,百度AR已经建立了一系列业界领先的超轻量(小计算,小尺寸)手交互算法能力矩阵,此外还有常见的控制操作,如防雨,还有自定义手部效果。各种创意游戏,如空间绘画,在小视频和好看的视频等应用中很受欢迎。

在移动方面,百度率先支持18点/59点肢体骨骼点/轮廓点检测跟踪和主流模型的全面覆盖;环境感知和理解,包括图像分割,天空分割,物体检测和其他算法。物理世界中的特效能力矩阵实现了物理世界1:1真实场景的实时分割,可以选择背景替换,着色,天空特效,动画叠加等AR效果。

互动技术的升级也将加深智能生活场景。在现场,吴忠钦通过一个生动的案例,展示了智能车机全面实现疲劳驾驶提醒,语音视觉互动控制,以及利用3D识别和跟踪技术实现与家用小家电的互动。新的集成人机交互系统已完全集成到百度智能云平台,支持企业提供更全面,更易用的智能功能和更好的视频解决方案。

img_pic_1562665108_1.jpg

交互式升级的另一个主要焦点是基于VPAS(视觉定位和增强服务)发布大规模物理世界交互系统。百度首次通过视觉定位与增强现实技术的突破性结合,将虚拟信息与真实地理位置精确结合,标志着国内增强现实技术的发展和应用取得突破。从简单的空间物体放置体验到基于物理的高度沉浸式混合现实体验,具有精确的空间感知。

据悉,VPAS主要包括三个基本模块:离线高精度地图构建,在线定位和融合跟踪。与GPS相比,它具有更稳定的实时跟踪能力,支持具有厘米级高精度定位的大型室外场景和室内场景。此外,百度AR采用最具前瞻性的视觉技术解决方案,集成跟踪技术,兼容谷歌和苹果平台的连续跟踪能力,独特的自我研究跟踪能力,可支持主流移动设备的全景体验在当前的市场。需求;结合百度视觉语义,不断提高在线定位和实时跟踪的稳定性和准确性。

基于视觉信息元素的积累,百度AR实现了一套完整的可视化地图构建方案,即实现公共源数据采集模式,处理和分析用户通过手机采集的图像数据,继续使用百度地图的地理位置信息。更新和完善视觉地图。吴忠钦指出,百度AR在3D重建数据导入界面中普遍存在,并且与同一格式的第三方数据兼容,具有易于集成的功能和数据批量生产能力。

在现场,吴忠勤还展示了VPAS重建圆明园大水法第一次登陆申请案。当用户关注百度地图导航并进入元阳源西洋大厦风景区时,VPAS将自动“找到”大水发遗址,并在100多年前重新建立玉石和“猎犬”的壮丽景色在破墙上。这也是第一个将百度AI功能与5G技术相结合的应用场景。随着5G时代的到来,AI和5G /边缘计算将继续相互加深。大水法将作为拓展更多室内外场景(如景点和商业区)的起点,VPAS将为物理世界的视觉导航服务带来经验。更改。

img_pic_1562665108_2.gif

吴忠勤说:“随着5G时代的到来,百度AR基于虚拟现实和真实场景相结合的基础设施建立在视觉技术优势的基础上,将继续弥合虚拟世界与物理世界之间的差距,并刷新人们探索世界的方式。“