【TUP第十四期】技术大变革时代 模式识别技术走向前台

2018-06-11    来源:

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

 7月份,CSDN TUP活动曾经举办过主题为“次世代人机交互接口及应用开发”的活动,分别展示了新兴交互技术如语音识别、脑波接口以及体感技术的应用与实践,受到技术人员的欢迎。

作为人机交互领域的关键技术之一,模式识别是指通过计算机用数学技术方法来研究模式的自动处理和判读。随着云计算和移动互联网的兴起,模式识别技术也获得了更大的发展契机。

这个在普通开发者看起来比较“偏学术”的技术领域,越来越多的被用于解决当前的实际问题。

9月10日下午,在中国科学院计算技术研究所一层报告厅,来自腾讯和盛大研究院的三位研究员,分享了两大互联网巨头在模式识别与云计算、新型终端结合所带来的实践心得。尽管是在中秋假期,外面还飘着小雨,仍有近3百人参加,现场互动也非常热烈。

当模式识别遇上云计算

腾讯研究院人机交互中心模式识别组研究员刘海龙的演讲主题是“模式识别云服务”,根据他的解释,所谓模式识别的云服务,就是指以云端计算的方式,为 终端提供所需的识别服务,终端只负责采集输入数据和接收识别结果,而其他一些模式识别的步骤,包括特征提取和分类等都交给云端来完成。从模式识别技术发展 的需要看,它也要从传统的单机应用走向网络应用,并和云端的海量数据结合,才能更好的发挥作用。

腾讯研究院人机交互中心模式识别组研究员刘海龙

模式识别的云服务不仅具有云计算的普遍优点,如按需服务、资源利用率高,冗余可靠性好、可扩展性强等等。而且针对模式识别任务来讲,云服务还有更重 要的一些好处 :云服务可以解决模式识别任务对大量的训练样本的需求问题。离线积累这些样本往往是困难的。而且样本标签又可以通过用户在终端所做出的交互操作来得到。这 样就可以用来锤炼识别算法,持续改善其性能。

此外,云端提供了终端不具备的计算和存储能力。特别是移动终端。很多模式识别任务中的数据存储于云端。比如图像搜索,人脸识别的应用,这就很自然的需要识别的云服务。

而且刘海龙透露,之前腾讯研究院在向其业务部门提供模式识别技术支持的时候,往往是以算法库的形式,不利于长久持续的在技术上积累改进。今后将从单纯提供算法库转向提供云服务。

新一代移动平台下的模式识别应用

腾讯研究院人机交互中心模式识别组项目负责人陈波认为,移动无线互联网带来的是信息沟通的革命,手机已俨然成为人们各种感知器官的延伸。移动终端将 成为人机交互和模式识别技术的主要战场,云计算和不断增强的终端能力让复杂的模式识别运算成为可能,而基于模式、不断增加的移动应用将改善移动应用体验。

腾讯研究院人机交互中心模式识别组项目负责人陈波

通过手写、手势和语音等多个方向,模式识别目前最成熟的应用在于改善移动终端的输入体验,陈波介绍并展示了腾讯的技术进展,例如腾讯的手写识别技术 去年就已经用在了PC端QQ输入法、以及iOS, Android平台的手机QQ输入法上,目前的识别率在工整样本上能达到99%,在一般的自由书写样本上能达到95%。

即将上线的云语音服务支持中英文混合输入,在中文中夹着简单的英文都可以正确的识别出来。识别率在常用的聊天语测试集上可以达到字识别率80%。

中秋节后,将在AppStore发布的QQ慧眼是腾讯模式识别技术的集中体现,这款应用可以让你的手机变成成熟的图像扫描仪,具有文字识别即时拍照翻译、人脸认证解锁、解读二维码、条形码和商品logo等。

陈波还着重讲解了增强现实技术,移动增强现实系统可实时跟踪手机在真实场景中的位置及姿态,并根据这些信息计算出虚拟物体在摄像机中的坐标,实现虚 拟物体画面与真实场景画面精准匹配,在博物馆导游、地图、购物指南、工业设计、炫彩游戏、新一代的广告模式等在移动互联网应用领域的广阔的发展前景。

模式识别在数字家庭娱乐上的应用

观察当前几大科技巨头的动作,数字家庭娱乐已是兵家必争之地。无论是在用户接入端(IPTV机顶盒),或者节目发送和共享端(电视台/视频网站),还是在用户移动端(智能手机),都不断涌现出新的技术和应用。

盛大创新院多媒体主题院研究员路香菊博士

盛大创新院多媒体主题院研究员路香菊博士在会上分享了模式识别相关技术在数字家庭娱乐中的应用,包括KINECT技术在游戏应用中的手势识别及人脸识别技术,社交电视中用到的人脸/台标识别、语音识别、视频广告识别等。

路香菊表示,数字家庭领域中互动电视是最近兴起的新概念,以Google TV和雅虎TV为代表,其中雅虎TV通过和三星、LG大厂商合作,打造了自己的应用开放平台,正向着行业统一标准迈进。模式识别在视频中最重要的应用当属 视频检索了,和广告和电子商务的结合都具有极高的应用前景,值得关注的相关应用有Snappy TV、Shazam、IntoNow等。

路香菊用了较多的时间来介绍微软体感输入设备Kinect,Kinect是微软游戏机XBOX360的外设,以增强XBOX360的人机互动能力。 目前已初步显现出在新一代数字家庭娱乐中最佳装备的潜质。微软还赋予它很好的扩展性,Kinect fub lab是微软夏天新推出的互动娱乐体验,其中有多种游戏可供选择,比如 kinect me 是把自己变成虚拟化人物,也就是avatar kinect中的自己。Build a buddy 是把现实中一个毛绒玩具虚拟化为3D玩偶,它可以受你身体控制,完成动作。

三场演讲之余,活动留出了论坛环节和充足的互动时间,从现场交流了解到,开发者最为关注这些模式识别的技术可否开放给业界调用,正如腾讯腾讯研究院 人机交互中心模式识别组项目负责人陈波在演讲中提到的,成熟并平台化的基础技术支持将给应用层提供了无限的创新和发展空间,模式识别技术也是如此。

标签: Google 标准 电子商务 互联网 互联网巨头 开发者 媒体 搜索 网络 网站 问题 行业 选择 移动互联 移动互联网 移动互联网应用 移动平台 用户 云服务

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:Orange将拉丁美洲的网络容量扩大十倍

下一篇:容灾备份行业将依靠资本的力量扬帆起航