报告 | 自然语言处理到底哪家强?这些企业上榜了

2018-07-28    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
自然语言处理是包括了计算机科学、语言学心理认知学等一系列学科的一门交叉学科,这些学科性质不同但又彼此相互交叉。

1950年图灵提出了著名的“图灵测试”,这一般被认为是自然语言处理思想的开端。

 

报告

 

20世纪50年代到70年代自然语言处理主要采用基于规则的方法。

70年代以后随着互联网的高速发展,自然语言处理思潮由理性主义向经验主义过渡,基于统计的方法逐渐代替了基于规则的方法。

从2008年到现在,在图像识别和语音识别领域的成果激励下,人们也逐渐开始引入深度学习来做自然语言处理研究。

 

报告

 

由最初的词向量到2013年word2vec,将深度学习与自然语言处理的结合推向了高潮,并在机器翻译、问答系统、阅读理解等领域取得了一定成功。

接下来AMiner将为大家介绍自然语言处理的业界发展,涵盖了以下企业。

 

报告
微软亚洲研究院微软亚洲研究院1998年成立自然语言计算组,研究内容包括多国语言文本分析、机器翻译、跨语言信息检索和自动问答系统等。
报告

 

这些研究项目研发了一系列实用成果,如IME(Input Method Editors输入法编辑器,它是一种专门的应用程序, 用来输入代表东亚地区书面语言文字的不同字符。)、对联游戏、Bing词典、Bing翻译器、语音翻译、搜索引擎等,为微软产品做出了重大的贡献。

 

报告

 

微软IME

 

报告

 

微软对联游戏

 

报告

 

微软必应词典

并且在自然语言处理顶级会议,例如ACL、COLING等会议上发表了许多论文。

语音翻译

2017年微软在语音翻译上全面采用了神经网络机器翻译,并新扩展了Microsoft Translator Live Feature。

可以在演讲和开会时,实时同步在手机端和桌面端,同时把讲话者的话翻译成多种语言。

 

报告

 

其中最重要的技术是对于源语言的编码以及引进的语言知识,同时,微软还表示,将来要将知识图谱纳入神经网络机器翻译中规划语言理解的过程中。

人机对话

小娜现在已经拥有超过1.4亿用户,在数以十亿计的设备上与人们进行交流,并且覆盖了十几种语言。

 

报告

 

有聊天机器人小冰,正在试图把各国语言的知识融合在一起,实现一个开放语言自由聊天的过程,目前小冰实现了中文、日文和英文的覆盖,有上亿用户。

 

报告

 

Google

Google是最早开始研究自然语言处理技术的团队之一,作为一个以搜索为核心的公司,Google对自然语言处理更为重视。

 

报告

 

Google拥有着海量数据,可以搭建丰富庞大的数据库,可以为其研究提供强大的数据支撑。

Google对自然语言处理的研究侧重于应用规模、跨语言和跨领域的算法。

机器翻译

 

报告

 

知识图谱

Google的知识图谱更是遥遥领先,例如自动挖掘新知识的准确程度、文本中命名实体的识别、纯文本搜索词条到在知识图谱上的结构化搜索词条的转换等,效果都领先于其他公司,而且很多技术都实现了产品化。

 

报告

 

语音识别

Google一直致力于投资语音搜索技术和苹果公司的siri竞争,自2012年以来将神经网络应用于这一领域,使语音识别错误率极大降低。

2011年收购语言信息平台SayNow,把语音通信、点对点对话、以及群组通话和社交应用融合在一起。

2014年收购了SR Tech Group的多项语音识别相关专利。

Facebook

Facebook涉猎自然语言处理较晚,2013年开始发展语音翻译,2015年开始语音识别的研发之路。

语音翻译

发展道路如下图所示:

 

报告

 

语音识别

2015年,Facebook相继建立语音识别和对话理解工具,开始了语音识别的研发之路。

2016年Facebook开发了一个响应“Hey Oculus”的语音识别系统。

并在2018年初开发了wav2letter,这是一个简单高效的端到端自动语音识别(ASR)系统。

百度

百度自然语言处理部是百度最早成立的部门之一,研究涉及以下方面。

 

报告

 

百度在深度问答方向经过多年打磨,积累了问句理解、答案抽取、观点分析与聚合等方面的一整套技术方案,目前已经在搜索、度秘等多个产品中实现应用。

百度翻译目前支持全球28种语言,覆盖756个翻译方向,支持文本、语音、图像等翻译功能,并提供精准人工翻译服务,满足不同场景下的翻译需求,发布了世界上首个线上神经网络翻译系统,并获得2015年度国家科技进步奖。

阿里巴巴

阿里自然语言处理为其产品服务,在电商平台中构建知识图谱实现智能导购,同时进行全网用户兴趣挖掘,在客服场景中也运用自然语言处理技术打造机器人客服。

例如蚂蚁金融智能小宝、淘宝卖家的辅助工具千牛插件等,同时进行语音识别以及后续分析。

 

报告

 

阿里的机器翻译主要与其国家化电商的规划相联系,2017年初阿里正式上线了自主开发的神经网络翻译系统,进一步提升了其翻译质量。

 

报告
腾讯

 

AI Lab是腾讯的人工智能实验室,研究领域包括计算机视觉、语音识别、自然语言处理、机器学习等。

 

报告

 

其研发的腾讯文智自然语言处理基于并行计算、分布式爬虫系统,结合独特的语义分析技术,可满足自然语言处理、转码、抽取、数据抓取等需求。

在机器翻译方面,2017年腾讯宣布翻译君上线“同声传译”新功能,用户边说边翻的需求得到满足,语音识别+NMT等技术的应用保证了边说边翻的速度与精准性。

京东

京东在人工智能的浪潮中也不甘落后。京东AI开放平台基本上由模型定制化平台和在线服务模块构成,其中在线服务模块包括计算机视觉、语音交互、自然语言处理和机器学习等。

按照京东的规划,NeuHub平台将作为普惠性开放平台,不同角色均可找到适合自己的场景,例如用简单代码即可实现对图像质量的分析评估。

 

报告

 

从业务上说,平台可以支撑科研人员、算法工程师不断设计新的AI能力以满足用户需求。

并深耕电商、供应链、物流、金融、广告等多个领域应用,探索试验医疗、扶贫、政务、养老、教育、文化、体育等多领域应用。聚焦于新技术和行业趋势研究,孵化行业最新落地项目。

科大讯飞

科大讯飞股份有限公司成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级骨干软件企业。

 

报告

 

科大讯飞作为中国智能语音与人工智能产业领导者,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。

科大讯飞成立之时就开始在语言和翻译领域布局项目。基于深度神经网络算法上的创新和突破,在翻译方面的发展如下图所示。

 

报告

 

关于AMiner:

以科研人员为中心,提供在线实时的人才、科技评估报告的情报。追踪、关注人工智能+20领域的发展动态。

(选自:学术头条(SciTouTiao)作者:AMiner)

标签: Google 代码 电商 电商平台 互联网 金融 评测 数据库 搜索 搜索引擎 通信 网络 政务

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:李飞飞发布的谷歌AutoML真的能让AI民主化么?

下一篇:容错和高性能如何兼得: Flink创始人谈流计算核心架构演化和现状