图普科技:开启内容审核云时代

2015-09-02 01:54:39来源:[标签:来源] 阅读 ()

新老客户大回馈,云服务器低至5折

  互联网上每天都会产生大量内容,对互联网公司而言,内容类服务很可能因为监管人力问题而在审核方面出现风险。截止到今年5月,中国互联网协会举报中心接到网民举报淫秽色情网站20114件次,12321举报中心已要求应用商店下架处置了337款不良应用。

  政府部门对互联网公司的监管力度不断加强,开发者为了规避风险需要花费大量审核人力。自建信息过滤功能或增加审核人员又会增加产品和服务外的支出,给前期开发造成额外压力。

  传统的内容审核需要依赖大量的人工来实现。现有的信息过滤系统也大多停留在关键词程序匹配层级。随着读图时代的到来,信息的传递更多的是依赖于图像和视频,简单的文字过滤并不能满足内容审核的需求。

  随着计算机视觉(Computer Vision)技术在近几年的突破式发展,基于深度学习的图像识别技术开始成熟,使机器代替人工完成大部分的信息审核工作成为了可能。

  然而,计算机视觉领域是技术含量非常高的领域,不仅在技术层面有着严苛要求,还需要大量的训练数据的积累、复杂的图像识别算法、昂贵的硬件系统和相应的工程化开发的支持。虽然Google、Facebook以及国内的百度都有自研的机器智能系统,但都没有对外公开。

  尤其对中小开发团队或个人开发者而言,它们往往没有人工智能方面的工程和技术能力,但又有处理大量图片数据的需求,这个矛盾该怎么破?专注于图像识别和视觉检测的人工智能企业——图普科技,则用他们的技术很好地解决了这个问题。

  图普科技基于深度学习理论,打造了业内首个内容审核云平台。通过建立图像识别云,通过针对目标特征专门训练的素材库和识别模型来甄别存在的违规图片。以开放的云API平台填补了市场空白,企业无需聘请人工智能识别的专家组建研发团队,通过接入API调用识别服务即可。这在极大程度上降低了行业应用图像识别服务的门槛,使得更多互联网企业使用人工智能图像识别技术成为了可能。

  调用了图普云API后,用户登录审核云平台后可以复审图片,使机器习得相关标准,返回越来越符合个性化标准的结果;同时,图普开放了模型训练接口,允许用户重新定义的分类标准,通过数据标注完成对机器的训练后,产出新的分类结果。

  与传统的人工审核方式相比,机器判别最大的问题在于“误判高”。如何让机器识别低于人工的误判率,做到“0误判”,是对机器可靠性的考验。图普科技采取的方式是对问题进行分割为确定的和不确定的两部分,确定的部分交给机器,不确定的部分交给人工。对于机器确认部分的精确度是99.5%,超越了人工,可以完全替代人力无需复审。对于疑似部分机器则会根据可能性排序。疑似部分仅占总图片量的5%-15%,这部分即使需要人力,也可以按照概率从高到低来审核,大大提高复审效率。

  对于机器学习来讲,影响其整体表现的主要取决于三个要素:算法、GPU的计算能力以及海量数据的训练。教会计算机理解这个世界需要大量的图像数据,图普科技在做好算法和工程的同时,与国内顶尖云存储供应商七牛云以及国内最大的即时通讯云服务商融云合作,并且已经接入迅雷、花瓣网、酷狗、比邻等平台,有了大量的样本积累和实际应用基础。目前,图普科技的样本数量已经过亿,每周会对样本库做一次版本升级,将新识别出的样本加入其中。随着日益增长的数据库,图普的机器学习算法会更加准确。

  目前,图普科技已在多个领域打造了原创性的识别技术,包括色情图像和视频鉴别、小广告过滤、场景与人物识别、暴恐内容过滤(即将上线)等。图普机器人日处理图片、视频量可达亿万量级,帮助运营团队节省超过90%的人力成本。

  一直以来,人工智能被人们赋予了太多想象。随着纳米技术、生物技术等呈几何级数加速发展,科幻电影中的情景已经离我们越来越近,人机互动、人机共存的时代已经全面来临。正如著名的奇点大学校长雷·库兹韦尔(Ray Kurzweil)所说,“那是一个人类与机器并存的时代,但机器要比人类出色许多,它们被赋予了强大的人工智能,足以承担许多之前必须依赖人类去完成的任务。”

  内容审核的云时代已经到来,我们正跨越人工智能的奇点,迎接着图像识别技术给工作和生活带来的改变。

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:人民日报社长:人民网干部要以廖玒被查为警示

下一篇:央行支付新规史上最严:必须先安全再创新