内容“井喷”的时代,百度大脑内容审核平台助力应对审核难题

2019-11-08 15:34

打印 放大 缩小

“这是一个最好的时代,也是一个最坏的时代;这是一个信任的时期,这是一个怀疑的时期;人们面前应有尽有,人们面前一无所有。”科技的进步带来了前所未有的信息便利,“井喷式”的信息便利让各个基于此的商业模式一路狂奔。然而,我们在享受信息高度便捷的同时,也承载着错误、有害等信息带来的恶果。

当绝大数人都无法直接接触信息源头、辨别真伪时,很大程度上就只能依赖平台。平台越大,责任越大,如何确保信息的健康安全,如何搭建一个健全的审核机制等,都是亟待解决的重要问题。之前依赖于纯人工审核的方式已经无法满足当下的审核需求,而被尝试应用的传统机器审核方式又存在瓶颈,无法“有效把关”。此时,AI深度学习技术就显示出了价值。

(百度大脑内容审核平台) 

由百度大脑整合多项AI技术推出的“一站式内容审核平台”,基于其视觉、语音、NLP等多项AI能力,可实现多个维度的内容审核,不仅在速度上具有优势:2分钟的短视频仅需24秒即可审核完毕,文本审核更快至200毫秒,而且支持用户自定义审核模型,自定义图像文本黑白名单,同时用户还可以基于百度海量历史数据积累的违禁黑库,最大限度的保障平台内容安全。百度大脑一站式内容审核平台,已被众多迫切追求“技术解放生产力”的企业应用到了实际场景中。

生活服务:提供的是便利,杜绝的是恶意

生活服务在互联网,特别是移动互联网的驱动下快速演进着。其中,美团APP、大众点评APP等生活服务平台,一方面为越来越多的人解决着“好好吃饭的问题”,另一方面在优化其自身建设时,也不得不面对大量用户上传内容(UGC)与商家上传内容(PGC)的审核问题。因此,有效快速地从海量内容中过滤出有风险的信息就成了巨大的挑战。

目前,美团、大众点评都将百度图像审核技术作为其自研技术的补充,在整个审核流程中都融合了自研算法结果与百度图像审核结果。此时的机器就像是在“一线”面对海量数据拥有经验丰富的“警察”,寻找着有害信息并“稳准狠”地将其快速揪出过滤掉;此外,如果机器觉得某些信息需要人工复核时,则会推送给人工处理,整个过程帮人工节省了大量的精力。现在用户上传的内容及图像都将经过一整套的快速审核,只有完整通过审核流程的图像与文字才最终会被展示在APP中。据了解,在接入服务的9个月以来,百度大脑内容审核帮助美团APP和大众点评APP过滤了高达3.36万张有害图像,保障了平台内容质量的同时,还有效协助平台大大降低了由内容问题可能引发的风险。

(美团点评图像审核流程) 

除了美团点评之外,像去哪儿、美柚、高铁管家等等生活、旅游类的众多“基于用户分享内容”形成价值的平台,也已接入百度大脑提供的内容审核平台。其中高铁管家引入百度大脑内容审核技术,将审核效率提高了300%,极大减少了人工成本的投入。此外,在针对美柚社区的内容安全进行审核时,百度的内容审核技术可判断用户上传图片中的文字内容是否合规、判断文字是否有恶意推广倾向、高效及时地将含有违规内容的图片自动删除,24小时保障社区内容安全,并有效节约1/6的审核时间。

娱乐休闲:观赏的美感,限制的是低俗

对于从1998年破芽,2004年成为“非主流”,再到发展为现在的“香饽饽”的中国网络文学来讲,近20年的发展随着网络视频的壮大,其价值被不断开发与正视。作为国内顶尖的原创小说创作平台和数字内容阅读平台之一,纵横文学于08年创立,经过多年的发展和融资,旗下已经拥有了纵横中文网、熊猫看书等知名产品。

在其整个社区内部,读者之间以及书迷、作者在交流互动时,有时会看到低俗信息或恶意广告等垃圾内容,干扰了整个平台的用户体验。为能更有效准确地排查出这些有害信息,纵横小说通过接入百度文本审核技术,在避免原人工审核容易出现遗漏问题的同时,也降低了约人工审核80%的工作量,为纵横文学圈子的社区内容进行安全把关。

(纵横小说文本审核流程) 

与此同时,对视频内容的审核也是传统审核方式常常遭遇的痛点之一。2019年中国在线直播用户将超5.01亿,短视频用户将达6.27亿。面对不断产生的海量短视频内容和日益严格的监管环境,百度大脑内容审核平台可实现对节目标题、简介、弹幕、评论,以及节目画面和音频的一站式快速审核。

例如,作为旗下拥有秒拍、小咖秀、一直播等多款流行视频应用的一下科技,接入了百度针对短视频提供的短视频VID审核接口,对其视频节目的标题、简介、弹幕、评论,以及节目画面、音频进行把关,目前该内容审核模型的准确率高达96%以上。在提高了内容审核效率的同时又降低了审核人员的劳动强度,将其审核人力成本降低了50%以上。

(一下科技视频审核流程) 

新闻资讯:传播的事实,规避的是不实

从新闻资讯的获取来看,自媒体的蓬勃发展所生产的内容,对传统新闻的补充不可小觑。然而,又因内容分享的门槛降低也出现了大批质量参差不齐的信息。那么,在网络空间监管力度不断加强的当下,怎样高效审核过滤不良信息,提升平台整体内容质量,让用户在信息流中及时获取健康有效的信息,就成为了新闻资讯平台营造积极健康版面生态的重要问题。

在面对这个问题时,作为聚焦下沉市场,在新闻资讯领域异军突起的惠头条来讲,在接入百度大脑图像审核和文本审核服务后,已可以实现自动审核用户发布的资讯内容以及用户上传的头像规范,有效过滤掉90%以上涉黄涉暴涉政等违禁内容,极大地提高了内容平台的管理效率,为保证其提供高品质信息作出了极大助力。

(惠头条审核流程) 

事实上,对于新闻资讯平台来讲,很多平台在面对内容审核问题时,往往存在着诸如:审核效率低、内容审核员的业务素质参差不齐、审核人员的培训难量化、难标准化等三方面挑战,而百度大脑基于AI技术的内容审核解决方案已足以应对这些挑战。不难看出,智能时代到来,AI深度学习技术辅助人类解决问题的价值不断被突显出来。

(百度大脑内容审核特色优势) 

目前,百度大脑内容审核平台已在百度大脑AI开放平台全面对外开放。同时,该平台的能力也已集成至百度智能云智能应用解决方案中,为百度云媒体客户提供更优质的服务体验。据了解,百度大脑AI开放平台十一月将集中分享语音技术落地案例,并面向众多开发者推出“因AI而声暖冬语音主题月”活动,包括热门语音产品特惠等。开发者们可前往“百度AI开放平台”官网获取。

责任编辑:王妍静(QZ0009)