央广网

科技频道 > 互联网

央广网

百度严审推广资质:技术人工双管齐下 屏蔽38亿条有害链接

2016-01-29 15:47:00 来源:光明网

  搜索引擎是网民们最依赖的互联网应用之一,但也有一些虚假信息常年以各种低价、方便等由头诱骗用户上当。

  日前,谷歌发布了一组数据称,2015年谷歌共去除了7.8亿条违反其政策的广告,比2014年的5.24亿条增长了近50%。百度也不例外,数据显示,百度已屏蔽有害链接38亿条,站点级别已超1亿个。为此,百度花大精力构建了完整的预防、监控、处理流程体系,每天都在与违规推广“斗智斗勇”。

  好在这些工作不都是由人工完成,技术基因浓厚的百度通过机器深度计算、大数据技术甄别和人工筛选审核的综合运作,形成一套完整的预防、监控、处理流程体系,其中大数据审查技术更堪称“黑科技”。

  记者了解到,百度搜索每天要响应将近60亿次搜索请求,海量需求吸引了大量推广信息,所以百度要实时对无数推广信息进行客户资质审核、物料信息审核等全面核查。目前百度广告系统平均每天送审的文字广告为4.7亿条,相当于每秒钟就有5000条广告需要过审。

  面对如此巨大的审核量,人工远远不能满足,为此百度开发了一套“雷达系统”,用大数据来进行审查。目前,百度能做到机器自动审核率达到95%,同时机器还能将平均每天30万条的图片广告过审核处理一半以上。

  同时,百度的大数据审查技术体系也在不断升级。如此前一些不法广告主利用新兴技术,在Flash广告中嵌入第三方外链或php脚本内容,控制作弊Flash物料根据IP、时间、设备等不同状态因素进行跳转。简单来说,在审核时看到的是钢材的广告,到了晚上或者坐仨小时火车,在相同的网页相同的地方就会看到低俗广告。

  为此,百度成立了专项组,通过升级Flash物料的代码解析模块,让机器主动发现其中“不应出现”的外链或php脚本内容,整体上从低俗、虚假、欺诈、高危信息等多个维度进行层层把关。据悉,截至目前百度共封禁Flash账户超1.5万个,涉及Flash物料数超570万条,其中机器拒绝违规Flash物料通过共近60万条。

  此外,虽然百度通过大数据“黑科技”屏蔽了绝大部分违规推广信息,但人工干预审查也成为拦截有害信息的最终屏障,换句话说,当系统对于某条广告是否恶意难以判断时,将转至人工来判断。“人工审查这一步仍然必不可少,因为有害信息的传播源是人在操控,所以仍会有少量信息逃过机器审查,目前百度仍然在加大人工审查的力度。”百度相关负责人称。

  据记者了解,百度大约有5%的物料审核还需要人工进行操作,为此百度拥有一个数千人的审核团队每天倒班工作。为了加大力度打击各种作弊行为,在原有的机器+人工审核基础上,近期百度新增了近60人的审查团队,互换3班24小时不间断审核,并且在原有的机器与人工审核两道流程之上,又增加了一次人工审查作为“第三层保险”,确保非法广告被及时下架。

  数据显示,在刚刚过去的2015年,百度拒绝不良账户438300个,判罚的违规消费金额达到了4.67亿元,此外百度还给公安机关提报了不少造假售假线索。

  百度商业生态事业部总经理崔聿泓表示:“接下来,百度将充分利用百度在技术和数据上的能力和优势,更加智能地对物料全方位的核查,提升物料审核的准确率和效率。”

  另据了解,百度还通过信誉V网站评级体系,从源头上遏制恶意推广信息。目前百度已为数百万企业提供了实名认证、加V服务,为网民提供“有V有保障”、受损先行赔付等服务。同时,评价体系也与大数据审查一起发挥双重作用,广告主一旦出现违规情况,将面临下线、撤V、判罚等后果。

编辑:殷雨婷

关键词:谷歌;倒班工作;屏蔽;有害信息;人工干预

说两句

相关阅读

谷歌围棋百万约战李世石 柯洁:电脑难取胜

一款名为AlphaGo的人工智能软件,在没有任何让子的情况下以5∶0完胜欧洲冠军。

2016-01-29 09:04:00

谷歌围棋百万美金约战李世石 柯洁:电脑难取胜

一款名为AlphaGo的人工智能软件,在没有任何让子的情况下以5∶0完胜欧洲冠军。

2016-01-29 09:04:00

VR市场将迎快速发展期 苹果谷歌加大参与力度

1月29日消息,据国外媒体报道,由于Oculus Rift、PlayStation VR和HTC Vive将于未来数月上市销售,今年将成为虚拟现实技术快速普及的一年。尽管库克没有明确承认“我们在开发虚拟现实头盔”,但上述评论仍然使得众多科技博客当作一个令人激动的声明。

2016-01-29 08:31:00

参与讨论

我想说

编辑推荐

视觉焦点

推荐视频

央广网官方微信

手机央广网

点击排行

违法和不良信息举报电话:010-56807188 新闻热线:4008000088 E-mail:4008000088@cnr.cn
网上传播视听节目许可证号 0102002 京ICP备05065762号-1 京公网安备110102000554
中央人民广播电台介绍 | 央广网介绍