网易首页 > 网易科技 > 网易科技 > 正文

鉴黄AI或将取代人工鉴黄师:一天审4亿张图只需20人

0
分享至

(原标题:这一天还是来了:鉴黄人工智能或将取代人工鉴黄师)

澎湃新闻见习记者 徐路易

又一薪水高、“福利”好的职业或要被人工智能(AI)替代了。

近日,阿里巴巴集团(下称“阿里”)安全部在接受澎湃新闻(www.thepaper.cn)采访时介绍了AI鉴黄的有关工作:当用户输入一张图片,AI将返回一个0-100之间的分值。这个分值非线性地标示了图片含色情内容的概率。对于互联网场景模型,得分99及以上的图片几乎可以肯定是色情图,无需人工复审;得分50-99的需要人工审核;得分50以下的认为是正常图。

随着AI鉴黄技术的发展,人工鉴黄师逐渐从鉴黄行业里被解放出来。阿里安全部高级算法专家威视向澎湃新闻介绍,假设一天要审核4亿张图片,单纯由人工来审,如果一人一天审1万张,就需要4万人。而经由AI鉴黄后需要交由人工审核的量大约只需20万张,这样只需要20人,大大节省了人力。

不仅仅在识图领域,威视告诉澎湃新闻,AI鉴黄还覆盖到了语音、视频等多媒体领域,目前已经可以识别中文、英文、日文、俄文等语言,还可以识别中国多省份方言,无语义的呻吟声也能识别。据悉,阿里将在8月21日举办的网络安全生态峰会上,集中展示这些技术。

鉴黄AI是怎样炼成的?

阿里的鉴黄AI做的色情图片检测,从原理上来说,就是一个典型的图像分类问题。当前的解决方案是标注样本后,使用深度学习技术训练一个人工神经网络。具体步骤包括明确分类标准→收集样本→样本打标→模型训练,四个步骤。其中前三个步骤主要由人工完成。

这四个步骤听起来似乎是最后一步的技术难度最高,实际上阿里的相关人士向澎湃新闻透露,花时间最久的是第一步。

“虽然实打实的比如‘露点不露点’之类的色情,还有比较明确的判断标准,”威视表示,“对于低俗和性感类,争议就比较多,不同的人有不同的认识。”

现实世界是复杂的,威视举了个例子,以儿童色情的问题为例:儿童露点算不算色情?有人会说:男孩不算,女孩算。又有人质疑:如果男孩年龄较大呢?如果是发育较早的孩子呢?于是又又有人说,十二三岁的男孩子露点算色情。那么,十一岁的呢?或者,如何从图片中判断孩子年龄到底有多大呢?

威视告诉澎湃新闻,虽然明确分类标准是设计步骤时的第一步,但在后续打标过程中,遇到实际的问题还要再对标准进行不断的修正和增补。

被鉴黄AI误认为是色情的图片

在收集样本的过程中,团队“集思广益”,浏览了近2000家网站,下载了超过6000万张疑似色情图片,实际去重后约2300万张图片,并实际标注了超过1300万张图片。这1300多万张图片成为模拟训练的原始数据库,因此这一浩大的工程,被技术人员认为是鉴黄引擎成功最重要的基石。

样本打标过程依然主要由人工完成对2000万张图片的打标。威视介绍,他们做了一个打标工具,并建立了质量控制体系。打标前对所有参加标注的人员先进行培训,学习打标标准,做练习题考试,考试通过之后才能上岗。标中通过事先已有答案的校验题,或多人对同一对象打标的方式,进行标中控制。标后的控制,就是通过模型判断,找出可疑部分再进行人工标注。

威视表示,之所以严格把握样本打标的过程,是因为深度学习,对高质量的标注数据是有很高的要求。数据标志质量越高,最后模型的精度就会越高。

于是,由人类经过千挑万选、做题考试后建立起来的高质量“色情图片”数据库,最后交由模型训练。威视表示,GPU机器单机单卡的情况下训练时间要近一个月。后来阿里团队更换了网络结构并实现了多机多卡训练,将千万级别样本的训练时间控制在一周左右。

“AI最好的应用模式依然是人+机”

那么,高效和低成本的AI鉴黄,是否会完全替代人工鉴黄师?

对此,阿里安全部产品专家念夏向澎湃新闻表示,目前AI鉴黄最好的应用模式仍然是人工+机器。不管是前期设计模型的标准和实际打标,还是后期人工复核,人的参与都是不可或缺的。

2015年7月的“北京三里屯优衣库事件”,一段时长1分钟的试衣间不雅视频流出,并2个小时内在各大网络平台上迅速完成了过亿的转发量。但目前只有人的头脑拥有足够的“意识”判断这些单独的突发性事件,是否属于“违规”。

“已知的、有清晰标准定义的风险,AI都已经能解决了。”念夏表示,真正的难点是恶意的突发事件,爆发了就是爆发了,这种情况下,由于之前对该事件或场景缺乏标准的定义,当时要直接给AI及时去处理,是不可能的。”

另一种类型就是非常模棱两可的场景,即AI打分在50-99分之间的内容。念夏表示,带有主观个人意识或者群体意识的部分,就是需要人工审核的核心部分。

此外,包括特定的体育运动以及国际标准差异等问题,前期模型调整和后期复核标准变化,也需要人工审核的出马。

威视表示,目前像包括相扑、摔跤、艺术体操甚至游泳等门类的运动,由于穿着较为特殊,一般把这类多媒体作品定性为性感类,经由人工复核,终极目标还是希望能让AI直接分辨出图片上的人是在参加运动比赛。

被鉴黄AI误认为是色情的图片

从国际上来看,虽有通用的鉴黄标准,但也会有与国内标准大相径庭的地方。念夏向澎湃新闻举了个例子:“国内如果直播给小宝宝洗澡,其实没什么事,大家觉得很可爱。但在国外是绝对不行的,而且属于严重违规。”

阿里的AI除了用于鉴黄,念夏表示利用这个原理,还能训练AI做类似编审的工作,比如选取视频封面、鉴定重复视频等。“不仅是做合规方面的事情,我们希望利用AI去做真正的生产提效,用技术解决更多社会问题。”

相关推荐
热点推荐
续航里程1000公里,宁德时代发布神行PLUS电池

续航里程1000公里,宁德时代发布神行PLUS电池

界面新闻
2024-04-25 13:55:48
为什么进行性生活时,女性很难达到高潮?结果“扎心”了

为什么进行性生活时,女性很难达到高潮?结果“扎心”了

今日养生之道
2024-04-26 12:05:29
他,回国加盟上海交大,三年多时间,连发2篇Science,这次是唯一通讯作者!

他,回国加盟上海交大,三年多时间,连发2篇Science,这次是唯一通讯作者!

高分子科学前沿
2024-04-26 06:55:01
美国一男子强奸14岁女孩被判50年:他选择物理阉割,但刑期结束前一周才执行

美国一男子强奸14岁女孩被判50年:他选择物理阉割,但刑期结束前一周才执行

红星新闻
2024-04-26 14:31:16
江疏影 参加颁奖活动

江疏影 参加颁奖活动

阿芒娱乐说
2024-04-26 15:44:49
U20女足世界杯资格赛进入收尾阶段,中国小将的未来会是如何

U20女足世界杯资格赛进入收尾阶段,中国小将的未来会是如何

酷马西者野
2024-04-26 17:24:10
所有退路全被堵死  TikTok九死无生

所有退路全被堵死 TikTok九死无生

帅真商业
2024-04-25 16:43:06
杰弗森:今年过后约基奇常规赛成就超KD 若夺冠他将比肩邓肯大梦

杰弗森:今年过后约基奇常规赛成就超KD 若夺冠他将比肩邓肯大梦

直播吧
2024-04-26 23:30:15
99%的人不知道“通房丫鬟”,主子洞房的时候,近身伺候有诀窍

99%的人不知道“通房丫鬟”,主子洞房的时候,近身伺候有诀窍

马尔科故事会
2023-11-09 15:57:32
黄晓明叶珂高调秀恩爱,同款图片文案疑似官宣,聚会细节曝光

黄晓明叶珂高调秀恩爱,同款图片文案疑似官宣,聚会细节曝光

素素娱乐
2024-04-26 10:07:27
不论男女,一天中放屁次数靠近“这个数”,恭喜肠癌离你很远!

不论男女,一天中放屁次数靠近“这个数”,恭喜肠癌离你很远!

荷兰豆爱健康
2024-04-25 07:25:09
日本版《城市猎人》火了,上线1天,口碑炸裂,网飞又赌对了

日本版《城市猎人》火了,上线1天,口碑炸裂,网飞又赌对了

肥罗大电影
2024-04-26 13:14:43
被雷军再带火的凡客彻底活了!销售额暴增超300%

被雷军再带火的凡客彻底活了!销售额暴增超300%

快科技
2024-04-26 16:04:12
曹云金反击成功:肉夹馍店老板曝真相,西安盛唐雷音口碑彻底崩盘

曹云金反击成功:肉夹馍店老板曝真相,西安盛唐雷音口碑彻底崩盘

影像温度
2024-04-26 11:53:34
铁路部门新规,60岁以上的老人乘坐火车高铁,可以享受的福利待遇

铁路部门新规,60岁以上的老人乘坐火车高铁,可以享受的福利待遇

通文知史
2024-04-25 20:15:03
余承东称对比测试发现华为智能驾驶系统优于特斯拉FSD,马斯克:特斯拉FSD很快进入中国【附自动驾驶行业现状分析】

余承东称对比测试发现华为智能驾驶系统优于特斯拉FSD,马斯克:特斯拉FSD很快进入中国【附自动驾驶行业现状分析】

前瞻网
2024-04-24 18:51:10
轰6K和歼10C集结边境,解放军警告亲美叛军:敢挑衅就是全军覆没

轰6K和歼10C集结边境,解放军警告亲美叛军:敢挑衅就是全军覆没

葛剑生
2024-04-25 17:33:01
“美国去死”宣传册,疯传美国高校

“美国去死”宣传册,疯传美国高校

观察者网
2024-04-26 18:19:13
2000年荷兰“性交易”合法化,23年过去,给荷兰带来影响有多大 ?

2000年荷兰“性交易”合法化,23年过去,给荷兰带来影响有多大 ?

财经婉儿
2023-12-02 15:18:02
蓉城球迷失控!赛后投掷水瓶,击中泰山替补席,成都赛区或遭重罚

蓉城球迷失控!赛后投掷水瓶,击中泰山替补席,成都赛区或遭重罚

奥拜尔
2024-04-26 22:31:12
2024-04-27 04:48:49

科技要闻

车展观察|德系日系绝不能放弃中国市场

头条要闻

官方回应环卫工用电子秤测灰尘:正常作业达标有奖励

头条要闻

官方回应环卫工用电子秤测灰尘:正常作业达标有奖励

体育要闻

利雅得青年3-1吉达联合,穆萨卜-朱维尔破门,卡洛斯-儒尼奥尔建功

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

贾跃亭,真他娘是个人才

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

数码
本地
旅游
健康
公开课

数码要闻

小米自带线充电宝 20000mAh 上架:支持 33W 功率,售价 159 元

本地新闻

蛋友碰碰会空降西安!5.1山海境等你!

旅游要闻

白俄,中国人的快乐福地?

这2种水果可降低高血压死亡风险

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版
×