本文发表于2025年第29期《三联生活周刊》,原标题《人工智能寻亲的进步与难点》
通过新的跨年龄人脸辨别技术,一些被拐卖很长时间的孩子找到了亲生爸爸妈妈用一张10年前的照片找到他
负责拐卖的警察不努力,他们想了不少方法。依据专案组自己透露的历史,2025年,他们联系了中国刑警学院成员、著名犯罪外貌专家赵教授,依据他们小时候的照片,绘制出他们十多大岁数的样子。专案组把这类画像带到卖孩子的广东,给学龄儿童拍照,“用肉眼发现他们的感受是如此的”。看了10天,专案组带回了300多张疑似照片,组织父母鉴别,最后鉴别出176个疑似物体,但最后都没击中。他们还试图将几十万张可能的照片中丢失的孩子的照片与肉眼进行比较,但没办法一一找到。这是探寻被拐儿童的传统办法。直到2025年12月,公安部刑侦局副局长陈世渠才想起自己几年前监管的拐卖儿童案。主犯在2025年被捕前绑架了13名儿童,当年被绑架的儿童只有3名被追回。2025年至2025年被绑架的10名儿童仍然下落不明。据了解缘由是“主犯只供认3项,假如供认第四项刑事责任,可能加重死刑”。
但事情并没唐海鹏想象的那样简单。简单来讲,人脸辨别技术是指通过比较人脸的视觉特点信息来进行身份辨别的技术。但大家手机中用的人脸辨别技术并没那样难应用,由于它辨别的是目前的你,你的五官在短期内不会发生剧烈的变化。跨年龄段的人脸辨别困难程度要大得多,特别是青春期,人长大了,就认不出小时候的照片了。这也让唐海鹏在2025年12月提到这个案例,说腾讯在做一些跨年龄人脸辨别算法,或许可以试一试。当时陈世渠在调查腾讯,而唐海鹏是腾讯安全管理部门的安全专家。就如此,在对话发生在千里以外的广东,10名被拐儿童周围的迷雾终于被撕开。
目之后,汤海鹏回来和腾讯内部负责图像辨别技术研发的优图团队交流,他才发现出了非常大的问题,由于他们当时根本就不拥有这个能力。“当时大家可能也就可以做到在几百张成人照片中间,通过一张婴儿时期的照片找出一个人。”汤海鹏对本刊说。而这种能力显然没办法满足在几十万张照片中找到一个人的需要。
事后回忆起来,其实也只有一线期望。但由于这个项目的特殊性,他们决定尽最大努力试一试。方法只有一个。“就是要让机器了解,当一个人的面部随年龄演变时,不变的那些量是什么。”研究员晓程说。然后他们再把这类面部特点转化为对应的计算机语言。
获得此项目
具体来讲,这个由十几位博士组成的团队自己研发出了一套算法,对0~十八岁的人脸成长变化进行了模拟建模,生成可供学习的人脸样本,然后借助深度神经互联网算法让机器来学习这类人脸在成长过程中的变化。学习的材料不好找,就用研发职员自己小时候不同时期的照片,分别告诉计算机,“这是一个人1岁的样子、5岁的样子、10岁的样子、20岁的样子”。
汤海鹏说,不少父母是不想送原片的,由于这么多年过去了,那一张照片可能是他们唯一留下来的孩子的物品,可能没其他任何的可以留下来的东西了,而且这类照片又是分布在四川好几个地市不一样的父母手上。但无法,警方也只能硬着头皮去劝说父母可以把照片提供过来。汤海鹏目前还记得一个细节,当四川警方采集完了照片,统一拿到上海漕河泾开发区软件园的优图实验室里时,他们慢慢打开袋子,看到的是好几个油纸包裹,把油纸一层一层地拆开,里面才是那一张小小的照片。他们再用数字化好看的仪器将照片提取出来,每张照片的大小能从之前的几百KB变成10MB,终于让对比有了可行性。
这1000张照片被交给了四川警方,警方又找来父母一张张去看,看他们感觉什么像,如此再删选到几十个;最后经过信息筛查,范围被缩小到了10张以内,而这个过程用了4个月的时间。最后一个环节就是比对DNA,据了解在四川公安厅,参与打拐的警察们都充满期待,有人非常乐观,猜测或许会比对上几个;一个干了多年警察的老刑侦比较守旧,猜两个。“大家当时都在祈祷,感觉假如能找到一个就已经非常谢天谢地了。”汤海鹏说。最后的结果是比对上了4个。
27年后,走失儿童的亲人首次通过视频连线的方法见到了已远在他乡的孩子,帮助他们联结起彼此的正是跨年龄人脸辨别技术
首次成功后,研究员们持续对算法进行了优化。如晓程所说,在现实条件中,照片的水平、人脸的角度、遮挡、光线都大概对人工智能的判断带来影响,而他们就要去教人工智能克服其他原因的影响,获得尽可能多的人脸特点。年初,伴随人工智能的辨别精度提高到接近96%,他们又相继比对出了3名被拐儿童。
“它要想大规模应用起来需要一个复杂的过程,这是一个层面;还有一个层面就是这个事情本身就非常复杂。”汤海鹏用好几个“复杂”不断在强调这件事棘手的地方。从理论上来讲,假如把全国人的DNA都测试比对一遍,拐卖儿童的案子不会有一件破不了,但每人都了解,这在事实上是不可能达成的。
这是技术进步给整个社会带来的全新挑战。传统打拐的办法仍以实地探索及画像辨别为主,基本的需要协调都在政府部门内。但用人工智能进行跨年龄的人脸辨别会牵扯到其他社会范围的数据用,譬如探寻年龄在十八岁以下的儿童需要用到教育部门的数据,而用这类数据的可能是一家商业机构,这类协调与管理工作是整个监管层面的空白地带。“譬如教育部门也会担忧,他们虽然采集了那些儿童的数据,但并没一个法律规定说什么事情是明确可以做,什么事情是明确不能做的。”一位参与了这次寻亲行动的人士对本刊说。
在那4个比对上的结果出来后,整个寻亲团队在狂喜之余却又不能不开始了更激烈的讨论,他们试图对可能出现的负面影响做出周全的筹备。“譬如大家得到了比对出的前10个结果,但大家该怎么样去获得他们的DNA?”汤海鹏反问道。再譬如,即便比对出了4个被拐儿童是一个毋庸置疑的好消息,但由于只找到了全部10个被拐儿童中的一部分,这个时候是否应该公告那4个家庭的爸爸妈妈?由于消息一旦流出,或许会影响到后续的探寻工作;但找到了被拐儿童却长期不公告他们的爸爸妈妈,这是不是又有道德争议?“其实这个事情看着是‘科技向善’,但你要真的去做到科技向善真的不是那样容易。”
一些妈妈就对本刊表示,假如她了解自己孩子上学用的照片被拿去检索被拐儿童,她的心理当然会不太舒服。而张吉豫的看法是,在保护个人隐私的基础之上,必须要对公共利益进行肯定的平衡。“一般来讲,‘比率原则’会是一个非常重要的衡量指标,就是看这种新的技术是否为大家社会带来了新的价值;假如带来了新的价值,它又损害了其他方面的一些利益和价值,那就要看这个方法是否必要的。”
打通人工智能寻亲平台
但这种应用场景其实面向的又是另一个群体——走失人群。“由于被拐儿童除非对小时候的记忆印象非常深刻,不然他们不会主动上传我们的照片到这类平台上,就没对比的资料了。”汤海鹏说。
2025年,民政部与百度打造了合作,随后百度为民政救助寻亲系统提供了一台部署了人脸辨别技术的服务器。一方面,它在民政救助管理软件内增加了人脸辨别功能,被救助职员进入救助站之初,员工就能上传其照片与百万级历史救助数据进行人脸比对,如过去同意过救助,就能依据记录迅速辨别身份,帮助走失职员更快回家。其次,家属和志愿者也可以上传走失职员照片到系统里,一键与救助站内全部滞留职员照片进行实时比对,系统会给出相似度排名较高的结果。
虽然谭英换有时会感觉人工智能辨别出的相似度没那样高,不过人工智能人脸辨别这两年还是帮像她如此的寻亲志愿者节省了不少工夫。2025年,陕西人张军宏在爸爸妈妈陪同下到北京就诊,由于患有间接性精神疾病,在就诊过程中,张军宏于8月7日走失。在长达8个月的探寻期间,两位年过七旬的老人一直守在路口,拿着寻人启事向路人不停的询问。2025年4月,在志愿者的提醒和帮助下,将仅有些身份证照片上传到人工智能寻人平台后,系统给出了相似程度较高的8张照片。张父张母经初步查询,确定名叫“陶家俊”的人应该是我们的儿子张军宏,并最后前往北京昌平中西医结合医院救助站成功认亲。
但技术一直在进步。2025年3月份,百度与专业寻亲机构“宝贝回家”展开了合作,也开始将跨年龄的人脸辨别技术应用于探寻走失儿童中。首批两万多条寻亲图片数据接入系统进行对比测评,初步筛选出了30例疑似案例,并已经在4月份成功找到了第一个走失的儿童,那个案例中的“儿童”已经走失27年了。
作为过去的公安工作者,汤海鹏将人脸辨别技术的进步称作“DNA技术出现后的第二次技术突破”。他唯一提醒的是,在做这种技术革新的时候,必须要记得“技术是双刃剑”这句老话。“对大家来讲,如何去运用技术会是一个永远的考验。”