图像识别的一次乌龙?

二零一八年五月二日,美国之音中文网在啁啾会馆(Twitter)发了这条关于林昭的信息,并配上了照片。那是典型的改革开放前的中国黑白老照片,身穿类似军服的年轻女性留着短髮,意气风发地仰望前方天空,袖管卷起,双手插入口袋。这样一条啁啾在人们的时间线上滑过,通常不会引起任何注意。像是林昭的年代,也像是林昭。

1493439159235584 m
我的奶奶柴文璐女士。这张照片在网上多处被误当作林昭女士的照片。

唯一的问题是这并非林昭。有一位啁啾用户瞬间被照片吸引。他觉得自己在哪看过这照片,并很快在家中的实体相册里找到了它。这位啁啾用户是我的父亲,相片中的女性是他的母亲,我的奶奶。

WhatsApp Image 2018 05 03 at 16 26 36
家中老相册里的同一张照片,由家父手持拍摄。

这里有两个问题,一是我奶奶的照片是怎么被传到网上的,二是为什么美国之音中文网会把我奶奶的照片错误地当作林昭的照片发出。

第一个问题我们暂时还没有答案,但答案也相对不重要。显然,这并不是用数码相机或手机拍摄的照片,一定有人翻拍或扫描后传上了网。相册网站现在不流行了,不过再早几年,把家人的老照片扫描上传 FlickrPicasa、甚至更老的校友录一类的网站,并非不可想像。

第二个问题比较有趣。目前在 Google 搜索「林昭」,在图片结果里可以看到我奶奶的这张照片。顺藤摸瓜点过去,我找到的最早记录是二零一六年的这篇发表于微信公众号的文章。照片右下角有「格隆」的水印。不管格隆是谁,我想她不会是照片的上传者。文章本身的内容和配图一样,应该都是她在网上搜集并拼凑而成。显然,和我奶奶的照片是如何传上网的相比,更有趣的问题是为什么她会被搜索引擎视为林昭。

在 Google 的搜索结果里,还有这张真正的林昭照片:

Linzhao1

可以看到,两张照片无论人物姿势还是背景画面内容都有不少相似之处。我请教了做技术的朋友,按照目前的图像识别能力,算法将它们搞混是很有可能的。

有没有可能是有人把上面这张林昭的照片传到了 Google 的反向图片搜索引擎(输入图片来搜索相似的图片),Google 的算法将我奶奶的照片误认为是林昭,从此给我奶奶的照片打上了林昭的标签?或者,Google 的神经网络本身就在不停学习、寻找同类照片,在这个过程中祂自己确信上述两张照片里的是同一个人?这件事一旦发生,之后的连锁反应就可以预见了:搜索「林昭」的名字可以搜到我奶奶的照片,而这张照片的清晰度又比大部分网上能找到的林昭照片要高。需要用图的作者或编辑未曾细看,拿来就用,逐渐以讹传讹。现在看来,家父是唯一一个看出美国之音中文网误植了照片的的人,大部分读者,无论是在关于林昭的文章里还是在某个时间线上看到这张照片,都不会怀疑相中人的身份。

我已经致信美国之音中文网,请她们删除那条啁啾,但想必于事无补。就算她们删除,这张照片已经作为林昭女士的照片在网上有了生命。去中心化的。

李如一这个名字是奶奶取的,愿奶奶安息。