研究人员报告年龄估计软件评估的首批结果

美国国家标准与技术研究所 (NIST) 的一项新研究评估了根据人脸照片中的身体特征估算年龄的软件的性能。

这种年龄估计和验证(AEV)软件可能被用作有年龄限制的活动的守门人,例如购买酒精或在线访问成人内容。

年龄估算已成为最近纳入美国国内外立法和法规的年龄保证计划中的一项有利技术。这些计划旨在仅允许特定年龄段的人访问社交媒体聊天室或在线和现实世界购买某些产品,并且可以成为保护在线儿童的重要部分。

这项新研究名为“人脸分析技术评估:年龄估计与验证 (NIST IR 8525)”,评估了开发人员在 2023 年 9 月的征稿活动中自愿提供的六种算法的性能。据该研究的作者之一 Kayee Hanaoka 称,结果显示这些算法具有不同的能力。

NIST 计算机科学家 Hanaoka 表示:“这些算法的性能差异很大,在各个方面都有改进空间。这是 2023 年底年龄估计领域的部分快照,但由于 AEV 性能与人工智能的进步密切相关,我们预计该领域将迅速发生变化。”

这项新研究是 NIST 十年来首次尝试 AEV 评估,并启动了该机构对该技术进行频繁、定期测试的长期新努力。NIST 上一次评估 AEV 软件是在 2014 年。

花冈说,当时人们对这项技术的兴趣远不及现在,而且评估只是一次性工作。那次测试使用了一个数据库,其中包含约 600 万张签证申请照片,只需要算法就能对每张照片进行年龄估计。

在接下来的十年里,时代发生了变化。人脸分析软件变得非常重要,以至于 NIST 将其人脸识别程序分为两个轨道,一个用于评估算法识别人的能力(人脸识别技术评估,或 FRTE),另一个用于评估测量人脸各个方面的能力(人脸分析技术评估,或 FATE)。新测试是 FATE 轨道的一部分,该轨道还包含专门用于检测照片欺诈和测量图像质量的评估。

NIST 的新测试将其照片收集扩大到来自四个不同数据库的约 1150 万张照片,这些数据库全部来自美国政府来源:2014 年使用的签证收集,以及一组 FBI 的面部照片、一组在边境口岸获得的网络摄像头图像以及一组出生在 100 多个国家的人的移民申请照片。

数据库中的照片图像质量各异,反映出不同的年龄、性别和地区。所有数据均匿名,研究经过审查,以保护拍摄对象的权利和隐私。

测试再次评估了算法在年龄估计方面的准确性,但应软件开发人员的要求,测试还要求算法指定照片中的人是否超过 21 岁。该测试是一项“闭箱”研究,其中 NIST 研究人员仅分析算法的最终性能,而不是其内部工作原理或它们如何得出结果。NIST 不会就软件是否适合特定用例提出任何建议。

Hanaoka 表示,该报告给出了一些初步发现:

  • 没有单一的算法能脱颖而出,特定算法的准确性受图像质量、性别、出生地区、照片中人物的年龄以及这些因素之间的相互作用的影响。所有算法对特定人口群体都有各自的敏感性;对某些群体表现良好的算法可能对其他群体表现不佳。

  • 毫不奇怪,自上一份报告发布以来的十年里,AEV 软件已经有所改进。在对签证照片通用数据库(2014 年和当前研究均使用过)进行年龄估算时,算法的平均绝对误差已从 4.3 年降至 3.1 年。六种算法中有五种比 2014 年提交的最准确算法表现更好。

  • 女性面孔的错误率几乎总是高于男性面孔。2014 年评估的算法也是如此,但根本原因尚不清楚。

测试计划将持续进行,研究作者将陆续接受新的算法提交。Hanaoka 表示,该团队计划每四到六周在其网站上发布第一轮结果的更新。

“我们预计 AEV 软件领域将发生快速变化,我们打算在不久的将来更新和扩展我们的测试方法,”她说。“我们计划让算法回答更多问题,例如,如果有同一个人的先前照片,是否可能获得更好的性能。我们还计划扩展和多样化照片数据库,以更好地涵盖在线安全等应用。”


本站全部资讯来源于实验室原创、合作机构投稿及网友汇集投稿,仅代表个人观点,不作为任何依据,转载联系作者并注明出处:https://www.lvsky.net/339.html

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论