请选择 进入手机版 | 继续访问电脑版

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 174|回复: 0

Google-Landmarks:地标识别的新数据集和挑战

[复制链接]

545

主题

0

回帖

1677

积分

金牌会员

积分
1677
发表于 2024-12-13 23:30:50 | 显示全部楼层 |阅读模式
图像分类技术在过去几年中取得了显着的进步,以Imagenet分类挑战赛为代表,其错误率每年都在大幅下降。为了继续推进计算机视觉领域的最先进技术,许多研究人员现在将更多重点放在细粒度和实例级识别问题上——而不是识别建筑物、山脉和(当然)猫等一般实体,许多人正在设计能够识别埃菲尔铁塔、富士山或波斯猫的机器学习算法。然而,该领域研究的一个重大障碍是缺乏大型注释数据集。
今天,我们很高兴通过发布 Google-Landmarks 来推进实例级识别,这是全球最大的人造和自然地标识别数据集。Google-Landmarks 是作为地标识别和地标检索Kaggle 挑战赛的一部分发布的,这将是CVPR'18 地标研讨会的重点。该数据集包含超过 200 万张图像,描绘了来自世界各地的 3 万个独特地标(其地理分布如下所示),类别数量比常用数据集中的类别数量大约大 30 倍。此外,为了促进该领域的研究,我们正在开源深度局部特征 ( DELF ),这是一种细心的局部特征描述符,我们认为它特别适合这类任务。
我们的数据集中的地标的地理分布。
地标识别与其他问题存在一些显著差异。例如,即使在大型注释数据集中,一些不太受欢迎的地标也可能没有太多可用的训练数据。此外,由于地标通常是不会移动的刚性物体,因此类内变化非常小(换句话说,地标的外观在不同图像中不会发生太大变化)。因此,变化仅由于图像捕获条件(例如遮挡、不同视点、天气和照明)而产生,这与其他图像识别数据集不同,在这些数据集中,特定类别(例如狗)的图像可能会有更大的变化。这些特征也与其他实例级识别问题(例如艺术品识别)共享- 因此我们希望新的数据集也可以有益于其他图像识别问题的研究。
这两个 Kaggle 挑战赛提供了注释数据的访问权限,以帮助研究人员解决这些问题。识别赛道挑战是建立模型,在具有挑战性的测试图像的数据集中识别正确的地标,而检索赛道挑战参与者检索包含相同地标的图像。
以下是来自 Google-Landmarks 数据集的一些图像示例,其中包括大本钟、圣心大教堂、德凯巴卢斯岩石雕塑和Megyeri 桥等地标。
如果您计划今年参加CVPR ,我们希望您能参加CVPR'18 地标研讨会。不过,每个人都可以参加挑战赛,并且可以通过 Kaggle 网站访问新数据集。我们希望此资源对您的研究有价值,我们迫不及待地想看到您为识别地标而想出的想法!
致谢
Jack Sim、Will Cukierski、Maggie Demkin、Hartwig Adam、Bohyung Han、Shih-Fu Chang、Ondrej Chum、Torsten Sattler、Giorgos Tolias、Xu Zhang、Fernando Brucher、Marco Andreetto、Gursheesh Kour。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|绿色天空实验室

GMT+8, 2025-1-22 06:14 , Processed in 0.075128 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表