请选择 进入手机版 | 继续访问电脑版

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 196|回复: 0

MobileNetV2:下一代设备上计算机视觉网络

[复制链接]

545

主题

0

回帖

1677

积分

金牌会员

积分
1677
发表于 2024-12-12 13:26:26 | 显示全部楼层 |阅读模式
去年,我们推出了MobileNetV1,这是一系列通用计算机视觉神经网络,专为移动设备而设计,支持分类、检测等功能。在个人移动设备上运行深度网络的能力提高了用户体验,提供随时随地的访问,并在安全性、隐私性和能耗方面具有额外的优势。随着新应用程序的出现,允许用户实时与现实世界互动,对更高效的神经网络的需求也在增长。
今天,我们很高兴地宣布推出MobileNetV2,为下一代移动视觉应用程序提供支持。MobileNetV2 是对 MobileNetV1 的重大改进,推动了移动视觉识别的最新技术,包括分类、对象检测和语义分割。MobileNetV2 作为 TensorFlow-Slim 图像分类库的一部分发布,您也可以立即在Colaboratory中开始探索 MobileNetV2 。或者,您可以下载笔记本并使用Jupyter在本地进行探索。MobileNetV2 也可作为TF-Hub 上的模块使用,预训练的检查点可在 github 上找到。
MobileNetV2 以 MobileNetV1 [1] 的理念为基础,使用深度可分离卷积作为高效构建块。然而,V2 为该架构引入了两个新功能:1) 层之间的线性瓶颈,以及 2) 瓶颈之间的快捷连接1。基本结构如下所示。
MobileNetV2 架构概览。蓝色块表示如上所示的复合卷积构建块。
直觉上,瓶颈对模型的中间输入和输出进行编码,而内层则封装了模型从像素等低级概念转换为图像类别等高级描述符的能力。最后,与传统的残差连接一样,快捷方式可以加快训练速度并提高准确性。您可以在我们的论文“ MobileNet V2:倒置残差和线性瓶颈”中了解有关技术细节的更多内容。
与第一代 MobileNets 相比如何?
总体而言,MobileNetV2 模型在整个延迟范围内以相同的准确度更快。具体而言,与 MobileNetV1 模型相比,新模型使用的操作减少了 2 倍,需要的参数减少了 30%,在 Google Pixel 手机上的运行速度提高了约 30-40%,同时实现了更高的准确度。
MobileNetV2 提高了速度(减少了延迟)并提高了 ImageNet Top 1 准确率
MobileNetV2 是一种非常有效的特征提取器,可用于对象检测和分割。例如,在与新推出的 SSDLite [2] 搭配使用时,新模型在检测方面比 MobileNetV1 快约 35%,且准确率相同。我们已在Tensorflow 对象检测 API [4] 下开源该模型。
为了实现设备上的语义分割,我们使用了最近发布 的 DeepLabv3 [3] 的简化形式的 MobileNetV2 作为特征提取器。在语义分割基准PASCAL VOC 2012上,我们得到的模型达到了与使用 MobileNetV1 作为特征提取器类似的性能,但所需的参数减少了 5.3 倍,乘加运算减少了 5.2 倍。
正如我们所见,MobileNetV2 提供了一个非常高效的移动导向模型,可用作许多视觉识别任务的基础。我们希望通过与更广泛的学术和开源社区分享它,帮助推动研究和应用程序开发。
致谢:
我们要感谢我们的核心贡献者 Menglong Zhu、Andrey Zhmoginov 和 Liang-Chieh Chen。我们还要特别感谢 Bo Chen、Dmitry Kalenichenko、Skirmantas Kligys、Mathew Tang、Weijun Wang、Benoit Jacob、George Papandreou、Zhichao Lu、Vivek Rathod、Jonathan Huang、Yukun Zhu 和 Hartwig Adam。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|绿色天空实验室

GMT+8, 2025-1-22 05:30 , Processed in 0.084791 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表