请选择 进入手机版 | 继续访问电脑版

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 231|回复: 0

TFGAN:生成对抗网络的轻量级库

[复制链接]

545

主题

0

回帖

1677

积分

金牌会员

积分
1677
发表于 2024-12-13 23:38:56 | 显示全部楼层 |阅读模式
训练神经网络通常涉及定义损失函数,该函数告诉网络它与目标的距离。例如,图像分类网络通常会被赋予一个损失函数,以惩罚其错误分类的行为;将狗图片错误地标记为猫的网络将获得很高的损失。但是,并非所有问题都有易于定义的损失函数,特别是如果它们涉及人类感知,例如图像压缩或文本转语音系统。生成对抗网络(GAN) 是一种机器学习技术,它已导致广泛应用的改进,包括从文本生成图像、超分辨率以及帮助机器人学习抓取,它提供了一种解决方案。然而,GAN 带来了新的理论和软件工程挑战,并且很难跟上 GAN 研究的快速步伐。
一段视频展示了生成器随着时间的推移不断改进的过程。它从产生随机噪声开始,最终学会生成 MNIST 数字。
为了让 GAN 更易于实验,我们开源了TFGAN,这是一个轻量级库,旨在让您轻松训练和评估 GAN。它提供了轻松训练 GAN 的基础架构,提供了经过充分测试的损失和评估指标,并提供了易于使用的示例,突显了 TFGAN 的表现力和灵活性。我们还发布了一个教程,其中包含一个高级 API,可让您快速使用数据训练模型。
这展示了对抗性损失对图像压缩的影响。上行显示来自ImageNet 数据集的图像块。中间行显示通过传统损失训练的图像压缩神经网络压缩和解压缩图像的结果。下行显示使用传统损失和对抗性损失训练的网络的结果。即使与原始图像不太相似,GAN 损失图像也更清晰、更详细。
TFGAN 以几种重要方式支持实验。它提供了简单的函数调用,涵盖了大多数 GAN 用例,因此您只需几行代码即可在数据上运行模型,但它以模块化方式构建,以涵盖更多奇特的 GAN 设计。您可以只使用您想要的模块 - 损失、评估、特征、训练等都是独立的。TFGAN 的轻量级设计还意味着您可以将它与其他框架一起使用,也可以与原生 TensorFlow 代码一起使用。使用 TFGAN 编写的 GAN 模型将轻松受益于未来的基础架构改进,您可以从大量已实现的损失和特征中进行选择,而无需重写自己的模型。最后,代码经过充分测试,因此您不必担心使用 GAN 库时容易犯的数字或统计错误。
大多数神经文本转语音 (TTS) 系统都会产生过于平滑的声谱图。当应用于Tacotron TTS 系统时,GAN 可以重现一些真实的纹理,从而减少最终音频中的伪影。
当您使用 TFGAN 时,您将使用许多 Google 研究人员使用的相同基础架构,并且可以使用我们使用该库开发的尖端改进。任何人都可以向 GitHub 存储库做出贡献,我们希望这将促进 ML 研究人员和用户之间的代码共享。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|绿色天空实验室

GMT+8, 2025-1-22 06:19 , Processed in 0.081681 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表