将层次化凝聚聚类扩展至万亿边图
我们介绍了一系列近期关于构建更具可扩展性的图形聚类的工作,最终形成了我们的论文“TeraHAC:万亿边图的层次化凝聚聚类”。我们介绍了这项工作背后的一些关键思想,并解释了如何扩展可以聚类万亿边图的高质量聚类算法。在大规模预测和信息检索任务中...
我们介绍了一系列近期关于构建更具可扩展性的图形聚类的工作,最终形成了我们的论文“TeraHAC:万亿边图的层次化凝聚聚类”。我们介绍了这项工作背后的一些关键思想,并解释了如何扩展可以聚类万亿边图的高质量聚类算法。在大规模预测和信息检索任务中...
为纪念 Google 进行连接组学研究十周年,我们在《科学》杂志上发表了一篇关于人类大脑一小部分突触水平重建的文章。我们讨论了重建过程和数据集,并介绍了在数据中发现的几种新的神经元结构。人类大脑消耗的电量不比一盏昏暗的白炽灯泡多,但它却能完...
Model Explorer 是一款功能强大的图形可视化工具,可帮助用户理解、调试和优化 ML 模型。它擅长以直观的分层格式可视化大型图形,但也适用于较小的模型。图形可视化在机器学习 (ML) 开发过程中起着关键作用。模型的可视化表示可帮助...
Med-Gemini 简介,这是针对多模式医疗领域应用进行微调的 Gemini 模型系列。为了使 AI 模型能够出色地完成各种医疗任务并有效地协助临床医生、研究人员和患者的工作流程(例如生成放射学报告或总结健康信息),它们通常需要高级推理能...
我们描述了生成差异隐私合成数据的方法及其在创建设备安全分类训练数据中的应用。使用复杂的机器学习 (ML) 算法在大型数据集上训练的预测模型在业界和学术界得到广泛应用。使用差分隐私ML 算法训练的模型为用户提供了强大且数学严谨的保证,即模型或...
LANISTR 是一个新的框架,通过获取非结构化(图像、文本)和结构化(时间序列、表格)数据、执行对齐和融合,最终生成类别预测,实现多模式学习。最近的多模态学习突破主要集中在非结构化数据上,涵盖视觉、语言、视频和音频模态(Flamingo、...
Google I/O 展示了 Google 的一些最激动人心的创新和尖端技术。我们在此介绍 I/O 2024 上展示的一些项目,这些项目源自 Google Research 多年的工作成果。每年的Google I/O 大会上,我们都会分享...
我们引入了 AGREE,这是一个基于学习的框架,使 LLM 能够在其回应中提供准确的引用,从而提高其可靠性并增加用户信任。过去几年,大型语言模型(LLM) 在多跳推理、生成计划以及使用工具和 API 等各种功能方面取得了显著进步,这些功能都...
USER-LLM 是一个框架,它通过将各种用户交互提炼为用户嵌入,然后通过交叉注意或软提示将 LLM 与这些嵌入进行情境化,从而增强 LLM 对用户的深刻理解。大型语言模型 (LLM) 彻底改变了自然语言处理 (NLP) 领域。LLM 能够...
ChatDirector 是一个研究原型,它将传统的视频会议转变为使用 3D 视频头像、共享 3D 场景和自动布局转换。视频会议系统通常用于个人和专业场合。它们允许个人使用笔记本电脑等标准设备参加虚拟会议,并在 2D 屏幕上以网格布局显示所...