Google 参加 EMNLP 2023_商业应用

谷歌很荣幸成为年度顶级会议“自然语言处理经验方法” (EMNLP 2023)的钻石赞助商，该会议本周在新加坡圣淘沙举行。谷歌在本届会议上表现不俗，录用了 65 多篇论文，并积极参与了 11 场研讨会和辅导课。谷歌也很高兴成为“扩大自然语言处理” (WiNLP) 研讨会的主要赞助商，该研讨会旨在强调人工智能和机器学习领域中人员、观点和文化的全球代表性。我们期待分享我们广泛的自然语言处理研究成果，并扩大与更广泛研究社区的合作伙伴关系。

我们希望您能参观 Google 展位，与积极追求 NLP 最新创新的研究人员交流，并查看一些预定的展位活动（例如，下面列出的演示和问答环节）。访问 @GoogleAI X（Twitter）和LinkedIn帐户，了解有关 EMNLP 2023 上 Google 展位活动的更多信息。

请参阅下文，了解有关在 EMNLP 2023 上展示的 Google 研究的更多信息（Google 附属机构以粗体显示）。

董事会及组织委员会

赞助主席：Shyam Upadyay

行业分会主席：Imed Zitouni

高级项目委员会：Roee Aharoni、Annie Louis、Vinodkumar Prabhakaran、Shruti Rijhwani、Brian Roark、Partha Talukdar

已接受的论文

SynJax：JAX 的结构化概率分布

Miloš Stanojević , Laurent Sartran

适配器：用于参数高效和模块化迁移学习的统一库

Clifton Poth、Hannah Sterz、Indraneil Paul、Sukannya Purkayastha、Leon Engländer、Timo Imhof、Ivan Vulić、Sebastian Ruder、Iryna Gurevych、Jonas Pfeiffer

DocumentNet：弥合文档预训练中的数据差距

Lijun Yu，Jin Miao，Xiaoyu Sun，Jiayi Chen，Alexander Hauptmann，Hanjun Dai，Wei Wei

AART：人工智能辅助红队与法学硕士支持的新应用程序生成多种数据

Bhaktipriya Radharapu、Kevin Robinson、Lora Aroyo、Preethi Lahoti

CRoW：在现实世界任务中对常识推理进行基准测试

Mete Ismayilzada、Debjit Paul、Syrielle Montariol、Mor Geva、Antoine Bosselut

大语言模型可以自我完善

黄嘉欣* ,顾世祥,侯乐,吴跃新,王学智,于洪坤,韩家伟

剖析自回归语言模型中事实关联的回忆

Mor Geva、Jasmijn Bastings、Katja Filippova、Amir Globerson

停止以纯文本形式上传测试数据：减轻评估基准数据污染的实用策略

Alon Jacovi、Avi Caciularu、Omer Goldman、Yoav Goldberg

选择性标记：如何从根本上降低文档提取模型的数据标记成本

Yichao Zhou、James Bradley Wendt、Navneet Potti、Jing Xie、Sandeep Tata

自然语言生成模型中的归因测量

Hannah Rashkin、Vitaly Nikolaev、Matthew Lamm、Lora Aroyo、Michael Collins、Dipanjan Das、Slav Petrov、Gaurav Singh Tomar、Iulia Turc、David Reitter

逆向缩放可能会变成 U 形

Jason Wei * , Najoung Kim , Yi Tay * , Quoc Le

INSTRUCTSCORE：面向自动反馈的可解释文本生成评估

Wenda Xu、Danqing Wang、Liangming Pan、Zhenqiao Song、Markus Freitag、William Yang Wang、Lei Li

对话历史表示在会话问答中的稳健性：一项全面的研究和一种基于提示的新方法

Zorik Gekhman、Nadav Oved、Orgad Keller、Idan Szpektor、Roi Reichart

研究如何有效扩展 Transformer 以实现长输入摘要

Jason Phang *、Yao Zhao、Peter J Liu

DSI++：使用新文档更新 Transformer 内存

Sanket Vaibhav Mehta *、Jai Gupta、Yi Tay、Mostafa Dehghani、Vinh Q. Tran、Jinfeng Rao、Marc Najork、Emma Strubell、Donald Metzler

MultiTurnCleanup：多轮口语对话记录清理的基准

Hua Shen *、Vicky Zayats、Johann C Rocholl、Daniel David Walker、Dirk Padfield

q2d：将问题转化为对话来教模型如何搜索

Yonatan Bitton、Shlomi Cohen-Ganor、Ido Hakimi、Yoad Lewenberg、Roee Aharoni、Enav Weinreb

具身序列建模中抽象状态表示的出现

Tian Yun * , Zilai Zeng , Kunal Handa , Ashish V Thapliyal , Bo Pang , Ellie Pavlick , Chen Sun

跨语言问答归因评估与建模

Benjamin Muller *、John Wieting、Jonathan H. Clark、Tom Kwiatkowski、Sebastian Ruder、Livio Baldini Soares、Roee Aharoni、Jonathan Herzig、Xinyi Wang

多模态预训练中的视觉关系弱监督学习

Emanuele Bugliarello、Aida Nematzadeh、Lisa Anne Hendricks

语言如何相互影响？研究 LM 微调过程中的跨语言数据共享

Rochelle Choenni、Dan Garrette、Ekaterina Shutova

CompoundPiece：评估和提高语言模型的分解性能

Benjamin Minixhofer、Jonas Pfeiffer、Ivan Vulić

IC3：委员会共识的图像字幕

David Chan、Austin Myers、Sudheendra Vijayanarasimhan、David A Ross、John Canny

幻觉（不）可回答性的奇怪案例：在过度自信的大型语言模型的隐藏状态中寻找真相

Aviv Slobodkin、Omer Goldman、Avi Caciularu、Ido Dagan、Shauli Ravfogel

评估受控生成任务的大型语言模型

Jiao Sun , Yufei Tian , Wangchunshu Zhou , Nan Xu , qian Hu , Rahul Gupta , John Wieting , Nanyun Peng , Xuzhe Ma

关系很重要：使用成对准确度和关系校准对现代指标进行元评估

Daniel Deutsch、George Foster、Markus Freitag

通过额外 0.1% 的计算超越缩放定律

Yi Tay *、Jason Wei *、Hyung Won Chung *、Vinh Q. Tran、David R. So *、Siamak Shakeri、Xavier Garcia、Huaixiu Steven Zheng、Jinfeng Rao、Aakanksha Chowdhery、Denny Zhou、Donald Metzler、Slav Petrov、Neil Houlsby、Quoc V. Le、Mostafa Dehghani

数据相似性不足以解释语言模型性能

Gregory Yauney *、Emily Reif、David Mimno

语言模型预训练的自我影响引导数据重新加权

Megh Thakkar * , Tolga Bolukbasi , Sriram Ganapathy , Shikhar Vashishth , Sarath Chandar , Partha Talukdar

ReTAG：推理感知表到分析文本生成

Deepanway Ghosal、Preksha Nema、Aravindan Raghuveer

GATITOS：使用新的多语言词典进行低资源机器翻译

Alex Jones *、Isaac Caswell、Ishank Saxena

视频多模态机器翻译

李一航、清水修一郎、褚晨辉、黑桥定夫、李伟

符号调优改善语言模型中的情境学习

Jerry Wei * , Le Hou , Andrew Kyle Lampinen ,香宁陈* , Da Huang , Yi Tay * , Xinyun Chen , Yifeng Lu , Denny Zhou , Tengyu Ma * , Quoc V Le

“不要断章取义！”论文体重写中语境模型与评估的必要性

Akhila Yerukola , Xuhui Zhou , Elizabeth Clark , Maarten Sap

QAmeleon：仅 5 个示例的多语言 QA

Priyanka Agrawal、Chris Alberti、Fantine Huot、Joshua Maynez、Ji Ma、Sebastian Ruder、Kuzman Ganchev、Dipanjan Das、Mirella Lapata

说话、阅读和提示：具有最低限度监督的高保真文本转语音

Eugene Kharitonov、Damien Vincent、Zalán Borsos、Raphaël Marinier、Sertan Girgin、Olivier Pietquin、Matt Sharifi、Marco Tagliasacchi、Neil Zeghidour

AnyTOD：一种可编程的面向任务的对话系统

Jeffrey Zhao、Yuan Cao、Raghav Gupta、Harrison Lee、Abhinav Rastogi、Mingqiu Wang、Hagen Soltau、Izhak Shafran、Yonghui Wu

选择性回答模棱两可的问题

Jeremy R. Cole、Michael JQ Zhang、Daniel Gillick、Julian Martin Eisenschlos、Bhuwan Dhingra、Jacob Eisenstein

PRESTO：用于解析现实任务导向对话的多语言数据集（参见博客文章）

Rahul Goel、Waleed Ammar、Aditya Gupta、Siddharth Vashishtha、Motoki Sano、Faiz Surani *、Max Chang、HyunJeong Choe、David Greene、Chuan He、Rattima Nitisaroj , Anna Trukhina , Shachi Paul , Pararth Shah , Rushin Shah ,周瑜

LM vs LM：通过交叉询问检测事实错误

Roi Cohen、May Hamri、Mor Geva、Amir Globerson

一套用于多层次多模式网页理解的生成任务

Andrea Burns *、Krishna Srinivasan、Joshua Ainslie、Geoff Brown、Bryan A. Plummer、Kate Saenko、Jianmo Ni、Mandy Guo

AfriSenti：非洲语言的 Twitter 情绪分析基准

Shamsuddeen Hassan Muhammad、Idris Abdulmumin、Abinew Ali Ayele、Nedjma Ousidhoum、David Ifeoluwa Adelani、Seid Muhie Yimam、Ibrahim Said Ahmad、Meriem Beloucif、Saif M. Mohammad、Sebastian Ruder、Oumaima Hourrane、阿利皮奥·豪尔赫、帕维尔·巴西迪尔、费莱米诺·D.M . A. Ali , Davis David , Salomey Osei , Bello Shehu-Bello , Falalu Ibrahim Lawan , Tajuddeen Gwadabe , Samuel Rutunda , Tadesse Destaw Belay , Wendimu Baye Messell , Hailu Beshada Balcha , Sisay Adugna Chala , Hagos Tesfahun Gebrmichael , Bernard Opoku , Stephen Arthur

通过标记消除优化检索增强阅读器模型

Moshe Berchansky、Peter Izsak、Avi Caciularu、Ido Dagan、Moshe Wasserblat

SEAHORSE：用于总结评估的多语言、多方面数据集

Elizabeth Clark、Shruti Rijhwani、Sebastian Gehrmann、Joshua Maynez、Roee Aharoni、Vitaly Nikolaev、Thibault Sellam、Aditya Siddhant、Dipanjan Das、Ankur P Parikh

GQA：从多头检查点训练广义多查询 Transformer 模型

Joshua Ainslie、James Lee-Thorp、Michiel de Jong *、Yury Zemlyanskiy、Federico Lebron、Sumit Sanghai

CoLT5：具有条件计算的更快长距离 Transformer

Joshua Ainslie、Tao Lei、Michiel de Jong、Santiago Ontanon、Siddhartha Brahma、Yury Zemlyanskiy、David Uthus、Mandy Guo、James Lee-Thorp、Yi Tay、Yun-Hsuan Sung、Sumit Sanghai

通过集体批评和自我投票提高大型语言模型中人口统计代表性的多样性

Preethi Lahoti、Nicholas Blumm、Xiao Ma、Raghavendra Kotikalapudi、Sahitya Potluri、Qijun Tan、Hansa Srinivasan、Ben Packer、Ahmad Beirami、Alex Beutel、Jilin Chen

通用自适应提示（参见博客文章）

Xingchen Wan *、Ruoxi Sun、Hootan Nakhost、Hanjun Dai、Julian Martin Eisenschlos、Sercan O. Arik、Tomas Pfister

TrueTeacher：使用大型语言模型学习事实一致性评估

Zorik Gekhman、Jonathan Herzig、Roee Aharoni、Chen Elkind、Idan Szpektor

多模态电子健康记录分层预训练

王晓晨,罗俊宇,王佳琪,尹子怡,崔苏涵,钟源,王亚庆,马凤龙

NAIL：具有高效非自回归解码器的词汇检索索引

Livio Baldini Soares、Daniel Gillick、Jeremy R. Cole、Tom Kwiatkowski

生成检索如何扩展到数百万个段落？

Ronak Pradeep *、Kai Hui、Jai Gupta、Adam D. Lelkes、Honglei Zhuang、Jimmy Lin、Donald Metzler、Vinh Q. Tran

让每个例子都发挥作用：论自我影响力在嘈杂的 NLP 数据集中学习的稳定性和实用性

Irina Bejan *、Artem Sokolov、Katja Filippova

EMNLP 的发现

通过自我评估进行适应性学习以提高法学硕士 (LLM) 中的选择性预测

Jiefeng Chen *、Jinsung Yoon、Sayna Ebrahimi、Sercan O Arik、Tomas Pfister、Somesh Jha

工具辅助生成策略的综合评估

Alon Jacovi *、Avi Caciularu、Jonathan Herzig、Roee Aharoni、Bernd Bohnet、Mor Geva

1-PAGER：一次性答案生成和证据检索

Palak Jain、Livio Baldini Soares、Tom Kwiatkowski

MaXM：面向多语言视觉问答

Soravit Changpinyo、Linting Xue、Michal Yarom、Ashish V. Thapliyal、Idan Szpektor、Julien Amelot、Xi Chen、Radu Soricut

SDOH-NLI：从临床记录推断健康社会决定因素的数据集

Adam D. Lelkes、Eric Loreaux *、Tal Schuster、Ming-Jun Chen、Alvin Rajkomar

使用基于案例推理的机器阅读理解

Dung Ngoc Thai、Dhruv Agarwal、Mudit Chaudhary、Wenlong Zhao、Rajarshi Das、Jay-Yoon Lee、Hannah Hajishirzi、Manzil Zaheer、Andrew McCallum

非洲语言跨语言开放检索问答

Odunayo Ogundepo , Tajuddeen Gwadabe , Clara E. Rivera , Jonathan H. Clark , Sebastian Ruder , David Ifeoluwa Adelani , Bonaventure FP Dossou , Abdou Aziz DIOP , Claytone Sikasote , Gilles HACHEME , Happy Buzaaba , Ignatius Ezeani , Rooweither Mabuya , Salomey Osei , Chris Chininye Emezue , Albert Kahira , Shamsuddeen Hassan Muhammad , Akintunde Oladipo , Abraham Toluwase Owodunni , Atnafu Lambebo Tonja , Iyanuoluwa Shode , Akari Asai , Anuoluwapo Aremu , Ayodele Awokoya ,伯纳德·奥波库、恰马卡·伊杰奥马Chukwuneke、Christine Mwase、Clemencia Siro、Stephen Arthur、Tunde Oluwaseyi Ajayi、Verrah Akinyi Otiende、Andre Niyongabo Rubungo、Boyd Sinkala、Daniel Ajisafe、Emeka Felix Onwuegbuzia、Falalu Ibrahim Lawan、Ibrahim Said Ahmad、Jesujoba Oluwadara Alabi CH、伊内杜·伊曼纽尔·姆博努,莫费托鲁瓦Adeyemi、Mofya Phiri、Orevaoghene Ahia、Ruqayya Nasir Iro、Sonia Adhiambo

概率神经摘要中的不确定性校准和选择性生成：基准研究

Polina Zablotskaia、Du Phan、Joshua Maynez、Shashi Narayan、Jie Ren、Jeremiah Zhe Liu

Epsilon Sampling Rocks：研究机器翻译最小贝叶斯风险解码的采样策略

Markus Freitag、Behrooz Ghorbani *、Patrick Fernandes *

大型语言模型在推理任务中产生幻觉的来源

Nick McKenna、Tianyi Li、Liang Cheng、Mohammad Javad Hosseini、Mark Johnson、Mark Steedman

不要添加，不要错过：从预选文本跨度中有效保存生成内容

Aviv Slobodkin、Avi Caciularu、Eran Hirsch、Ido Dagan

是什么让思维链提示有效？一项反事实研究

Aman Madaan * , Katherine Hermann , Amir Yazdanbakhsh

使用大型语言模型理解 HTML

Izzeddin Gur、Ofir Nachum、Yingjie Miao、Mustafa Safdari、Austin Huang、Aakanksha Chowdhery、Sharan Narang、Noah Fiedel、Aleksandra Faust

通过检测和消除输入噪声来提高摘要模型的鲁棒性

Kundan Krishna *、Yao Zhao、Jie Ren、Balaji Lakshminarayanan、Jiaming Luo、Mohammad Saleh、Peter J. Liu

情境学习创建任务向量

Roee Hendel、Mor Geva、Amir Globerson

无需注意的预训练

Junxiong Wang、Jing Nathan Yan、Albert Gu、Alexander M Rush

MUX-PLM：高吞吐量语言模型的数据复用

Vishvak Murahari、Ameet Deshpande、Carlos E Jimenez、Izhak Shafran、Mingqiu Wang、Yuan Cao、Karthik R Narasimhan

PaRaDe：使用法学硕士演示进行文章排序

Andrew Drozdov *、Honglei Zhuang、Zhuyun Dai、Zhen Qin、Razieh Rahimi、Xuanhui Wang、Dana Alon、Mohit Iyyer、Andrew McCallum、Donald Metzler *、Kai Hui

在大型语言模型上通过有限状态解码约束进行分段实现长篇语音翻译

Arya D. McCarthy、Hao Zhang、Shankar Kumar、Felix Stahlberg、Ke Wu

使用近似测地线进行无监督意见总结

Somnath Basu Roy Chowdhury *、Nicholas Monath、Kumar Avinava Dubey、Amr Ahmed、Snigdha Chaturvedi

SQLPrompt：使用最少标记数据的上下文文本到 SQL

Ruoxi Sun、Sercan O. Arik、Rajarishi Sinha、Hootan Nakhost、Hanjun Dai、Pengcheng Yin、Tomas Pfister

利用结构和不确定性对复杂图进行检索增强解析

Zi Lin , Quan Yuan , Panupong Pasupat , Jeremiah Zhe Liu , Jingbo Shang

具有结构化反射的计算机控制零样本语言代理

Tao Li、Gang Li、Zhiwei Deng、Bryan Wang *、Yang Li

语言基础中的语用学：现象、任务和建模方法

Daniel Fried、Nicholas Tomlin、Jennifer Hu、Roma Patel、Aida Nematzadeh

通过主动生成成对反事实来提高分类器稳健性

Ananth Balashankar、Xuezhi Wang、Yao Qin、Ben Packer、Nithum Thain、Jilin Chen、Ed H. Chi、Alex Beutel

mmT5：模块化多语言预训练解决源语言幻觉

Jonas Pfeiffer、Francesco Piccinno、Massimo Nicosia、Xinyi Wang、Machel Reid、Sebastian Ruder

缩放定律与模型架构：归纳偏差如何影响缩放？

Yi Tay、Mostafa Dehghani、Samira Abnar、Hyung Won Chung、William Fedus、Jinfeng Rao、Sharan Narang、Vinh Q. Tran、Dani Yogatama、Donald Metzler

TaTA：针对非洲语言的多语言表格到文本数据集

Sebastian Gehrmann、Sebastian Ruder、Vitaly Nikolaev、Jan A. Botha、Michael Chavinda、Ankur P Parikh、Clara E. Rivera

XTREME-UP：面向代表性不足语言的用户中心稀缺数据基准

Sebastian Ruder、 Jonathan H. Clark、Alexander Gutkin、Mihir Kale、Min Ma、Massimo Nicosia、Shruti Rijhwani、Parker Riley、Jean Michel Amath Sarr、Xinyi Wang、John Frederick Wieting、Nitish Gupta、Anna Katanova、Christo Kirov、Dana L Dickinson、Brian Roark、Bidisha Samanta、Connie Tao、David Ifeoluwa Adelani、Vera Axelrod、Isaac Rayburn Caswell、Colin Cherry、Dan Garrette、Reeve Ingle、Melvin Johnson、Dmitry Panteleev、Partha Talukdar

基于任务个性化多模态少样本学习的视觉丰富文档实体检索

陈嘉懿* ,戴涵俊,戴波,张爱东,魏炜*

工作坊

第七届拓展 NLP 研讨会(WiNLP)

主要赞助商

组织者：Sunipa Dev

小组成员：Preethi Lahoti

第六届指称、首指和共指计算模型研讨会（CRAC）

特邀演讲者：Bernd Bohnet

第三届自然语言处理开源软件（NLP-OSS）研讨会

组织者：Geeticka Chauhan

机器人空间语言理解与基础交流联合研讨会（SpLU-RoboNLP）

特邀演讲嘉宾：Andy Zeng

自然语言生成、评估和度量(GEM)

组织者：Elizabeth Clark

第一届阿拉伯语自然语言处理会议（ArabicNLP）

组织者：Imed Zitouni

大图景：制作研究叙述(BigPicture)

组织者：Nora Kassner、Sebastian Ruder

BlackboxNLP 2023：第六届 NLP 神经网络分析与解释研讨会

组织者：Najoung Kim

小组成员：Neel Nanda

SIGNLL 计算自然语言学习会议(CoNLL)

联合主席：David Reitter

领域和 AC：Kyle Gorman（语音和音系学）、Fei Liu（自然语言生成）

第三届多语言表征学习（MRL）研讨会

组织者：Omer Goldman、Sebastian Ruder

特邀演讲者：Orhan Firat

教程

创意自然语言生成

组织者：Tuhin Chakrabarty *

Google 研究展位活动

此时间表可能会有所变动。请访问 Google 展位以了解更多信息。

开发和利用机器翻译评估指标以及改进多语言 NLP

演讲者：Isaac Caswell、Dan Deutch、Jan-Thorsten Peter、David Vilar Torres周五，12 月 8 日 | 上午 10:30 -11:00（SST）

可微搜索索引和生成检索

演讲者：Sanket Vaibhav Mehta、Vinh Tran、Kai Hui、Ronak Pradeep * 12 月 8 日星期五 |下午 3:30 -4:00（夏令时）

一次性检索和生成

演讲者：Palak Jain、Livio Baldini Soares

星期六，12 月 9 日 | 上午 10:30 -11:00（SST）

扩大对抗性攻击

演讲者：Anu Sinha星期六，12 月 9 日 | 12:30PM -1:45PM SST

自动提示设计：通用自适应提示（参见博客文章）

演讲者：Xingchen Wan *、Ruoxi 周日

12 月 9 日星期六 | 下午 3:30 - 下午 4:00（SST）

Google 参加 EMNLP 2023

版权声明

相关推荐

评论