谷歌很荣幸成为年度顶级会议“自然语言处理经验方法” (EMNLP 2023)的钻石赞助商,该会议本周在新加坡圣淘沙举行。谷歌在本届会议上表现不俗,录用了 65 多篇论文,并积极参与了 11 场研讨会和辅导课。谷歌也很高兴成为“扩大自然语言处理” (WiNLP) 研讨会的主要赞助商,该研讨会旨在强调人工智能和机器学习领域中人员、观点和文化的全球代表性。我们期待分享我们广泛的自然语言处理研究成果,并扩大与更广泛研究社区的合作伙伴关系。
我们希望您能参观 Google 展位,与积极追求 NLP 最新创新的研究人员交流,并查看一些预定的展位活动(例如,下面列出的演示和问答环节)。访问 @GoogleAI X(Twitter)和LinkedIn帐户,了解有关 EMNLP 2023 上 Google 展位活动的更多信息。
请参阅下文,了解有关在 EMNLP 2023 上展示的 Google 研究的更多信息(Google 附属机构以粗体显示)。
董事会及组织委员会
赞助主席:Shyam Upadyay
行业分会主席:Imed Zitouni
高级项目委员会:Roee Aharoni、Annie Louis、Vinodkumar Prabhakaran、Shruti Rijhwani、Brian Roark、Partha Talukdar
已接受的论文
SynJax:JAX 的结构化概率分布
Miloš Stanojević , Laurent Sartran
适配器:用于参数高效和模块化迁移学习的统一库
Clifton Poth、Hannah Sterz、Indraneil Paul、Sukannya Purkayastha、Leon Engländer、Timo Imhof、Ivan Vulić、Sebastian Ruder、Iryna Gurevych、Jonas Pfeiffer
DocumentNet:弥合文档预训练中的数据差距
Lijun Yu,Jin Miao,Xiaoyu Sun,Jiayi Chen,Alexander Hauptmann,Hanjun Dai,Wei Wei
AART:人工智能辅助红队与法学硕士支持的新应用程序生成多种数据
Bhaktipriya Radharapu、Kevin Robinson、Lora Aroyo、Preethi Lahoti
CRoW:在现实世界任务中对常识推理进行基准测试
Mete Ismayilzada、Debjit Paul、Syrielle Montariol、Mor Geva、Antoine Bosselut
大语言模型可以自我完善
黄嘉欣* ,顾世祥,侯乐,吴跃新,王学智,于洪坤,韩家伟
剖析自回归语言模型中事实关联的回忆
Mor Geva、Jasmijn Bastings、Katja Filippova、Amir Globerson
停止以纯文本形式上传测试数据:减轻评估基准数据污染的实用策略
Alon Jacovi、Avi Caciularu、Omer Goldman、Yoav Goldberg
选择性标记:如何从根本上降低文档提取模型的数据标记成本
Yichao Zhou、James Bradley Wendt、Navneet Potti、Jing Xie、Sandeep Tata
自然语言生成模型中的归因测量
Hannah Rashkin、Vitaly Nikolaev、Matthew Lamm、Lora Aroyo、Michael Collins、Dipanjan Das、Slav Petrov、Gaurav Singh Tomar、Iulia Turc、David Reitter
逆向缩放可能会变成 U 形
Jason Wei * , Najoung Kim , Yi Tay * , Quoc Le
INSTRUCTSCORE:面向自动反馈的可解释文本生成评估
Wenda Xu、Danqing Wang、Liangming Pan、Zhenqiao Song、Markus Freitag、William Yang Wang、Lei Li
对话历史表示在会话问答中的稳健性:一项全面的研究和一种基于提示的新方法
Zorik Gekhman、Nadav Oved、Orgad Keller、Idan Szpektor、Roi Reichart
研究如何有效扩展 Transformer 以实现长输入摘要
Jason Phang *、Yao Zhao、Peter J Liu
DSI++:使用新文档更新 Transformer 内存
Sanket Vaibhav Mehta *、Jai Gupta、Yi Tay、Mostafa Dehghani、Vinh Q. Tran、Jinfeng Rao、Marc Najork、Emma Strubell、Donald Metzler
MultiTurnCleanup:多轮口语对话记录清理的基准
Hua Shen *、Vicky Zayats、Johann C Rocholl、Daniel David Walker、Dirk Padfield
q2d:将问题转化为对话来教模型如何搜索
Yonatan Bitton、Shlomi Cohen-Ganor、Ido Hakimi、Yoad Lewenberg、Roee Aharoni、Enav Weinreb
具身序列建模中抽象状态表示的出现
Tian Yun * , Zilai Zeng , Kunal Handa , Ashish V Thapliyal , Bo Pang , Ellie Pavlick , Chen Sun
跨语言问答归因评估与建模
Benjamin Muller *、John Wieting、Jonathan H. Clark、Tom Kwiatkowski、Sebastian Ruder、Livio Baldini Soares、Roee Aharoni、Jonathan Herzig、Xinyi Wang
多模态预训练中的视觉关系弱监督学习
Emanuele Bugliarello、Aida Nematzadeh、Lisa Anne Hendricks
语言如何相互影响?研究 LM 微调过程中的跨语言数据共享
Rochelle Choenni、Dan Garrette、Ekaterina Shutova
CompoundPiece:评估和提高语言模型的分解性能
Benjamin Minixhofer、Jonas Pfeiffer、Ivan Vulić
IC3:委员会共识的图像字幕
David Chan、Austin Myers、Sudheendra Vijayanarasimhan、David A Ross、John Canny
幻觉(不)可回答性的奇怪案例:在过度自信的大型语言模型的隐藏状态中寻找真相
Aviv Slobodkin、Omer Goldman、Avi Caciularu、Ido Dagan、Shauli Ravfogel
评估受控生成任务的大型语言模型
Jiao Sun , Yufei Tian , Wangchunshu Zhou , Nan Xu , qian Hu , Rahul Gupta , John Wieting , Nanyun Peng , Xuzhe Ma
关系很重要:使用成对准确度和关系校准对现代指标进行元评估
Daniel Deutsch、George Foster、Markus Freitag
通过额外 0.1% 的计算超越缩放定律
Yi Tay *、Jason Wei *、Hyung Won Chung *、Vinh Q. Tran、David R. So *、Siamak Shakeri、Xavier Garcia、Huaixiu Steven Zheng、Jinfeng Rao、Aakanksha Chowdhery、Denny Zhou、Donald Metzler、Slav Petrov、Neil Houlsby、Quoc V. Le、Mostafa Dehghani
数据相似性不足以解释语言模型性能
Gregory Yauney *、Emily Reif、David Mimno
语言模型预训练的自我影响引导数据重新加权
Megh Thakkar * , Tolga Bolukbasi , Sriram Ganapathy , Shikhar Vashishth , Sarath Chandar , Partha Talukdar
ReTAG:推理感知表到分析文本生成
Deepanway Ghosal、Preksha Nema、Aravindan Raghuveer
GATITOS:使用新的多语言词典进行低资源机器翻译
Alex Jones *、Isaac Caswell、Ishank Saxena
视频多模态机器翻译
李一航、清水修一郎、褚晨辉、黑桥定夫、李伟
符号调优改善语言模型中的情境学习
Jerry Wei * , Le Hou , Andrew Kyle Lampinen ,香宁陈* , Da Huang , Yi Tay * , Xinyun Chen , Yifeng Lu , Denny Zhou , Tengyu Ma * , Quoc V Le
“不要断章取义!”论文体重写中语境模型与评估的必要性
Akhila Yerukola , Xuhui Zhou , Elizabeth Clark , Maarten Sap
QAmeleon:仅 5 个示例的多语言 QA
Priyanka Agrawal、Chris Alberti、Fantine Huot、Joshua Maynez、Ji Ma、Sebastian Ruder、Kuzman Ganchev、Dipanjan Das、Mirella Lapata
说话、阅读和提示:具有最低限度监督的高保真文本转语音
Eugene Kharitonov、Damien Vincent、Zalán Borsos、Raphaël Marinier、Sertan Girgin、Olivier Pietquin、Matt Sharifi、Marco Tagliasacchi、Neil Zeghidour
AnyTOD:一种可编程的面向任务的对话系统
Jeffrey Zhao、Yuan Cao、Raghav Gupta、Harrison Lee、Abhinav Rastogi、Mingqiu Wang、Hagen Soltau、Izhak Shafran、Yonghui Wu
选择性回答模棱两可的问题
Jeremy R. Cole、Michael JQ Zhang、Daniel Gillick、Julian Martin Eisenschlos、Bhuwan Dhingra、Jacob Eisenstein
PRESTO:用于解析现实任务导向对话的多语言数据集(参见博客文章)
Rahul Goel、Waleed Ammar、Aditya Gupta、Siddharth Vashishtha、Motoki Sano、Faiz Surani *、Max Chang、HyunJeong Choe、David Greene、Chuan He、Rattima Nitisaroj , Anna Trukhina , Shachi Paul , Pararth Shah , Rushin Shah ,周瑜
LM vs LM:通过交叉询问检测事实错误
Roi Cohen、May Hamri、Mor Geva、Amir Globerson
一套用于多层次多模式网页理解的生成任务
Andrea Burns *、Krishna Srinivasan、Joshua Ainslie、Geoff Brown、Bryan A. Plummer、Kate Saenko、Jianmo Ni、Mandy Guo
AfriSenti:非洲语言的 Twitter 情绪分析基准
Shamsuddeen Hassan Muhammad、Idris Abdulmumin、Abinew Ali Ayele、Nedjma Ousidhoum、David Ifeoluwa Adelani、Seid Muhie Yimam、Ibrahim Said Ahmad、Meriem Beloucif、Saif M. Mohammad、Sebastian Ruder、Oumaima Hourrane、阿利皮奥·豪尔赫、帕维尔·巴西迪尔、费莱米诺·D.M . A. Ali , Davis David , Salomey Osei , Bello Shehu-Bello , Falalu Ibrahim Lawan , Tajuddeen Gwadabe , Samuel Rutunda , Tadesse Destaw Belay , Wendimu Baye Messell , Hailu Beshada Balcha , Sisay Adugna Chala , Hagos Tesfahun Gebrmichael , Bernard Opoku , Stephen Arthur
通过标记消除优化检索增强阅读器模型
Moshe Berchansky、Peter Izsak、Avi Caciularu、Ido Dagan、Moshe Wasserblat
SEAHORSE:用于总结评估的多语言、多方面数据集
Elizabeth Clark、Shruti Rijhwani、Sebastian Gehrmann、Joshua Maynez、Roee Aharoni、Vitaly Nikolaev、Thibault Sellam、Aditya Siddhant、Dipanjan Das、Ankur P Parikh
GQA:从多头检查点训练广义多查询 Transformer 模型
Joshua Ainslie、James Lee-Thorp、Michiel de Jong *、Yury Zemlyanskiy、Federico Lebron、Sumit Sanghai
CoLT5:具有条件计算的更快长距离 Transformer
Joshua Ainslie、Tao Lei、Michiel de Jong、Santiago Ontanon、Siddhartha Brahma、Yury Zemlyanskiy、David Uthus、Mandy Guo、James Lee-Thorp、Yi Tay、Yun-Hsuan Sung、Sumit Sanghai
通过集体批评和自我投票提高大型语言模型中人口统计代表性的多样性
Preethi Lahoti、Nicholas Blumm、Xiao Ma、Raghavendra Kotikalapudi、Sahitya Potluri、Qijun Tan、Hansa Srinivasan、Ben Packer、Ahmad Beirami、Alex Beutel、Jilin Chen
通用自适应提示(参见博客文章)
Xingchen Wan *、Ruoxi Sun、Hootan Nakhost、Hanjun Dai、Julian Martin Eisenschlos、Sercan O. Arik、Tomas Pfister
TrueTeacher:使用大型语言模型学习事实一致性评估
Zorik Gekhman、Jonathan Herzig、Roee Aharoni、Chen Elkind、Idan Szpektor
多模态电子健康记录分层预训练
王晓晨,罗俊宇,王佳琪,尹子怡,崔苏涵,钟源,王亚庆,马凤龙
NAIL:具有高效非自回归解码器的词汇检索索引
Livio Baldini Soares、Daniel Gillick、Jeremy R. Cole、Tom Kwiatkowski
生成检索如何扩展到数百万个段落?
Ronak Pradeep *、Kai Hui、Jai Gupta、Adam D. Lelkes、Honglei Zhuang、Jimmy Lin、Donald Metzler、Vinh Q. Tran
让每个例子都发挥作用:论自我影响力在嘈杂的 NLP 数据集中学习的稳定性和实用性
Irina Bejan *、Artem Sokolov、Katja Filippova
EMNLP 的发现
通过自我评估进行适应性学习以提高法学硕士 (LLM) 中的选择性预测
Jiefeng Chen *、Jinsung Yoon、Sayna Ebrahimi、Sercan O Arik、Tomas Pfister、Somesh Jha
工具辅助生成策略的综合评估
Alon Jacovi *、Avi Caciularu、Jonathan Herzig、Roee Aharoni、Bernd Bohnet、Mor Geva
1-PAGER:一次性答案生成和证据检索
Palak Jain、Livio Baldini Soares、Tom Kwiatkowski
MaXM:面向多语言视觉问答
Soravit Changpinyo、Linting Xue、Michal Yarom、Ashish V. Thapliyal、Idan Szpektor、Julien Amelot、Xi Chen、Radu Soricut
SDOH-NLI:从临床记录推断健康社会决定因素的数据集
Adam D. Lelkes、Eric Loreaux *、Tal Schuster、Ming-Jun Chen、Alvin Rajkomar
使用基于案例推理的机器阅读理解
Dung Ngoc Thai、Dhruv Agarwal、Mudit Chaudhary、Wenlong Zhao、Rajarshi Das、Jay-Yoon Lee、Hannah Hajishirzi、Manzil Zaheer、Andrew McCallum
非洲语言跨语言开放检索问答
Odunayo Ogundepo , Tajuddeen Gwadabe , Clara E. Rivera , Jonathan H. Clark , Sebastian Ruder , David Ifeoluwa Adelani , Bonaventure FP Dossou , Abdou Aziz DIOP , Claytone Sikasote , Gilles HACHEME , Happy Buzaaba , Ignatius Ezeani , Rooweither Mabuya , Salomey Osei , Chris Chininye Emezue , Albert Kahira , Shamsuddeen Hassan Muhammad , Akintunde Oladipo , Abraham Toluwase Owodunni , Atnafu Lambebo Tonja , Iyanuoluwa Shode , Akari Asai , Anuoluwapo Aremu , Ayodele Awokoya ,伯纳德·奥波库、恰马卡·伊杰奥马Chukwuneke、Christine Mwase、Clemencia Siro、Stephen Arthur、Tunde Oluwaseyi Ajayi、Verrah Akinyi Otiende、Andre Niyongabo Rubungo、Boyd Sinkala、Daniel Ajisafe、Emeka Felix Onwuegbuzia、Falalu Ibrahim Lawan、Ibrahim Said Ahmad、Jesujoba Oluwadara Alabi CH、伊内杜·伊曼纽尔·姆博努,莫费托鲁瓦Adeyemi、Mofya Phiri、Orevaoghene Ahia、Ruqayya Nasir Iro、Sonia Adhiambo
概率神经摘要中的不确定性校准和选择性生成:基准研究
Polina Zablotskaia、Du Phan、Joshua Maynez、Shashi Narayan、Jie Ren、Jeremiah Zhe Liu
Epsilon Sampling Rocks:研究机器翻译最小贝叶斯风险解码的采样策略
Markus Freitag、Behrooz Ghorbani *、Patrick Fernandes *
大型语言模型在推理任务中产生幻觉的来源
Nick McKenna、Tianyi Li、Liang Cheng、Mohammad Javad Hosseini、Mark Johnson、Mark Steedman
不要添加,不要错过:从预选文本跨度中有效保存生成内容
Aviv Slobodkin、Avi Caciularu、Eran Hirsch、Ido Dagan
是什么让思维链提示有效?一项反事实研究
Aman Madaan * , Katherine Hermann , Amir Yazdanbakhsh
使用大型语言模型理解 HTML
Izzeddin Gur、Ofir Nachum、Yingjie Miao、Mustafa Safdari、Austin Huang、Aakanksha Chowdhery、Sharan Narang、Noah Fiedel、Aleksandra Faust
通过检测和消除输入噪声来提高摘要模型的鲁棒性
Kundan Krishna *、Yao Zhao、Jie Ren、Balaji Lakshminarayanan、Jiaming Luo、Mohammad Saleh、Peter J. Liu
情境学习创建任务向量
Roee Hendel、Mor Geva、Amir Globerson
无需注意的预训练
Junxiong Wang、Jing Nathan Yan、Albert Gu、Alexander M Rush
MUX-PLM:高吞吐量语言模型的数据复用
Vishvak Murahari、Ameet Deshpande、Carlos E Jimenez、Izhak Shafran、Mingqiu Wang、Yuan Cao、Karthik R Narasimhan
PaRaDe:使用法学硕士演示进行文章排序
Andrew Drozdov *、Honglei Zhuang、Zhuyun Dai、Zhen Qin、Razieh Rahimi、Xuanhui Wang、Dana Alon、Mohit Iyyer、Andrew McCallum、Donald Metzler *、Kai Hui
在大型语言模型上通过有限状态解码约束进行分段实现长篇语音翻译
Arya D. McCarthy、Hao Zhang、Shankar Kumar、Felix Stahlberg、Ke Wu
使用近似测地线进行无监督意见总结
Somnath Basu Roy Chowdhury *、Nicholas Monath、Kumar Avinava Dubey、Amr Ahmed、Snigdha Chaturvedi
SQLPrompt:使用最少标记数据的上下文文本到 SQL
Ruoxi Sun、Sercan O. Arik、Rajarishi Sinha、Hootan Nakhost、Hanjun Dai、Pengcheng Yin、Tomas Pfister
利用结构和不确定性对复杂图进行检索增强解析
Zi Lin , Quan Yuan , Panupong Pasupat , Jeremiah Zhe Liu , Jingbo Shang
具有结构化反射的计算机控制零样本语言代理
Tao Li、Gang Li、Zhiwei Deng、Bryan Wang *、Yang Li
语言基础中的语用学:现象、任务和建模方法
Daniel Fried、Nicholas Tomlin、Jennifer Hu、Roma Patel、Aida Nematzadeh
通过主动生成成对反事实来提高分类器稳健性
Ananth Balashankar、Xuezhi Wang、Yao Qin、Ben Packer、Nithum Thain、Jilin Chen、Ed H. Chi、Alex Beutel
mmT5:模块化多语言预训练解决源语言幻觉
Jonas Pfeiffer、Francesco Piccinno、Massimo Nicosia、Xinyi Wang、Machel Reid、Sebastian Ruder
缩放定律与模型架构:归纳偏差如何影响缩放?
Yi Tay、Mostafa Dehghani、Samira Abnar、Hyung Won Chung、William Fedus、Jinfeng Rao、Sharan Narang、Vinh Q. Tran、Dani Yogatama、Donald Metzler
TaTA:针对非洲语言的多语言表格到文本数据集
Sebastian Gehrmann、Sebastian Ruder、Vitaly Nikolaev、Jan A. Botha、Michael Chavinda、Ankur P Parikh、Clara E. Rivera
XTREME-UP:面向代表性不足语言的用户中心稀缺数据基准
Sebastian Ruder、 Jonathan H. Clark、Alexander Gutkin、Mihir Kale、Min Ma、Massimo Nicosia、Shruti Rijhwani、Parker Riley、Jean Michel Amath Sarr、Xinyi Wang、John Frederick Wieting、Nitish Gupta、Anna Katanova、Christo Kirov、Dana L Dickinson、Brian Roark、Bidisha Samanta、Connie Tao、David Ifeoluwa Adelani、Vera Axelrod、Isaac Rayburn Caswell、Colin Cherry、Dan Garrette、Reeve Ingle、Melvin Johnson、Dmitry Panteleev、Partha Talukdar
基于任务个性化多模态少样本学习的视觉丰富文档实体检索
陈嘉懿* ,戴涵俊,戴波,张爱东,魏炜*
工作坊
第七届拓展 NLP 研讨会(WiNLP)
主要赞助商
组织者:Sunipa Dev
小组成员:Preethi Lahoti
第六届指称、首指和共指计算模型研讨会(CRAC)
特邀演讲者:Bernd Bohnet
第三届自然语言处理开源软件(NLP-OSS)研讨会
组织者:Geeticka Chauhan
机器人空间语言理解与基础交流联合研讨会(SpLU-RoboNLP)
特邀演讲嘉宾:Andy Zeng
自然语言生成、评估和度量(GEM)
组织者:Elizabeth Clark
第一届阿拉伯语自然语言处理会议(ArabicNLP)
组织者:Imed Zitouni
大图景:制作研究叙述(BigPicture)
组织者:Nora Kassner、Sebastian Ruder
BlackboxNLP 2023:第六届 NLP 神经网络分析与解释研讨会
组织者:Najoung Kim
小组成员:Neel Nanda
SIGNLL 计算自然语言学习会议(CoNLL)
联合主席:David Reitter
领域和 AC:Kyle Gorman(语音和音系学)、Fei Liu(自然语言生成)
第三届多语言表征学习(MRL)研讨会
组织者:Omer Goldman、Sebastian Ruder
特邀演讲者:Orhan Firat
教程
创意自然语言生成
组织者:Tuhin Chakrabarty *
Google 研究展位活动
此时间表可能会有所变动。请访问 Google 展位以了解更多信息。
开发和利用机器翻译评估指标以及改进多语言 NLP
演讲者:Isaac Caswell、Dan Deutch、Jan-Thorsten Peter、David Vilar Torres周五,12 月 8 日 | 上午 10:30 -11:00(SST)
可微搜索索引和生成检索
演讲者:Sanket Vaibhav Mehta、Vinh Tran、Kai Hui、Ronak Pradeep * 12 月 8 日星期五 |下午 3:30 -4:00(夏令时)
一次性检索和生成
演讲者:Palak Jain、Livio Baldini Soares
星期六,12 月 9 日 | 上午 10:30 -11:00(SST)
扩大对抗性攻击
演讲者:Anu Sinha星期六,12 月 9 日 | 12:30PM -1:45PM SST
自动提示设计:通用自适应提示(参见博客文章)
演讲者:Xingchen Wan *、Ruoxi 周日
12 月 9 日星期六 | 下午 3:30 - 下午 4:00(SST)
评论