ACM SIGIR 2022 | 美团技术团队精选论文解读

网友投稿 658 2022-11-28

ACM SIGIR 2022 | 美团技术团队精选论文解读

总第524篇

2022年 第041篇

SIGIR是信息检索方向的国际顶级会议(CCF-A类)。第 45 届国际信息检索大会(The 45th International ACM SIGIR Conference on Research and Development in Information Retrieval,SIGIR 2022)已于上周(2022年7月11日-15日)在西班牙马德里举行,同时也支持线上参会。本次会议共收到 794 篇长文投稿,其中 161 篇长文被录用,录用率约 20%;共收到 667 篇短文投稿,其中 165 篇短文被录用,录用率约 24.7%。

论文01:Personalized Abstractive Opinion Tagging

|下载地址:​​Paper)

| 论文作者:赵梦雪(美团),杨扬(美团),李淼(美团),王金刚(美团),武威(美团),任鹏杰(山东大学),Maarten de Rijke(阿姆斯特丹大学),任昭春(山东大学)

| 论文简介:观点标签是一组总结用户对产品或服务感受的短文本序列,通常由针对产品特定方面的一组短句组成。相较于推荐理由、方面标签、产品关键词等自然语言文本,观点标签能兼顾信息的完整性和关键信息的顺序性问题。关键词描述了该商户的基本信息,推荐理由可看作该商户下真实用户评论的高度浓缩,而观点标签“肉质很新鲜”则更完整地表达了当前用户对于该商户的“食材新鲜”方面的关键信息。

论文02:Graph Adaptive Semantic Transfer for Cross-domain Sentiment Classification

| 下载地址:​​Paper)

| 论文作者:张凯(美团),刘淇(中国科学技术大学),黄振亚(中国科学技术大学),张梦迪(美团),张琨(合肥工业大学),程明月(中国科学技术大学大学),武威(美团),陈恩红(中国科学技术大学)

| 论文简介:跨域情感分类(CDSC)旨在使用从源域中学习到的可迁移语义信息来预测未标记目标域中评论的情感极性。目前针对该任务的研究更多地关注句子层面的序列建模,很大程度上忽略了嵌入在图结构中的丰富的域不变语义信息(即词性标签和依赖关系)。作为探索与理解语言理解特征的一个重要方面,自适应图表示学习近年来发挥了至关重要的作用,尤其是在许多基于图表征模型的传统NLP任务中。例如在细粒度的情感分析(ABSA)任务中,利用图结构中的句法信息来增强Aspect的语义表示已经成为SOTA模型的基本配置。

在本论文中,我们旨在探索从CDSC中的类图结构中学习不变语义特征的可能性。我们提出了图自适应语义迁移(Graph Adaptive Semantic Transfer, GAST)模型,这是一种自适应句法图嵌入表征方法,能够从单词序列和句法图中学习域不变语义。具体地说,我们首先设计了一个POS-Transformer模块来从单词序列以及词性标签中提取序列化的语义特征;然后,我们设计了一个混合图注意(Hybrid-GAT)模块,通过考虑可迁移、域共享的图依赖关系来生成基于句法的通用语义特征;最后,我们设计了一个集成的自适应优化策略(Integrated aDaptive Strategy, IDS)来指导两个模块的联合学习过程。在四个公共数据集上进行的广泛实验证明,GAST的有效性优于一系列最先进的模型。

论文03:ADPL: Adversarial Prompt-based Domain Adaptation for Dialogue Summarization with Knowledge Disentanglement

| 下载地址:​​Paper)

| 论文作者:赵璐璐(北京邮电大学),郑馥嘉(北京邮电大学),曾伟豪(北京邮电大学),何可清(美团),耿若彤(北京邮电大学),江会星(美团),武威(美团),徐蔚然(北京邮电大学)

| 论文简介:领域自适应是机器学习中的一个基本任务。在本文中,我们研究对话摘要任务中的领域迁移问题,试图借助源域的有标注数据迁移到无标注或少标注的目标域,进而提升低资源目标域下对话摘要的生成效果,可用于解决实际场景中小业务数据匮乏的挑战。传统的对话摘要领域迁移方法往往依赖于大规模领域语料,借助于预训练来学习领域间知识。该方法的缺点是实际语料收集难,对算力要求高,针对每一个目标域都需要进行耗时的预训练过程,效率低。

本文从微调的角度出发,提出了一种轻量级的解耦知识迁移方法ADPL,无需大规模的预训练过程,仅仅利用源域数据和少量的无标注目标域数据,即可实现高质量的对话摘要生成。具体来说,我们基于Prompt Learning的思想,针对对话摘要任务中的领域迁移问题,提出了三种特定的prompt结构:Domain-Invariant Prompt (DIP)、Domain-Specific Prompt (DSP)和Task-Oriented Prompt (TOP),其中DIP用来捕获领域间的共享特征,DSP用来建模领域特有知识,TOP用来促进生成流畅的摘要。在训练中,我们仅仅更新这些Prompt相关的参数就可以实现领域间知识的解耦和迁移,相比较之前的预训练方法,训练高效环保,对机器的显存要求显著降低。同时,我们基于两个大规模的对话摘要数据集QMSum和TODSum构建了对话摘要领域迁移评测集,在两个评测集上取得了一致的最优效果,实验结果和消融分析都证明了本文提出方法的有效性。

论文04:Structure-Aware Semantic-Aligned Network for Universal Cross-Domain Retrieval

| 下载地址:​​Paper)

| 论文作者:田加林(美团), 徐行(电子科技大学),王凯(电子科技大学),曹佐(美团),蔡勋梁(美团),申恒涛(电子科技大学)

| 论文简介:跨域检索(Cross-Domain Retrieval,CDR)旨在实现基于内容的多域图像表征对齐和检索;当域间差异过大时,也称之为跨模态检索。传统的CDR方法只考虑训练和测试数据来源于相同的域和相同类。然而,实际应用场景中测试样本常来自于未见类,或者未见域,又或者两者皆是。卷积神经网络已经成为CDR任务主流,然而,由于卷积操作的内在局部性,CNN在对物体的全局结构信息进行建模时受到明显的制约。

基于上述问题,我们提出通用跨域检索(Universal Cross-Domain Retrieval, UCDR),其测试数据可以来源于未见类、未见域或者两者结合,方法中我们使用基于Vision Transformer(ViT)的结构感知语义对齐网络,利用ViT的能力来建模物体的全局结构信息。具体而言,我们将自监督预训练的ViT模型和微调模型整合到一个框架下,通过对齐软标签防止微调模型遗忘全局结构信息,提升微调模型泛化性;通过可学习的类原型在超球空间对齐多域表征,提升微调模型的判别性。实验结果表明,我们的方法在跨域检索任务上远超现有算法,成功实现跨域表征对齐和模型泛化性。

论文05:Multimodal Disentanglement Variational Autoencoders for Zero-Shot Cross-Modal Retrieval

| 下载地址:​​Paper)

| 论文作者:田加林(美团),王凯(电子科技大学),徐行(电子科技大学),曹佐(美团),沈复民(电子科技大学),申恒涛(电子科技大学)

| 论文简介:测试集由未见类组成是零样本跨模态检索(Zero-Shot Cross-Modal Retrieval,ZS-CMR)关注的一个实际的检索场景。现有方法通常采用生成模型作为主要框架,学习联合潜在嵌入空间表征以缓解模态差异。一般来说,这些方法主要依靠额外的语义嵌入实现跨类的知识迁移,并且不自觉地忽略了生成模型中数据重建方式的影响。

基于上述问题,我们提出一个称为多模态解耦变分自编码器(MDVAE)的ZS-CMR模型,它由两个特定于模态的解耦变分自编码器(DVAE)和一个融合交换自动编码器(FVAE)组成。具体来说,DVAE把每种模态的原始表征分解为模态不变特征和特定于模态的特征。FVAE通过重构和对齐过程来融合和交换多模态数据的信息,而无需额外的语义嵌入。此外,我们还提出了一个新颖的反直觉交叉重构方案,以提高模态不变量特征的信息量和通用性,从而实现更有效的知识迁移。提出的方法在图像-文本和图像-草图检索任务中取得明显性能提升,建立了新的SOTA结果。

论文06:Co-clustering Interactions via Attentive Hypergraph Neural Network

| 下载地址:​​Paper)

| 论文作者:杨天持(北京邮电大学),杨成(北京邮电大学),张路浩(美团),石川(北京邮电大学),胡懋地(美团),刘怀军(美团),李滔(美团),王栋(美团)

在本文中,针对这一问题,我们提出通过注意力超图神经网络对交互进行协同聚类(CIAH)。具体来说,在通过超图对交互进行更全面的建模(包括用户属性、商家属性、菜品属性、时空属性等)后,我们提出一个注意力超图神经网络来编码完整交互,其中使用注意机制来选择重要的属性以作为聚类结果的解释。然后,我们引入了一种显著性方法来指导注意力机制的学习,以使其与属性的真实重要性更加一致,称为基于显著性的一致性。此外,我们还提出了一种新颖的协同聚类方法来对交互的表示和相应的属性选择分布进行协同聚类,称为基于聚类的一致性。实验表明CIAH在公开数据集和美团数据集上均显著优于最先进的聚类方法。

论文07:DisenCTR: Dynamic Graph-based Disentangled Representation for Click-Through Rate Prediction

| 下载地址:​​Paper)

| 论文作者:王一帆(北京大学),覃义方(美团),孙昉(美团),张博(美团),侯旭阳(美团),胡可(美团),程佳(美团),雷军(美团),张铭(北京大学)

论文08:Hybrid CNN Based Attention with Category Prior for User Image Behavior Modeling

| 下载地址:​​Paper)

| 论文作者:陈鑫(美团),唐庆涛(美团),胡可(美团),徐越(美团),邱世航(香港科技大学),程佳(美团),雷军(美团)

为此,在本文中我们设计了一种Fixed-CNN和Trainable-CNN混合的Hybrid CNN结构(HCCM),来建模用户图像行为序列。文章主要贡献:1)通过ImageNet预训练的参数初始化浅层CNN,固定浅层CNN参数的同时将深层CNN与CTR模型联合训练。2)设计了将候选图片和用户对图片的偏好相结合的图片语意Attention机制,为提升CNN在推荐广告CTR任务上的特征提取能力,HCCM将图片和图片的类别先验在Feature Map维度通过Channel Attention的方式提取类目体系相关特征。相关技术方案在到店推荐广告的所有场景(包括首页信息流推荐、商户详情页推荐和团单详情页推荐等)均取得了显著效果。

论文09:Dialogue Topic Segmentation via Parallel Extraction Network with Neighbor Smoothing

| 下载地址:​​Paper)

| 论文作者:夏今雄(美团),刘操(美团),陈见耸(美团),李宇琛(美团),杨帆(美团),蔡勋梁(美团),万广鲁(美团),王厚峰(北京大学)

| 论文简介:对话主题分割需要将对话分割成具有预定义主题的片段。现有的主题切分研究采用两阶段范式,包括文本切分和片段标注。然而,这些方法在分割时往往侧重于局部上下文,并且没有很好地捕捉到片段间的依赖关系。此外,对话段边界的模糊性和标签噪声对现有模型提出了进一步的挑战。

为此,我们提出了基于邻域平滑的并行抽取网络 (PEN-NS) 来解决上述问题。具体来说,我们提出了并行抽取网络来执行片段提取,优化片段的二分匹配代价以捕获片段间的依赖关系。此外,我们还提出了邻域平滑来处理数据噪声和边界模糊。在基于对话和基于文档的主题分割数据集上的实验表明,PEN-NS的性能显著优于现有的模型。

论文10:Deep Page-Level Interest Network in Reinforcement Learning for Ads Allocation

| 下载地址:​​Paper)

| 论文作者:廖国钢(美团),石晓文(美团),王泽(美团),吴晓旭(美团),张楚珩(美团实习生),王永康(美团),王兴星(美团),王栋(美团)

针对以上挑战,本文设计了基于强化学习框架的页面级深度兴趣网络框架(DPIN),利用用户的列表粒度行为信息,刻画列表广告与广告、广告与自然结果的竞争关系和相互影响,建模用户在浏览页面时复杂的决策行为模式。具体包括四方面:

本文的技术方案在美团外卖场景取得了显著效果,并完成线上大规模落地。此论文为WWW 2022论文《​​Cross DQN: Cross Deep Q Network for Ads Allocation in Feed​​》的后续工作。

写在后面

----------  END  ----------

美团科研合作​

美团科研合作致力于搭建美团技术团队与高校、科研机构、智库的合作桥梁和平台,依托美团丰富的业务场景、数据资源和真实的产业问题,开放创新,汇聚向上的力量,围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等领域,共同探索前沿科技和产业焦点宏观问题,促进产学研合作交流和成果转化,推动优秀人才培养。面向未来,我们期待能与更多高校和科研院所的老师和同学们进行合作。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:车载导航中人机语音交互系统的设计与实现
下一篇:Kettle基础及快速入门
相关文章

 发表评论

暂时没有评论,来抢沙发吧~