百度大脑国际顶会再绽锋芒,10篇论文强势入选
KDD2020 近日,数据挖掘顶级会议KDD 2020发布论文接收结果,其中Research Track共1279篇论文参与投稿,仅216篇论文入选,接收率约为16.9%; Applied Data Science track共756篇论文投稿,仅121篇论文入选,接收率约为16.0%。百度AI凭借领先的行业技术实力,成功入选论文10篇,成为全球科技企业中入选论文数量最多的公司之一,彰显了百度AI行业领军者的领先地位。 ACM SIGKDD国际数据挖掘与知识发现大会(简称 KDD),由 ACM 于1995年创办,是世界数据挖掘领域的顶级学术会议,有数据挖掘领域“世界杯”之称,是目前AI领域影响力最广、规模最大的国际顶级会议之一。 虽然这次KDD 大会入选论文竞争激烈,百度AI在KDD 2020上依然斩获佳绩,成功入选的论文涵盖智能交通、智能推荐、图神经网络、知识图谱、人机交互、科学防疫等领域,全面展现百度AI深厚的技术底蕴与持续的创新实力。 以下为百度KDD 2020 十篇入选论文的亮点集锦: 论文1:Understanding the Impact of the COVID-19 Pandemic on Transportation-related Behaviors with Human Mobility Data 关键词:COVID-19,公众出行方式,流行病控制,大数据助力科学防疫 中国对新冠疫情(COVID-19)的成功遏制为有效抗击高度传染性病毒树立了典范。新冠疫情在中国的短时间传播和亚指数级增长,证明所采取的多项防疫措施,例如病例隔离、旅行限制、关闭娱乐场所、禁止大规模聚集等防疫措施都取得了极其显著的效果。这些防疫措施在有效遏制新冠病毒传播的同时,也有可能带来公众出行模式的变化。 为更好了解新冠疫情对公众出行模式的影响,并据此为政府、机构以及个人提供更具针对性的防疫建议,百度地图基于海量出行数据研究了新冠疫情期间公众在交通行为方面的变化。具体地,百度从公众的出行方式、出行目的地类型、到达时间、出行距离以及“出发地-出行方式-目的地”等5个不同的角度对新冠疫情期间的公众交通行为大数据进行了详细分析,并基于统计结果给出了相应的数据解读和防疫建议。鉴于新冠疫情仍在200多个海外国家与地区蔓延并导致全球数百万人受到感染,论文提供的数据解读和防疫建议有可能为抗击新冠疫情提供点滴之力。本文已被Health Day @KDD 2020 - AI for COVID所录用。 论文2:Personalized Prefix Embedding for POI Auto-Completion in the Search Engine of Baidu Maps 关键词:前缀联想式地理位置检索,POI自动补全,POI富内容编码,语义神经网络 Point of Interest Auto-Completion(简称POI-AC),即前缀联想式地理位置检索,是地图POI搜索引擎中必不可少的功能。当用户在搜索框中键入每个字符时,POI-AC模块会自动根据用户输入的前缀动态地给出一系列POI建议。该功能有助于大幅减少用户搜索时的输入量,在屏幕小且输入较为费力的移动设备上尤其有用。目前的POI-AC模块主要采用宽泛的特征工程并结合Learning to Rank模型进行推荐结果计算。然而,基于宽泛特征和搜索历史很难直接对用户输入习惯进行建模,因此在输入前缀较少的情况下往往无法将用户想要的POI推荐至首位。 为解决上述问题,百度提出一种基于神经网络的端到端POI-AC框架,它已成功部署在百度地图的POI搜索引擎中。为建立用户画像、个人输入习惯以及对应被点击的POI之间的联系,专门设计了包含三个核心组件的POI-AC框架(简称P3AC,如上图所示)。百度团队使用百度地图的大规模真实搜索日志来评估P3AC的算法效果,并通过部署上线后的用户满意度指标对模型的实际产品效果进行了验证。实验结果表明,新方法在算法效果与用户满意度上均取得了显著提升。 论文3:ConSTGAT: Contextual Spatial-Temporal Graph Attention Network for Travel Time Estimation at Baidu Maps 关键词:ETA,通行时间预估,路线耗时预估,时空图网络 路线耗时预估任务旨在为给定的路线和出发时间估算出对应的通行时间。路线耗时预估任务在智能交通系统(例如导航、路线规划、网约叫车服务等)有着至关重要的作用。该任务面临诸多挑战,尤其是路况预测和道路链接信息。首先,路况预测的准确率和路段的历史路况强相关。现有的工作主要使用时空图神经网络改善路况预测的准确率。然而,这些工作将时间信息和空间信息独立对待,很少考虑时间和空间的关联性。其次,路线的道路链接信息(例如是否拐弯等)也会对用户的驾驶速度带来较大影响。之前的工作主要使用序列化结构去建模路线的道路链接信息。然而,序列化建模方式很难适用于大规模真实服务。 为更有效地解决路况预测和道路链接信息建模问题,百度提出了一个端到端的神经网络框架ConSTGAT。百度研究团队还提出了一个新颖的时空图神经网络,并专门设计了一种能够捕捉时间信息和空间信息之间协同关系的特殊注意力机制。此外,为更高效地利用道路链接信息,设计了一种高效计算模型,该模型基于路线的局部窗口以及卷积结构捕捉道路链接信息,并使用多任务学习同时利用路线和路段信息进行计算。基于上述模型设计,可提前并行预估每个路段的通行时长。在大规模真实数据集上的实验结果表明ConSTGAT的效果显著超过多个强健的基线模型。此外,ConSTGAT已成功部署于百度地图中,为每天数百亿的路线耗时请求提供了稳定的预估服务,这表明ConSTGAT是一个具有高可用性的路线耗时预估工业级解决方案。 论文4:Combo-Attention Network for Baidu Video Advertising 关键字:跨模态,短视频,搜索广告 视频广告可以迅速捕捉用户的注意力,相对于传统静态广告,视频广告可以为用户留下更深刻的印象。因此广告主会投入更多的资源去制作视频创意来拉进和用户之间的距离。百度作为最大的中文搜索引擎公司,每天都会收到数十亿的搜索请求。 (编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |