AK WIFI 1
2018腾讯广告算法大赛决赛结果出炉腾讯社交广告将持续探索前沿科技
2018腾讯广告算法大赛决赛结果出炉腾讯社交广告将持续探索前沿科技

时间: 2024-01-06 03:44:05 |   作者: 开云体育app官方网站

大赛决赛结果出炉:来自吉林大学、哈工大和北邮同学组建的“葛”队夺得大赛冠军,赢得30万...

产品详细

  大赛决赛结果出炉:来自吉林大学、哈工大和北邮同学组建的“葛”队夺得大赛冠军,赢得30万元奖金!这次大赛赛题是Lookalike技术,目的是帮助广告主触达最大化相似人群量级,从而高效促进营销目标转化。主办方介绍,本届参赛选手73%是学生团队,C9院校参赛人数都超过了一百,竞争非常激烈。

  Lookalike,相似人群拓展的利器技术,现在被腾讯广告大赛玩出新水平。

  7月30日,第二届腾讯广告算法大赛决赛举办,十支队伍从超过2万名选手中杀出重围,进入决赛现场。

  决赛队伍经过高手过招、现场答辩之后,最终诞生出今年的冠军“葛”队,获得30万奖金等奖励。

  除了冠军选手外,腾讯公司副总裁、技术管理委员会主任王巨宏表示,本届大赛参赛选手73%是学生团队,C9院校都参加了算法大赛。

  参赛选手云集的一个重要原因是腾讯海量资源开放。腾讯社交广告总经理罗征透露,这次大赛目的是提供一个平台,让学生群体可以去体验腾讯做的算法应用,去感受工业界要解决哪一些问题,同时也会为用户和用户带来更多价值,把全链条的技术到应用展示给大家。

  本次获得冠军的“葛”队,三名成员分别来自吉林大学、北京邮电大学和哈尔滨工业大学,并在初赛阶段获得第一名。

  “葛”队成员告诉新智元,他们三人在组队后,看了无数论文,并且有至少20天是每晚至少一人通宵盯数据,最后终于以初赛第一的成绩进入复赛。

  稳住之后,“葛”把之前做过的一些模型,再通过一些精细化的处理,把第一保持到了最后。

  增强树模型。核心是特征工程,特征工程分为六大块,包括基础特征编码、单特征转化率、双交叉转化率、三交叉转化率、多值变长特征降维、ID特征的(lda, nmf, svd) embedding向量。其中用户特征与广告特征的交叉转换率的特征重要性最高。在转化率的统计上面采用5折交叉统计配合贝叶斯平滑的方案。

  神经网络ctr模型。核心是利用网络结构来代替手工特征交叉, 为此“葛”以一个DNN神经网络为基础,融合了代表二阶交叉的FM部分、FFM部分、无限交叉的mvm部分、基于游走的图embedding等结构,形成了一个复杂网络。并且在此基础上加了注意力模型,取得了很好的效果。

  第二、三名分别是“三只小蜜蜂”、“SML_21”战队,将10万元及5万元奖励收入囊中。“神魔咧”、“just-fighting”团队则抱走了另外两座“人气战队奖”。

  腾讯社交广告总经理罗征表示,早期学计算机算法,课本上的数据是“模拟的”数据,即所谓做算法多是涉及证明。现在做算法在课本上的技巧能应用大量的数据集,但是也存在与工业界应用的距离。

  因此腾讯举办广告算法大赛的目的是提供一个平台,让学生群体都可以去体验腾讯如何做算法应用,感受工业界要解决哪些问题。

  罗征透露,这次大赛目的是利用脱敏数据,将全链条技术到应用展示给大家。

  腾讯社交广告基于成熟的算法技术能力,运用Lookalike技术,能在保证精准的前提下,帮助广告主触达最大化相似人群量级,让品牌找到更多“对的人”,从而高效促进营销目标转化。

  罗征说,Lookalike在广告主应用中十分普遍,并且对他们的效果影响非常大。今年将Lookalike作为赛题,除了有趣、好玩外,一个重要的原则是算法对广告主有很大的影响力。

  AI技术在全链条的应用,Lookalike只是其中一块。算法的应用还能体现在优化人力配置上,比如广告效果优化和广告审核这类目前投入非常多人力的地方,机器出错率比人类要低。

  腾讯CDG人力资源中心负责人、腾讯集团组织发展部总经理艾兰表示,算法不仅有商业经济价值,还有包括公益在内更多应用价值。

  腾讯公司副总裁、技术管理委员会主任王巨宏认为,算法决定了前台许多东西,这样的比赛让大家看到华丽的外表其实是由算法决定,算法带来的不仅有商业经济价值,还有非常多其他价值。互联网巨头的一个重要优势就是广告,将来谁能在广告上做的好,就是要看算法。腾讯在产学研合作中有两块:一是做学术基础研究,腾讯也希望有同学在这条路上深耕;二是对想做产业的同学来说,腾讯欢迎各位一起,让更多的人体会到产品的价值。

  王巨宏还透露了一组数字:参赛的73%是学生团队,今年C9院校参与人数均超过100。王巨宏也欢迎参赛的学生参与到产业界中来,成为腾讯同事或者合作伙伴。

  “未来,希望能够通过腾讯链接的服务,让更多的人体会到产品的价值,让大众享受到广告带来的快乐和幸福。”

  互联网广告是大规模AI技术应用最重要的场景之一,不论谷歌、Facebook还是BAT,都在广告业务中投入了大量的研究资源和人力,因为广告场景的很多技术创新都能直接转换为商业收入。

  腾讯社交广告在Lookalike等大规模推荐技术方面,进行了多年积累与探索,结合产品、运营推广,共同驱动社交广告业务高速增长。

  腾讯社交广告专家架构师李长城介绍,TSA的推荐引擎采用了业界主流的向量检索方法(YouTube 2016年发表)。虽然在电商等结构化场景,有一些新的方案提出并取得了不错的效果,在社交广告这种非结构化场景,结合对向量检索中具体问题的优化,该方案仍然获得最好的效果。

  向量检索主要由两部分所组成:一是向量内积DNN,通过DNN学习用户/广告 embedding向量,两者的内积表示感兴趣程度;二是近似最近邻(ANN)检索,通过ANN算法大幅度缩短检索时间,召回近似top N感兴趣候选。向量检索能够以较低的性能开销获得近似全库遍历的检索效果。实际应用中,也存在很多问题是需要优化改进。

  李长城介绍了腾讯社交广告在推荐优化中的几项工作,包括ANN算法选取及细节改进(HNSW优化聚类分层及邻居计算),ANN通过数学变换支持内积度量,建模先验概率提升效果(内积不是距离度量,近邻检索算法不能直接用,通常会归一化为cos,导致了相应的效果损失),以及共用lookup embedding建立双塔间的潜在特征关联,缓解向量内积DNN不能直接用user-ad组合特征的问题。

  除了模型算法,李长城也概述了TSA在NLP基础技术、大规模机器学习平台,超大规模稀疏DNN训练等方面的建设与创新。

  腾讯社交广告是国内流量最大、场景最丰富、覆盖人群最为广泛的互联网广告平台。在超大规模数据的支撑下,多种主流AI技术协同优化,共同驱动广告业务快速地发展,以及业界前沿技术的应用与创新。

  传统的广告判断是以天为单位来做判断,也可以勉强做到小时级,但是终究比实时上效果要差。

  在注意力经济下,用户的广告判断对实时判断的要求慢慢的升高,需要在用户点进来的时候就判断哪一条广告适合用户看,人类操作无法适应这种实时性要求。罗征说,目前腾讯的微信、QQ、新闻等产品广告中,已经实现了实时判断,用户访问到腾讯的产品时就会实时推荐。

  算法慢慢的变多的改变广告的推荐形式和目标。华扬联众数字实验室总工程师张炎也在决赛演讲中介绍了应用数据模型和关联分析如何连接用户、媒体和广告。

  张炎说,华扬联众采用Scoring 算法,将用户分类,为计算广告做人群精准定位,并且用实时决策引擎提供数学模型。

  以汽车公司SUV营销为例,前期通过选择广告投放媒体,媒体准备网页内容,UT部署脚本监控用户流量,Centrixlink使用账户信息在设备上提供初始标签。后期持续发掘最优的广告位置和用户特征,利用Lookalike对用户进行评分,找到类似人群,实现精准投放。

  另外,AI在广告审核中也发挥及其重要的作用。比如广告创意中的素材有版权归属问题,A广告不能拿了B广告的创意进行抄袭,这样的一种情况下,机器学习做自动化搜索配对,就能够识别广告抄袭行为,保护原创版权。

  AI虽然能给企业特别是传统公司能够带来效率提升,但AI建模是一项技术门槛高,只有少数人掌握的技能。腾讯云AI基础产品中心产品经理郭律表示,优质的机器学习平台可以帮助企业降低获得AI能力的门槛,提高建模效率。并以腾讯智能钛机器学习生态服务平台(TI-ML)为例进行了深度解读。

  TI-ML是基于腾讯云强大计算能力的一站式机器学习生态服务平台,能够对各种数据源、组件、算法、模型和评估模块进行组合,使得算法工程师和数据科学家在其之上能够方便地进行模型训练、评估和预测。

  智能钛机器学习具有可视化操作界面的 TI-ONE 和具有命令行操作界面的 TI-Accelerator(TI-A),能够很好的满足用户不同的使用习惯。在部署方面,除公有云方式外,TI 也支持私有化部署。

  泛化智能CEO&创始人王汉阳在决赛现场展示了利用计算机视觉来发现华北豹的案例。

  华北豹是唯一一种只生活在中国的大型猫科动物。2005年,北京门头沟最后一次出现华北豹的身影,现在北京已经没有适合华北豹的生活环境了。

  红外相机常用来发现华北豹等物种,它的红外探头通过温度来感应动物,但问题就在于受外界气温变化影响,不能精准拍摄目标野生动物,会拍很多没有用的照片。

  泛化智能通过利用计算机视觉来识别动物,把之前动物保护组织猫盟一周的时间缩短到1小时,能达到98%的准确率。目前,猫盟在华北发现超过29只华北豹。

  至此,2018腾讯广告算法大赛正式落下帷幕,腾讯社交广告将持续探索前沿科技,不断触摸算法科技的未来,期待明年的算法大赛。

  文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

  投入,而这恰恰是SEM的最大优势。如果微信推出移动搜索,有一定的概率会成为百度在移动端最大的搜索竞

  Wide and deep 模型的相关知识和搭建方法,还能了解到模型优化和评估的方式。我还为你准备了

  自然语言处理技术的功劳。可以说,只要有大量文本数据的应用场景,几乎都涉及到NLP技术,也都能够正常的使用相关自然语言处理产品的接口来做智能分析。比如:

  反欺诈大数据实验室。三方利用大数据与深度学习技术,充分的发挥各方优势,构建业界领先的稽核模型,致力于发现、甄别

  用语,遭深圳市南山市场监督管理局行政处罚20万元,决定书文号:深市监南罚字〔2020〕粤海211号。 天眼查App显示,深圳市

  计算机系统有限公司遭深圳市南山市场监督管理局行政处罚20万元,原因是该公司涉嫌发布虚假

  出品的年度特刊《三观》中撰写了前言,谈到了马化腾在2020年的个人思考。

  。整个榜单中,拼多多占比最高,达90%。BAT三家中,百度最高,占比71%,阿里和

  视频抽帧的全流程GPU加速 /

  能力和复杂语境下的逻辑推理能力;而且在时效性上比较强。 目前混元大语言模型已经在小程序、



上一篇:国产厂商如何破局 - 手机市场出现低增速现实与高增速需要2大矛盾 手机生产厂商如何解决 下一篇:新闻源 财富源