113 | 什么是“基于第二价位的广告竞拍”?

在之前一段时间的分享里,我们重点讲解了广告系统中的回馈预测,也就是我们常说的点击率预测或是转化率预测的问题,和你一起分享了一些有代表性的公司对于点击率预测的技术方案。

在最早介绍计算广告系统的时候,我们介绍了 DSP,也就是需求侧平台的基本功能。这个平台的一个很重要的作用就是决定到底投放哪个广告。我们介绍过的点击率预测可以提供对广告优劣的一种预测,除此之外,我们还需要一种机制,来决定如何从众多的广告中进行选取,这就是广告的竞价排名。

广告位竞价排名的出现有两个原因。第一,发布商的广告位是有限的。不管是搜索广告还是展示广告,绝大多数的发布商都以一定的比例在原生的内容,例如新闻、社交媒体内容里插入一些广告位。但是这些广告位的数目是有限的,特别是在优质的发布商资源里,就会出现一些广告位有着很大的竞争。第二,既然有竞争,那么如果引入一种竞价机制的话,势必有可能抬高广告的单价,从而让广告中间平台例如 DSP,或者是发布商从中获取更高的价值。

今天,我们就来讲一讲广告位竞价的一个基本原理,特别是目前广泛使用的基于第二价位的广告竞拍。

基于第一价位的竞拍

在我们开始讨论基于第二价位的广告竞拍之前,我们首先来看一个更加自然的竞拍手段,基于第一价位的竞拍。其实,在现实生活中,基于第一价位的竞拍会显得更加普遍。

所谓基于第一价位的竞拍,指的是所有的投标方都定好自己的出价,然后一次性统一出价。在出价的过程中,所有的投标方都是看不见竞争对手的出价的,这保证了出价的诚实性。

当竞拍平台接到所有投标方的出价以后,按照出价由高到低排序,出价最高的投标方获得投标的胜利。

在广告系统中,如果要采用这样的形式,那么,决定最后投标顺序的不再是单纯的价格,而往往是一个投标价格和点击率的函数,最简单的函数就是点击率乘以投标价格。这其实也可以被认为是一种“期望收入”。也就是说,如果发布商或者 DSP 是按照广告的每一次点击来收取费用的话,那么,点击率乘以投标价格就是这种收入的一个数学期望值。

所以,基于第一价位竞价的广告系统,按照广告收入的期望值进行竞价排名。排名第一的广告被选为显示的广告。

这种机制在早期的互联网广告平台中曾被大量使用。但是一段时间以后,大家发现,基于第一价位竞价的竞价结果往往是“虚高”的。

这也很容易形象地解释,在大家都不知道对方出价的情况下,如果希望自己能在竞拍中胜出,势必就可能报出比较高的价格。另外一个方面,投标方并不清楚这个广告位的真实价值,大家只能在条件允许的情况下,尽量抬高价格来获取这个机会。

从某种意义上来说,这样的竞价并不利于广告商的长远发展,也打击了广告商的积极性。

基于第二价位的竞拍

就是在基于第一价位竞价的基础上,互联网广告界逐渐衍生出了一种新的竞拍方法——基于第二价位的竞拍。

当我们已经熟悉了基于第一价位的竞拍模式以后,理解基于第二价位的竞拍就比较容易了。

首先,和基于第一价位的竞拍模式一样,基于第二价位的模式也是按照广告的期望收入,也就是根据点击率和出价的乘积来进行排序。但和基于第一价位模式不一样的是,中间商或者发布商并不按照第一位的价格来收取费用,而是按照竞价排位第二位的广告商的出价来收取费用。也就是说,虽然第一名利用自己的出价赢得了排名,但是只需要付第二名所出的价格。

很多互联网广告平台采用了基于第二价位的竞拍之后,发现广告商的竞价表现整体上要比基于第一价位的时候要好。时至今日,基于第二价位的竞拍方式已经成为了互联网广告的主流竞拍模式。

那么,基于第二价位的竞拍方式究竟有什么好处呢?文末推荐一个参考文献 [1],有比较详细的描述。简单来说,研究人员发现,在基于第二价位竞拍的形式下,广告商按照自己对于广告位价值的理解来竞拍是相对较优的策略。

在基于第二价位的竞拍方式的环境中,又有什么值得注意的技术难点呢?

对于广告商来说,主要是希望知道在当前出价的情况下,究竟有多大的概率赢得当前的竞拍。这也就是所谓的“赢的概率”,这对于广告商调整自己的出价有非常重要的指导意义。对于整个出价的概率分布的一个估计,有时候又叫作“竞价全景观”(Bid Landscape)预测。这是一个非常形象的说法,因为广告商希望知道整个赢的概率随着出价变化的整个分布,从而调整自己的安排。

这样的预测工作会用到一些简单的模型。比如,有学者认为,赢的价格服从一个“对数正态分布”(Log-normal)。也就是说,广告商出的价格并且最终赢得竞拍的这些价格,在取了对数的情况下,服从一个正态分布。当然,这是一个假设。但是有了这么一个假设以后,我们就可以从数据中估计这个对数正态分布的参数,从而能够对整个“竞价全景观”进行估计。

对于“竞价全景观”或者是赢的价格分布的估计有一个比较困难的地方,那就是,作为广告商来说,往往并不知道所有其他竞争对手的出价,以及在没有赢得竞拍的情况下,那些赢得竞拍的出价是多少。简而言之,也就是我们只观测到了一部分数据,那就是我们赢得这些广告位的出价。在这种只有一部分信息的情况下,所做的估计就会不准确。

已经有一些研究工作关注这样情况的预测。比如,论文《用截尾数据预测实时招标中的赢价》(Predicting winning price in real time bidding with censored data)[2] 就利用了一种对数几率回归来估计那些没有赢得竞拍情况下的赢的价格,然后和已知的赢的价格一起对整个“竞价全景观”进行估计,这也算是目前的一项前沿研究。

总结

今天我为你介绍了广告竞价系统中的基于第二价位的广告竞拍。

一起来回顾下要点:第一,我们讲了基于第一价位的竞价原理,就是按照广告收入的期望值进行竞价排名,排名第一的广告竞拍成功;第二,我们聊了基于第二价位的竞价原理和一些技术难点,主要是如何对整个“竞价全景观”进行估计。

最后,给你留一个思考题,既然竞价排名是按照点击率乘以价格,那如何避免下面这样一种情况呢?就是一些点击率比较低的广告商利用很高的价格占据广告位,从而让用户看到很多不相关的广告?

欢迎你给我留言,和我一起讨论。

参考文献

Jun Wang, Weinan Zhang and Shuai Yuan. Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting. Foundations and Trends® in Information Retrieval: Vol. 11: No. 4-5, pp 297-435, 2017.

Wu, W. C.-H., Yeh, M.-Y., and Chen, M.-S. Predicting winning price in real time bidding with censored data. Proceedings of the 21st ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 1305–1314. ACM, 2015.