競價廣告扣費機制的博弈論原理 | 人人都是產品經理

這段時間在看張維迎的《博弈論與社會》——一本博弈論的科普書,一邊在介紹博弈論原理,一邊藉助博弈論來解釋政治、經濟和生活中的現象。在現在常見的競價廣告系統中,博弈論同樣應用廣泛。

在討論之前,我們有2個前提:

  1. 媒體追求利益最大化:這很容易理解,因為媒體想要充分利用自己的流量,讓每次廣告曝光的收益都最大化,不浪費每一個掙錢的機會。
  2. 廣告主追求利益最大化:廣告主也是理性的,它需要從廣告中獲得收益,廣告主的收益=廣告引流產生的價值-廣告成本。

第1個問題:為什麼不按照固定的價格扣費?比如每一次點擊按照¥10收費?

這需要媒體需要知道全量且真實的廣告主的出價、成本信息,但這在現實中幾乎不可能。

第2個問題:如果從媒體收益最大化的前提出發,為什麼不按出價高者勝出,並且按照最高出價扣費?

我們設想這麼一種場景。在搜索引擎廣告場景下,如果廣告主A對「SUV」這個關鍵詞願意出價¥10,廣告主B願意對「SUV」關鍵詞出價¥8。考慮到A、B兩個廣告主都是理性人,且贏得廣告曝光的成本是已知的情況下(因為按出價競爭,且扣費按照廣告主的真實出價),都要儘可能地節約廣告成本。

那麼A和B都會儘可能地從較低的出價先試探(而不是根據廣告帶來的收益真實地出價),比如B出¥1,A為了贏得競價會出¥1.1,那麼B為了贏得出價就會出¥1.2,循環往複,A和B為了贏得廣告競價會先經歷一個價格逐漸攀升的過程,到A出¥8.1的時候,B發現不能再PK了否則要賠本了,就會停止競價,A到這個階段則會逐步試探把出價往下壓,到了¥8這個節點又會出現A、B兩家相互試探的過程,這會造成廣告系統極大的開銷與震蕩。

還要考慮到每個行業願意忍受的成本不一樣。有些暴利行業願意出更高的價格去贏得廣告曝光,即使後續轉化低也不要緊,只要贏得一單就賺錢。出價高者贏得廣告,會導致某個行業霸佔廣告資源位。

結論是,按照出價高者贏且按最高價扣費的劣勢是:

  1. 暴利行業壟斷廣告資源,忽略消費者體驗;
  2. 廣告主已知交易成本,會造成系統高度震蕩,且廣告主會追求不斷降低報價,對媒體收益造成損失。

我們在電視劇中常見的古董拍賣通常形式是:所有買方在同一個交易場中出價、價高者贏,甲的出價乙能知道,乙能根據自己對古董的報價、甲的報價決定自己的策略。

從博弈論的角度看,這個時候真實出價並不是一個最優策略。假設甲對古董的真實價值為V,如果他最終出價為P,那麼他的收益為B=V-P。如果P小於最終拍賣最高價,那麼不會贏得拍賣則收益為0;如果P大於V,那麼B小於0,同樣不是最優解。

最優出價應該是略微其他人的出價但小於真實價值,即使B最大,同時還得保證能贏。類似的,這種機制下廣告主的真實出價不是最佳策略。

第3個問題:如何鼓勵廣告主真實報價?

VCG被認為是一個很好的鼓勵真實出價的機制。

簡單來說,VCG認為每個廣告主應該支付的廣告費用,等於它自己給其他所有廣告主造成的損失。

按照社會效用最大看,最優策略是甲乙丙3個廣告主分別得到A1、A2、A3廣告位,因為3個廣告主產生的收益是最大的。

VCG機制如下:

  1. 甲、乙、丙3個廣告主對A1廣告位出價;
  2. 假設甲不出現,那麼乙得到A1,丙得到A2,那麼相對於甲參與競價的情況,乙的收益增加了2*10-2*5=10,丙的收益增加了5*1-2*1=3,整體收益為13,這也是甲的出現導致的乙和丙損失,那麼甲應該為A1支付13。

同理,假如甲和丙參與競拍,乙不參與競拍,對於甲無所謂依然拿到A1廣告位,但是對於丙來說,收益提高了5*1-1*2,=3,那麼乙應該為A2支付3。

VCG是整個社會效用最大化的機制。網上有很多材料能夠證明最佳出價策略是真實出價,這裡證明起來有點煩(我功力不夠,還沒能簡化證明)。

但是看起來美好,工程實現上非常困難,因為一個廣告點擊扣費,需要檢索參與此次廣告競價但是沒有贏得廣告曝光的所有廣告主損失。現在Facebook雖然採用了VCG機制,但是只計算廣告排名之後2名的損失來得到第1名應該支付的錢。

第4個問題:Google採用的GSP機制又是啥?

GSP全稱Generalized Second Price,廣義次高價機制,第1名的實際點擊扣費按照第2名的出價來。首先第1個廣告位給出價最高的廣告主,第2個廣告主贏得第2個廣告位,但是需要支付的點擊價格分別是第2名和第3名的出價。GSP機制是VCG機制在只有1個廣告位的情況的特殊形式。

GSP機制下,廣告主按照真實價值出價不一定是最優策略。

考慮這樣一種情形:

甲如果出3,那麼贏得A1廣告位,那麼收入是3*10=30,支付的費用為10*2=20,回報是30-20=10;如果出2,贏得A2廣告位,收入是3*6=18,支付的費用是6*1=6,回報是18-6=12,那麼顯然第二種出價對於甲而言才是最優策略。也就是說,第一種出價策略並不是納什均衡,可以預見的是甲肯定不會按照第一種策略執行。

第5個問題:對於媒體來說,VCG和GSP機制哪種最賺錢?

考慮有A1、A2兩個廣告位的情況,但是有3個廣告主PK,第一組按照真實價值(3,2,1)出價,第二組按照(2,1,0.5)出價,要注意的是,這兩組出價都能達到均衡,那麼按照GSP機制,媒體分別的收益為:

  1. 10*2+5*2=30;
  2. 10*1+5*0.5=12.5;

按照VCG機制,則甲要為A1支付費用10+3=13,乙要為A2支付3,媒體整體收入為16。

GSP機制下媒體收益可能高於VCG,也可能低於VCG,看出價達到什麼均衡。

第6個問題:加入廣告質量的因素,會有啥不一樣?

以上的分析,都是基於廣告位置決定點擊率的假設的,也就是說點擊率只跟廣告位置有關。但是真實的廣告並非如此。如果只考慮出價高者贏得曝光,不考慮點擊率,導致的結果是不相關的廣告填充了廣告位,但是卻並不產生任何價值,對於媒體而言是流量的極大浪費,也會造成用戶體驗差,因為信息與自己不相關。

長久來看,廣告主A和B發現導流過來的人群質量比較差、後續留存、轉化都不高,那麼也會影響A和B對於媒體的估價,可能A只願意出¥8,B只願意出¥4了,勢必會影響媒體的長久收入。

最早Yahoo就因為採用僅基於出價的GSP機制而損失了很多錢。Google最早發展了廣告質量的概念。

我們籠統地把預估點擊率、廣告與落地頁的相關性、落地頁的體驗(如載入速度)稱為廣告質量度Q,廣告主出價為P,那麼贏得廣告曝光的排序依據為P*Q,得分高者贏得廣告曝光。

那麼這個時候廣告主的花費呢?實際上,我們都知道這個時候的花費=(P2*Q2)/Q1,即第二名的P*Q值除以第一名的廣告質量度。

為什麼不直接按Q2來計算第一名的廣告消耗?我們先假設這麼一種場景:直接按照次高價扣費,那麼這個時候廣告主的最優策略是無限提高廣告出價,這樣能強制性地把P*Q值拉到最大,但是由於採用次高價扣費,因此並不用擔心會提升廣告成本。換句話說,只要廣告主願意出高價,不管廣告質量怎麼樣,都能展現在消費者面前;但是同樣的,由於忽視了廣告質量,不一定會有多少點擊,對於媒體而言也是得不償失。

所以我把 P2*Q2/Q1稱為懲罰定價。該公式可以寫成P2*(Q2/Q1),如果Q2>Q1,也就是第二名的廣告質量好於第一名,那麼P2*(Q2/Q1)>P2,換句話說,如果第一名的廣告質量比較差,那麼它要付出比第二名出價更多的成本才能維持住現有的位置;同理,如果第一名的質量度高於第二名,那麼只需花費比第二名更少的成本就可以維持現有的位置。

以上是競價背後的一些機制,轉化成廣告競價系統的術語,背後原理有兩層:

  1. 某次廣告曝光主要是比較eCPM(expected CPM),eCPM高者贏得展示廣告的機會,eCPM=pCTR(predict CTR)*CPC(廣告主的出價)。
  2. pCTR代表預估的CTR,即通過演算法對於該用戶在該廣告位點擊某個廣告的概率進行預估,然後乘上廣告主的出價(廣告創建時就已經確定,是已知的變數)即可得到eCPM。因此,僅僅提高出價是沒有用的,廣告主還必須優化pCTR。pCTR的預估機制,對於廣告主是一個黑箱,只知道跟廣告與用戶之間的匹配度(定向)、素材質量、落地頁質量等有關。

百度雲與阿里雲都提供pCTR訓練/預測的API。據稱百度使用了一億多個特徵訓練pCTR;阿里雲官網上列舉了pCTR訓練所需要使用的特徵。

但是真實的特徵與模型參數必須是黑箱,否則廣告主知道了特徵與參數之後,就可以針對性地調整,使pCTR最大,在保證eCPM足夠高贏得廣告的前提下,就可以降低出價,最終導致的結果是降低整體廣告主的出價,使媒體收入變少。

總結來看,一個賣方(媒體)、買方(廣告主)信息越是透明,媒體越是難以獲得收益最大化,且會早成高度的系統震蕩。