版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

擴(kuò)展式博弈

北京理工大學(xué)
原創(chuàng)
北京理工大學(xué)官方科普號,i北理愛科學(xué)
收藏

本次將為大家介紹擴(kuò)展式博弈。在分析擴(kuò)展式博弈時,我們通常會用到“博弈樹”,博弈樹是通過節(jié)點(diǎn)和分支來分析博弈的工具

首先我們通過“阻嚇博弈”的例子介紹如何使用博弈樹進(jìn)行分析。

現(xiàn)在市場上只有一家企業(yè)(incumbent),另一家企業(yè)可以選擇是否入場,如果選擇入場,對于舊企業(yè)而言,如果選擇保持價(jià)格,那么新企業(yè)獲得10收益,舊企業(yè)獲得50收益;如果選擇降低價(jià)格打價(jià)格戰(zhàn),那么新企業(yè)獲得10虧損,舊企業(yè)獲得30收益;如果選擇不入場,對于舊企業(yè)而言,如果保持價(jià)格,那么舊企業(yè)獲得100收益,如果降低價(jià)格,則舊企業(yè)獲得90收益,而新企業(yè)無論如何都不會獲得收益。但新企業(yè)如果不入場,舊企業(yè)就不會選擇降價(jià),所以在博弈樹上,新企業(yè)的“do not enter”下沒有多的分支。

與該博弈類似的還有“協(xié)調(diào)博弈”,即每個參與者的收益取決于他們與對方的協(xié)調(diào)程度,如果選擇同樣的策略,雙方獲得相同的收益,如果選擇了不同的收益,那么雙方獲得相同的虧損,博弈的目的是使每位參與者的收益最大化。而該博弈中可能存在多個納什均衡。

這里要特別解釋一下表格中對策略的描述:(L,L)是指,第一個L對應(yīng)A的第一個策略,當(dāng)A選擇L時,那么B選擇第一個策略,當(dāng)A選擇S時,那么B選擇第二個策略,例如:(S,L):A選擇L時,B選擇S,A選擇S時,B選擇L。由此我們根據(jù)右邊的博弈樹,得到左邊的收益表格。利用畫線法可以得到三個均衡,分別是:A選L時B選L;A選L時B選L;A選S時B選S。與協(xié)調(diào)博弈的要求相符。

當(dāng)對博弈樹分析納什均衡時,可以采用“逆向歸納”法:

從最終的結(jié)果開始分析,倒推回最初的策略。舉圖片中的例子:對于所有的結(jié)果,由于最后一步由2決定,那么就要比較2的收益。在左邊的分支中,(2,1)和(0,0)相比,1大于0,那么選擇(2,1),在分支上畫一個倒回的箭頭,右側(cè)同理選擇(3,2),此時回到第一步,也即1的選擇,此時比較1的收益大小,(2,1)和(3,2)中3大于2,則選擇(3,2),在右側(cè)畫一個倒推回的箭頭指向最初的1,綜上,最終得到的納什均衡為(3,2)。

另一種擴(kuò)展式博弈是重復(fù)博弈,參與者重復(fù)進(jìn)行同一種博弈,最終每次博弈的收益是所有收益的的加權(quán)平均數(shù)。對于重復(fù)博弈來說,可以是靜態(tài)博弈,也可以是動態(tài)博弈,但整體而言是動態(tài)博弈,后一次博弈不會受到前一次博弈的影響,每一次博弈的規(guī)則、策略等均完全相同。