版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-博弈

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

分類

從博弈的研究范式來劃分,可分為傳統(tǒng)博弈論和演化博弈論;從博弈的具體應(yīng)用來劃分,可分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈是指在博弈中,兩個參與人同時選擇或兩人不同時選擇,但后行動者并不知道先行動者采取什么樣的具體行動。對雙方來說,都容易形成混沌的行為重組,由于規(guī)則的嚴密與精細,任何人因時間問題、資金問題、心理問題等等,致使在多次均衡后直到不明不白地造成大輸,參與靜態(tài)博弈和動態(tài)博弈的大部分都是這種人。動態(tài)博弈是指在博弈中,兩個參與人有行動的先后順序,且后行動者能夠觀察到先行動者所選擇的行動。

根據(jù)參與者能否形成約束性的協(xié)議,以便集體行動,博弈可分為合作性博弈和非合作性博弈。納什等博弈論專家研究得更多的是非合作性博弈。

(非)合作性博弈所謂合作性博弈是指參與者從自己的利益出發(fā)與其他參與者談判達成協(xié)議或形成聯(lián)盟,其結(jié)果對聯(lián)盟方均有利;而非合作性博弈是指參與者在行動選擇時無法達成約束性的協(xié)議。人們分工與交換的經(jīng)濟活動以及囚徒困境就是合作性的博弈,而公共資源悲劇都是非合作性的博弈。

(不)完全信息博弈從知識的擁有程度來看,博弈分為完全信息博弈和不完全信息博弈。信息是博弈論中重要的內(nèi)容。完全信息博弈指參與者對所有參與者的策略空間及策略組合下的支付有“完全的了解”,否則是不完全信息博弈。嚴格地講,完全信息博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的“公共知識”的博弈。對于不完全信息博弈,參與者所做的是努力使自己的期望支付或期望效用最大化。

以此博弈哲學(xué)語言也可體現(xiàn)出以下四種博弈分類:

完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動態(tài)博弈

其中策略性博弈應(yīng)屬于完全信息靜態(tài)博弈,而完全信息動態(tài)博弈則包括擴展性博弈和重復(fù)博弈等;不完全信息靜態(tài)博弈則是以貝葉斯均衡等理論完成對混合策略的重新解釋,不完全信息動態(tài)博弈則是完美貝葉斯均衡為核心概念的信號博弈。

引申現(xiàn)今博弈兩字也常用于博弈論的引申含義,在學(xué)術(shù)、商業(yè)、政治等領(lǐng)域有多角度多含義解釋。

博弈論博弈論1又被稱為對策論(Game Theory)既是現(xiàn)代數(shù)學(xué)的一個新分支,也是運籌學(xué)的一個重要學(xué)科。

博弈論2主要研究公式化了的激勵結(jié)構(gòu)間的相互作用。是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。 博弈論考慮游戲中的個體的預(yù)測行為和實際行為,并研究它們的優(yōu)化策略。生物學(xué)家使用博弈理論來理解和預(yù)測進化論的某些結(jié)果。博弈論已經(jīng)成為經(jīng)濟學(xué)的標(biāo)準(zhǔn)分析工具之一。在生物學(xué)、經(jīng)濟學(xué)、國際關(guān)系、計算機科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用?;靖拍钪邪ň种腥?、行動、信息、策略、收益、均衡和結(jié)果等。其中局中人、策略和收益是最基本要素。局中人、行動和結(jié)果被統(tǒng)稱為博弈規(guī)則。

博弈論畢竟是數(shù)學(xué),更確切地說是運籌學(xué)的一個分支,談經(jīng)論道自然少不了數(shù)學(xué)語言,外行人看來只是一大堆數(shù)學(xué)公式。好在博弈論關(guān)心的是日常經(jīng)濟生活問題,所以不能不食人間煙火。其實這一理論是從棋弈、撲克和戰(zhàn)爭等帶有競賽、對抗和決策性質(zhì)的問題中借用的術(shù)語,聽上去有點玄奧,實際上卻具有重要現(xiàn)實意義。博弈論大師看經(jīng)濟社會問題猶如棋局,常常寓深刻道理于游戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進行審訊。由地方檢察官分別和每個人單獨談話。檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個交易。如果你單獨坦白殺人的罪行,我只判你三個月的監(jiān)禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑?!彼箍柗平z和那庫爾斯該怎么辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無法串供。所以,按照亞當(dāng)·斯密的理論,每一個人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到很短的監(jiān)禁———3個月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因為,每一方在選擇策略時都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。沒有人會主動改變自己的策略以便使自己獲得更大利益?!扒敉降膬呻y選擇”有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結(jié)果?!凹{什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。不妨讓我們重溫一下這位經(jīng)濟學(xué)圣人在《國富論》中的名言:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益?!睆摹凹{什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖了西方經(jīng)濟學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。

從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟、社會、政治、國防、管理和日常生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。如價格戰(zhàn)、軍備競賽、污染等等。一般的博弈問題由三個要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關(guān)系被選擇,每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素。

價格戰(zhàn)博弈現(xiàn)在我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn),彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、微波爐大戰(zhàn)……這些大戰(zhàn)的受益者首先是消費者。每當(dāng)看到一種家電產(chǎn)品的價格大戰(zhàn),百姓都會“沒事兒偷著樂”。在這里,我們可以解釋廠家價格大戰(zhàn)的結(jié)局也是一個“納什均衡”,而且價格戰(zhàn)的結(jié)果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結(jié)果是穩(wěn)定的,即是一個“納什均衡”。這個結(jié)果可能對消費者是有利的,但對廠商而言是災(zāi)難性的。所以,價格戰(zhàn)對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個問題,一是競爭削價的結(jié)果或“納什均衡”可能導(dǎo)致一個有效率的零利潤結(jié)局。二是如果不采取價格戰(zhàn),作為一種敵對博弈論(vivalry game)其結(jié)果會如何呢?每一個企業(yè),都會考慮采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的,通常會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。從這一點,我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基礎(chǔ)上”。事實上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態(tài)下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這種均衡中,每一企業(yè)要使利潤最大化,消費者要使效用最大化,結(jié)果導(dǎo)致了零利潤,也就是說價格等于邊際成本。在完全競爭的情況下,非合作行為導(dǎo)致了社會所期望的經(jīng)濟效率狀態(tài)。如果廠商采取合作行動并決定轉(zhuǎn)向壟斷價格,那么社會的經(jīng)濟效率就會遭到破壞。這就是為什么WTO和各國政府要加強反壟斷的意義所在。

污染博弈假如市場經(jīng)濟中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤的最大化,寧愿以犧牲環(huán)境為代價,也絕不會主動增加環(huán)保設(shè)備投資。按照看不見的手的原理,所有企業(yè)都會從利己的目的出發(fā),采取不顧環(huán)境的策略,從而進入“納什均衡”狀態(tài)。如果一個企業(yè)從利他的目的出發(fā),投資治理污染,而其他企業(yè)仍然不顧環(huán)境污染,那么這個企業(yè)的生產(chǎn)成本就會增加,價格就要提高,它的產(chǎn)品就沒有競爭力,甚至企業(yè)還要破產(chǎn)。這是一個“看不見的手的有效的完全競爭機制”失敗的例證。直到20世紀(jì)90年代中期,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲目發(fā)展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業(yè)才會采取低污染的策略組合。企業(yè)在這種情況下,獲得與高污染同樣的利潤,但環(huán)境將更好。

博弈問題貿(mào)易自由與壁壘中的

這個問題對于剛剛加入WTO的中國而言尤為重要。任何一個國家在國際貿(mào)易中都面臨著保持貿(mào)易自由與實行貿(mào)易保護主義的兩難選擇。貿(mào)易自由與壁壘問題,也是一個“納什均衡”,這個均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。X國試圖對Y國進行進口貿(mào)易限制,比如提高關(guān)稅,則Y國必然會進行反擊,也提高關(guān)稅,結(jié)果誰也沒有撈到好處。反之,如X和Y能達成合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)果大家都從貿(mào)易自由中獲得了最大利益,而且全球貿(mào)易的總收益也增加了。