版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-空間演化博弈

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

空間演化博弈是一種基于細(xì)胞自動機(jī)的生物數(shù)學(xué)博弈模型。這一模型通過利用按照博弈規(guī)則進(jìn)行演化的細(xì)胞自動機(jī),來獲知個體的背叛怎樣在未來影響群體的合作-背叛狀況。該模型可用于研究細(xì)菌、社會等系統(tǒng)模型。

簡介空間演化博弈是一種基于細(xì)胞自動機(jī)的生物數(shù)學(xué)博弈模型。這一模型通過利用按照博弈規(guī)則進(jìn)行演化的細(xì)胞自動機(jī),來獲知個體的背叛怎樣在未來影響群體的合作-背叛狀況。該模型可用于研究細(xì)菌、社會等系統(tǒng)模型。1

基本模型空間演化博弈的基本模型由馬丁·諾瓦克(Martin A. Nowak)和Robert May發(fā)表于1992年10月29日的《自然》雜志(Nature)上,題為Evolution games and spatial chaos。

模型基本設(shè)定如下:

博弈在一個LxL的二維方格陣列上進(jìn)行;

每個格子代表一個個體,每個格子只與自己為中心的九個格子進(jìn)行博弈;

格子遵從一個固定的收益矩陣,并執(zhí)行同步更新;

每個格子按照本次博弈周圍九個格子中收益最多的策略(合作或背叛),選取自己下一回合的策略;

使用“周期邊界”來避免周期效應(yīng)。

在這樣的基本設(shè)定下,通過修改相關(guān)參數(shù)并適當(dāng)修改條件,可以得到更復(fù)雜的數(shù)學(xué)模型,用以模擬更多的群體行為。

目前這篇論文已經(jīng)有SCI引用1100多篇。1

數(shù)理生物學(xué)數(shù)理生物學(xué)(英語:mathematical and theoretical biology),又稱數(shù)學(xué)生物學(xué)(英語:mathematical biology)或生物數(shù)學(xué)(英語:biomathematics)是一個跨學(xué)科的領(lǐng)域,其主要目標(biāo)是利用數(shù)學(xué)的技巧和工具為自然界,特別是生物學(xué)中的過程建模并進(jìn)行分析。生物數(shù)學(xué)在生物學(xué)的理論和實踐中都有廣泛的應(yīng)用。1

演化博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域的應(yīng)用優(yōu)勢(一)方法論

新古典經(jīng)濟(jì)學(xué)以原子論和機(jī)械力學(xué)為理論基礎(chǔ),它假定參與人是完全理性和一致偏好的。參與人在既定的條件下可以得到一個最優(yōu)方案,比如生產(chǎn)商在技術(shù)和資源一定的情況下可以找到一個獲得最大收益的生產(chǎn)方案,消費者在既定的預(yù)算條件下可以獲得一個最大效用的消費方案等等。博弈論在新古典經(jīng)濟(jì)學(xué)的基礎(chǔ)上增加了行為主體之間的互動,使得理論更貼近現(xiàn)實,但總的來說,博弈論仍然沒有跳出新古典經(jīng)濟(jì)學(xué)的框架。因此,在運用博弈論建立模型時,對各種關(guān)系做出的假設(shè)往往不切合實際,因此,根據(jù)此類模型做出的決策往往和現(xiàn)實相差較遠(yuǎn),容易導(dǎo)致失誤。

演化博弈論摒棄了完全理性的假設(shè),以達(dá)爾文生物進(jìn)化論和拉馬克的遺傳基因理論為思想基礎(chǔ),從系統(tǒng)論出發(fā),把群體行為的調(diào)整過程看作為一個動態(tài)系統(tǒng),在其中每個個體的行為及其與群體之間的關(guān)系得到了單獨的刻畫,可以把從個人行為到群體行為的形成機(jī)制以及其中涉及到的各種因素都納入到演化博弈模型中去,構(gòu)成一個具微觀基礎(chǔ)的巨集觀模型,因此能夠更真實地反映行為主體的多樣性和復(fù)雜性,并且可以為巨集觀調(diào)控群體行為提供理論依據(jù)。因此,演化博弈論提供的經(jīng)濟(jì)現(xiàn)象的解釋比博弈論更深刻、更貼近實際、更有說服力。

(二)認(rèn)識論

博弈論假設(shè)行為主體具有完美的理性思維,即行為主體始終以自身最大利益為目標(biāo),具有各種環(huán)境中追求自身利益最大化的判斷和決策能力,具有在存在交互作用的博弈環(huán)境中完美的判斷和預(yù)測能力,不會犯錯、不會沖動、沒有不理智。另外,博弈論中的一個最重要的假設(shè)就是博弈雙方行為人的“共同知識”假設(shè),即所有參與人都是理性的,所有參與人知道所有參與人都是理性的,如此類推,以至無限。這是一個令人難以想象的無限推理過程,就行為人對現(xiàn)實世界的認(rèn)識能力而言,是一條非常嚴(yán)格的假設(shè)。很顯然,現(xiàn)實世界這種假設(shè)通常是得不到保證的。

演化博弈論對于行為主體采取的是有限理性假設(shè),因此,這些個體不具備博弈論中行為主體的“全知全能”,無法在經(jīng)濟(jì)活動中瞬間能夠獲得最優(yōu)的結(jié)果。在演化博弈論中,行為主體被假設(shè)為程式化地采用某一既定行為,它對于經(jīng)濟(jì)規(guī)律或某種成功的行為規(guī)則、行為策略的認(rèn)識是在演化的過程中得到不斷的修正和改進(jìn)的,成功的策略被模仿,進(jìn)而產(chǎn)生出一些一般的“規(guī)則”和“制度”作為行為主體的行動標(biāo)準(zhǔn)。在這些一般的規(guī)則下,行為主體獲得“滿意”的收益。這與現(xiàn)實情況更相符合。

(三)時間的不可逆性

博弈論注重均衡狀態(tài)的研究,忽視達(dá)到均衡的過程。在博弈論中,行為主體能夠立即對外部環(huán)境作出完美判斷,達(dá)到均衡狀態(tài)。博弈論忽視時問問題,強(qiáng)調(diào)行為主體瞬問的均衡,即使考慮時間問題,也把時間看作對稱或可逆的。

在演化博弈論中,時間占有非常重要的地位。行為主體在演化過程中不斷修正和改進(jìn)自己的行為,模仿成功的策略等等,都需要一個相對較長的時間。演化博弈論認(rèn)為,時間是不可逆的,過去時間內(nèi)的狀態(tài)與未來時間的狀態(tài)是不對稱的,因而,行為主體狀態(tài)的演化跟初始的時間狀態(tài)息息相關(guān)。

(四)隨機(jī)(突變)因素

在博弈論模型中,不確定因素以隨機(jī)變數(shù)的形式出現(xiàn),通過給定隨機(jī)變數(shù)的分布,模型的研究將最終集中于一些重要變數(shù)的平均值上,而不確定因素往往被忽略。因此,在博弈論中,即使存在不確定性因素,理性的行為人仍可實現(xiàn)最優(yōu)化的結(jié)果。在演化博弈模型中,隨機(jī)(突變)因素起著關(guān)鍵的作用,演化過程常被看成是一種試錯的過程。行為人會嘗試各種不同的行為策略,并且每一次都將發(fā)生部分替代。在多數(shù)情況下,用概率分布來描述這種不確定性是不可能的,這種不確定使長期最優(yōu)化決策難以實現(xiàn),演化過程的長期趨勢很難預(yù)測,但如果選擇過程的適應(yīng)性標(biāo)準(zhǔn)確定,演化過程呈現(xiàn)一定的規(guī)律性,此時,演化過程的長期趨勢又是可預(yù)測的。

(五)選擇機(jī)制及均衡

傳統(tǒng)的博弈理論中的行為主體是完全理性的,通常,在完全理性的假設(shè)下,如果納什均衡存在,那么博弈雙方博弈一次就可直接達(dá)到納什均衡。這個結(jié)果不依賴于市場的初始狀態(tài),所以不需要任何的動態(tài)調(diào)整過程。而演化博弈論認(rèn)為,納什均衡的達(dá)到應(yīng)當(dāng)是在多次博弈后才能達(dá)到的,需要有一個動態(tài)的調(diào)整過程,均衡的達(dá)到依賴于初始狀態(tài),是路徑依賴的。2

本詞條內(nèi)容貢獻(xiàn)者為:

孔祥杰 - 副教授 - 大連理工大學(xué)軟件學(xué)院