考研網(wǎng)校 模擬考場 考研資訊 復習指導 歷年真題 模擬試題 經(jīng)驗 考研查分 考研復試 考研調(diào)劑 論壇 短信提醒 | ||
考研英語| 資料 真題 模擬題 考研政治| 資料 真題 模擬題 考研數(shù)學| 資料 真題 模擬題 專業(yè)課| 資料 真題 模擬題 在職研究生 |
考研網(wǎng)校 模擬考場 考研資訊 復習指導 歷年真題 模擬試題 經(jīng)驗 考研查分 考研復試 考研調(diào)劑 論壇 短信提醒 | ||
考研英語| 資料 真題 模擬題 考研政治| 資料 真題 模擬題 考研數(shù)學| 資料 真題 模擬題 專業(yè)課| 資料 真題 模擬題 在職研究生 |
一個完整的博弈應當包括五個方面的內(nèi)容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。
“囚徒困境”
“囚徒困境”是博弈論里最經(jīng)典的例子之一。講的是兩個嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是"坦白從寬,抗拒從嚴",如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據(jù)不足各判1年。
在這個例子里,博弈的參加者就是兩個嫌疑犯A和B,他們每個人都有兩個策略即坦白和不坦白,判刑的年數(shù)就是他們的支付。可能出現(xiàn)的四種情況:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的結(jié)果。A和B均坦白是這個博弈的納什均衡。這是因為,假定A選擇坦白的話,B最好是選擇坦白,因為B坦白判8年而抵賴卻要判十年;假定A選擇抵賴的話,B最好還是選擇坦白,因為B坦白判不被判刑而抵賴確要被判刑1年。即是說,不管A坦白或抵賴,B的最佳選擇都是坦白。反過來,同樣地,不管B是坦白還是抵賴,A的最佳選擇也是坦白。結(jié)果,兩個人都選擇了坦白,各判刑8年。在(坦白、坦白)這個組合中,A和B都不能通過單方面的改變行動增加自己的收益,于是誰也沒有動力游離這個組合,因此這個組合是納什均衡。
囚徒困境反映了個人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當然,A和B可以在被警察抓到之前訂立一個"攻守同盟",但是這可能不會有用,因為它不構(gòu)成納什均衡,沒有人有積極性遵守這個協(xié)定。
關于完全理性的思考
囚徒困境博弈的一個假設是博弈方都是完全理性。完全理性來源于經(jīng)濟學中的理性人假設,即博弈方都以個體利益最大化為目標,且有準確的判斷選擇能力,也不會“犯錯誤”。以個體利益最大為目標被稱為“個體理性”,有完美的分析判斷能力和不會犯選擇行為的錯誤稱為“完全理性”。完全理性包括追求最大利益的理性意識、分析推理能力、識別判斷能力、記憶能力和準確行為能力等多方面的完美性要求,其中任何一方面不完美就不屬于完全理性。我們可以看出,這是一個要求非常嚴格的假設。即便如此,完全理性仍在一個方面沒有做出規(guī)定(至少是沒有意識到或明確地規(guī)定出來),就是思維方式,也即是博弈方是以將問題分解的方式來思考問題呢,還是以系統(tǒng)的整體的方式來思考問題的。
國家 | 北京 | 天津 | 上海 | 江蘇 |
安徽 | 浙江 | 山東 | 江西 | 福建 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |