納什均衡
發(fā)布時間:2025-11-13 | 來源:互聯(lián)網轉載和整理
誰能把納什均衡給講清楚點?
納什均衡是博弈論中的一個規(guī)律,指的是在一個博弈過程中,博弈雙方都沒有改變自己策略的動力,因為單方面改變自己的策略都會造成自己收益的減少。
納什均衡點可以理解為個體最優(yōu)解,但并不一定是集體最有解。
為了解釋這個問題,我們舉兩個最典型的例子:囚徒困境和智豬博弈。
囚徒困境囚徒困境是說:有兩個小偷集體作案,然后被**捉住。
**對兩個人分別審訊,并且告訴他們政策:如果兩個人都交代坦白,就可以定罪,兩個人各判八年。
如果一個人交代另一個不交代,那么一樣可以定罪。
但是交代的人從寬處罰,批評教育就釋放。
不交代的人從嚴處罰,判十年。
如果兩個人都不交代,沒法定罪,每個人判一年意思一下。
兩個人的收益情況如下所示:首先我們考慮A的決策。
A會想,我如何才能獲得更大收益呢? 如果B坦白了,那么我坦白就會判8年,我抗拒就會判十年,我應該坦白;如果B抗拒了,我坦白會判0年,我抗拒會判1年,我還是應該坦白。
所以最終A會選擇坦白。
同樣,B也會這樣想,因此最終納什均衡點在兩個人都坦白,各判八年這里。
顯然,集體最優(yōu)解在兩個人都抗拒,這樣一來每個人都判一年就出來了。
但是,納什均衡點卻不在這里。
而且,在納什均衡點上,任何一個人都沒有改變自己決策的動力。
因為一旦單方面改變決策,那個人的收益就會下降。
這與我國開車夾塞的例子很像。
如果大家都不夾塞,是整體的最優(yōu)解,但是按照納什均衡理論,任何一個司機都會考慮,無論別人是否夾塞,我夾塞都可以使自己的收益變大。
于是最終大家都會夾塞,加劇擁堵,反而不如大家都不加塞走的快。
那么,有沒有辦法使個人最優(yōu)變成集體最優(yōu)呢?方法就是共謀。
兩個小偷在作案之前可以說好,咱們如果進去了,一定都抗拒。
如果你這一次敢反悔,那么以后道上的人再也不會有人跟你一起了。
也就是說,在多次博弈過程中,共謀是可能的。
但是如果這個小偷想干完這一票就走,共謀就是不牢靠的。
在社會領域,共謀是靠法律完成的。
大家約定的共謀結論就是法律,如果有人不按照約定做,就會受到法律的懲罰。
通過這種方式保證最終決策從個人最優(yōu)的納什均衡點變?yōu)榧w最優(yōu)點。
智豬博弈智豬博弈是這樣一個例子:有一個食槽中裝有十份食物,但是按鈕在另一端。
需要到另一段按一下按鈕食物才能掉下來。
大豬和小豬都在食槽一端,他們兩個人都可以跑到另一端按按鈕然后再回來,速度相同,并且都要消耗一定的體力,并且會造成另一只豬先吃食物。
我們假設每只豬跑去按按鈕都要消耗2份食物的體力,并且大豬比小豬吃食物快,所以:如果大豬先吃食物,二者吃食物的比例為9:1如果小豬先吃食物,二者吃食物的比例為6:4如果二者同時吃食物,吃食物的比例為7:3兩只豬都可以選擇去按按鈕,也可以選擇等待。
在考慮了兩只豬消耗的體力因素后,各種決策對應的收益如下所示:我們來考慮均衡點。
小豬會思考:如果大豬去,我跟著去獲得收益1,我等著獲得收益4,因此我應該等著。
如果大豬不去我去,我獲得收益-1,如果我們都等著我收益為0,因此我還是應該等著,這樣一來,小豬的決策一定是等待。
在小豬等待的情況下,如果大豬去按按鈕,獲得收益4,如果大豬不去按按鈕,獲得收益0,因此大豬會選擇去按按鈕。
這個(4,4)的收益就是納什均衡點。
這和國家或者公司進行基礎研究研發(fā)新產品很像。
比如一款新的芯片研發(fā)需要花很多錢,成功后也能獲得更大的收益。
在這樣的情況下,小國家小公司是沒有動力進行研發(fā)的,他們會等待大國大公司研發(fā)好了之后,直接利用現(xiàn)成的技術獲得收益。
我們的芯片產業(yè)就是這樣一個局面,多年以來我們一直認為自己是發(fā)展中國家,沒有大力推動半導體產業(yè)的基礎研究,許多人秉著做不如買,買不如租的觀點。
現(xiàn)在美國對中國展開貿易戰(zhàn),禁止芯片出口,一下子就卡主我們的脖子了。
約翰納什是一位傳奇人物,前兩年出車禍去世了。
想了解納什的一生,可以去看看電影《美麗心靈》
納什均衡涉及到非合作博弈,這個事情我可以給你解釋一下,大致就是用離婚這個事情來說吧。
夫妻2個人,要離婚的時候,一般情況下就是要分割財產。
這時候,就是一個博弈過程。
如果是合作博弈,也就是兩個人好商量,那么就去協(xié)議離婚,民政局領離婚證,財產一人一半,誰也不吃虧。
但是,如果走法院***離婚的路線,則是非合作博弈,這個時候要請律師,而且財產分割就會有人吃虧有人占優(yōu)勢。
那么,我們假設夫妻財產是100萬,如果女方請律師,上法院***離婚,那么女方要付出律師費4萬,但可以贏得70萬,男方如果不請律師,那么男方得到30萬。
這個情況下,男方其實是吃虧了。
所以,這個不是納什均衡——所謂均衡就是無法再改進了,那么男方應該怎么做?當然是要改進,那就請律師,男方付出律師費4萬,這個時候雙方上了法院,最后律師勢均力敵,雙方每人50萬,除了律師費用,每人剩46萬。
這個每個46萬就是納什均衡。
所以,從上面的例子可以看出,兩個人不請律師不是納什均衡,因為女方如果知道男方不請律師,她肯定會請律師,最后得到70萬。
所以,這個狀態(tài)不是一個納什均衡——因為有一方可以通過改進策略多贏錢。
最后雙方非合作博弈的納什均衡狀態(tài)一定是雙方都請律師,最后誰也不吃虧——律師賺了錢,所以律師在離婚官司里得到了納什均衡的好處。