

當前位置:走進德成 > 德成動態(tài)
發(fā)布日期:2024-04-12 來源: 作者:北京德成經(jīng)濟研究院 加入收藏
蘇軾是中華民族最偉大的文學家之一。我以為,蘇軾在中國偉大文學家群體中的地位,如同牛頓與愛因斯坦在偉大自然科學家群體中的地位。沒有蘇軾,中國文學史與精神生活缺少最精彩的篇章;此外,蘇軾跌宕起伏的人生,為中國傳統(tǒng)知識分子身處逆境提供了一個精神的榜樣。
本文則是給蘇軾跌宕起伏的人生做一個囚徒困境重復博弈的解讀。本文分三個部分:第一部分,從作者的視角給蘇軾一個非專業(yè)的評價;第二部分,從囚徒困境的重復博弈看蘇軾跌宕起伏的人生,主要借助囚徒困境重復博弈的ALLC、ALLD與“一報還一報”等策略,分析蘇軾與司馬光、王安石與章惇的關系,并根據(jù)這個分析找出蘇軾持續(xù)被貶的原因;第三部分,作者指出,在皇權時代,我們不僅要學蘇軾,更學博弈思維,在堅持自己道德底線的前提下,尋找個人合作與不合作的最佳策略。
一、從作者的視角給蘇軾一個非專業(yè)的評價
我喜歡蘇軾的詩詞,也敬仰他面對逆境的風骨。我不是文學評論家,也不是學文學專業(yè)的,沒有能力對蘇軾作全面、專業(yè)的評價,僅用四個關鍵詞概括蘇軾的四個特征:睿智、豪邁、多情與灑脫;而每個關鍵詞,都借用蘇軾詩句為證。
一是“睿智”,這可從《題西林壁》詩中體現(xiàn)出來:“橫看成嶺側(cè)成峰,遠近高低各不同。不識廬山真面目,只緣身在此山中?!边@首詩表現(xiàn)出蘇軾對生活的深刻洞察和睿智的思考。
二是豪邁,這可從《念奴嬌·赤壁懷古》詞中體現(xiàn)出來:“大江東去,浪淘盡,千古風流人物。故壘西邊,人道是,三國周郎赤壁。亂石穿空,驚濤拍岸,卷起千堆雪。”這首詞展現(xiàn)了蘇軾的豪情壯志、英雄氣概和奔放激情。
三是“多情”,這可從《江城子》詞中體現(xiàn)出來:“十年生死兩茫茫,不思量,自難忘”等句。這首詞深情地描繪了蘇軾對亡妻的生死離別之痛和思念之情,展現(xiàn)了蘇軾多情的一面。
四是“灑脫”,這可從《定風波·莫聽穿林打葉聲》詞中體現(xiàn)出來:“竹杖芒鞋輕勝馬,誰怕?一蓑煙雨任平生。料峭春風吹酒醒,微冷,山頭斜照卻相迎。”在這首詞中,展現(xiàn)了蘇軾面對生活困頓時的灑脫與超然。
為了避免評價的錯誤,我還是借助林語堂先生的部分評語。林語堂先生認為,蘇軾是一個多才多藝、性格獨特的人物、一個無可救藥的樂天派、一個偉大的人道主義者、一個百姓的朋友、一個大文豪、一位在政治上專唱反調(diào)的人。林語堂先生還認為,蘇軾的作品充滿了智慧和幽默感,既表達了個人的情感,也反映了社會現(xiàn)實,體現(xiàn)了對人民生活的深切關懷;蘇軾的人格構成了他名氣的骨干,他的風格文章之美則構成了他精神之美的骨肉。[1]

二、從重復博弈看蘇軾跌宕起伏的人生
我們可以將蘇軾跌宕起伏的人生概括成三點。一是嶄露頭角的進士科考及兩次制科考試,策論文章深得宋仁宗的贊賞,被贊譽為“文章為天下所宗”;二是蘇軾的“三起三落”的人生;三是蘇軾用“心似已灰之木,身如不系之舟。問汝平生功業(yè),黃州惠州儋州。”概括自己跌宕起伏的人生。我們制成下圖,簡要概括。
下面,我們從囚徒困境重復博弈的視角,看蘇軾與司馬光、王安石與章惇之間的重復博弈。在分析之前,我們簡單介紹囚徒困境與囚徒困境重復博弈的四種策略。
囚徒困境是1950年由美國普林斯頓大學的數(shù)學家阿爾伯特·塔克(Albert Tucker)提出的。囚徒困境的基本思想是:個體合作得益大于不合作的得益,但個體最終選擇了不合作。囚徒困境揭示了集體面臨的困境:合作有利于個體,也有利于群體,但個體還是選擇不合作,個人做出理性選擇卻導致集體的非理性。
上面講的是一次囚徒困境,如果囚徒重復多次博弈呢?會有什么結(jié)果?博弈論專家通過實驗,發(fā)現(xiàn)了囚徒困境重復博弈的四種策略。
第一種是ALLC策略(All-or-nothing-cooperate-strategy),即不論對方是否選擇合作或者說合作過程中是否選擇背叛,自己永遠選擇合作。
第二種是ALLD策略(ALL-or-lose-Decision-making-strategy),就是在與合作者重復博弈中總是選擇不合作策略。
第三種是TFT策略(Titfor tat)可以稱為“一報還一報”策略?!耙粓筮€一報”策略是美國博弈論專家羅伯特·阿克塞爾羅德在《合作的進化》一書中首先提出的,其基本思想是:首輪選擇合作,然后根據(jù)對方的策略做出相同的回應。如果對方選擇合作,則自己繼續(xù)合作;如果對方選擇不合作/背叛,則自己選擇不合作/背叛。羅伯特·阿克塞爾羅德通過大量的實驗和分析,發(fā)現(xiàn)“一報還一報”策略具有四大優(yōu)點:善良性(不首先背叛)、可激怒性(對方背叛后實施懲罰)、寬容性(對方回歸合作后立刻恢復合作)以及清晰性(行為方式容易識別)?!耙粓筮€一報”策略通過“重復囚徒困境計算機程序博弈競賽”得到驗證,被認為在囚徒困境的重復博弈中是最好的策略。[2]
第四種是GTS策略(Grim-Trigger-strategy),也稱為觸發(fā)策略:首輪選擇合作,如果合作方選擇不合作/背叛,則自己永遠選擇不合作。

我們知道,中國歷朝歷代中,眾多王朝亡于黨爭。比如,東漢士大夫和貴族與宦官的黨爭,導致董卓進京,成為壓倒東漢滅亡的最后一根稻草;再如,唐朝牛李四十年黨爭,導致唐朝的政治生態(tài)造成了嚴重破壞;又如,北宋末期“新黨”“舊黨”之爭,四十年導致北宋覆滅;還如,明朝東林黨、閹黨等黨爭,為其最終滅亡埋下了伏筆。
我以為,蘇軾的持續(xù)被貶,一是黨爭之果,是制度設計問題;二是人生使然,是自身策略之錯。下面,我們通過蘇軾與司馬光、王安石與章惇看蘇軾重復博弈策略的錯誤。
先看蘇軾與司馬光的重復博弈策略。蘇軾與司馬光同屬“舊黨”。司馬光對蘇軾的成長和仕途有一定的提攜之恩,蘇軾兄弟參加賢良科考試時,司馬光是主考官。用“一報還一報”策略看,司馬光首先選擇了與蘇軾合作的策略,但蘇軾則拋棄了其父蘇轍的合作策略,選擇與司馬光先合作后不合作的策略。比如,司馬光主政,主張節(jié)流,強調(diào)通過節(jié)約開支來維護國家財政的穩(wěn)定的政策,而蘇軾先是站在司馬光的一邊,選擇合作,反對王安石的變法;隨后又反對司馬光政策,選擇與司馬光不合作或者說“背叛”的策略。從囚徒困境重復博弈策略看,蘇軾屬于“舊黨”成員,應該與“舊黨”保持合作的策略,但蘇軾是“舊黨”,但與“舊黨”既是合作者,又是不合作者或者說背叛者,這樣, “舊黨”最有效的策略就是ALLD策略了,就是堅持重復打擊的策略;可見,蘇軾被貶是邏輯的必然。
再看蘇軾與王安石的重復博弈策略。我們知道,蘇軾與王安石典型屬于“兩個陣營”,蘇軾屬于“舊黨”,王安石屬于“新黨”。蘇軾與王安石之爭本質(zhì)上是“新黨”與“舊黨”之爭。根據(jù)囚徒困境重復博弈策略,在“黨爭”問題上的重復博弈策略應該是有明確預期的,但不明此理之人自然為“黨爭”所傷。比如,李商隱早期受到牛黨重要人物令狐楚的賞識和提攜,他的才華得到了令狐楚的充分認可;但李商隱卻娶了李黨成員王茂元的女兒。從囚徒困境的重復博弈看,就是牛黨選擇與李商隱合作,但李商隱則選擇了背叛策略。牛黨必然會選擇ALLD策略,就是每次博弈都不合作,或者說,就是不給機會、就是打擊,李商隱終生壓抑與自己的重復博弈策略錯誤選擇有關(他的詩詞成就是另一個話題,此處不議)。
在指明蘇軾持續(xù)被貶首先是黨爭之禍,再看蘇軾與王安石黨爭中的策略之錯。王安石變法包括青苗法、保甲法、農(nóng)田水利法在內(nèi)的改革措施;想法很好、效果極差。如同把國企做大做強愿望極好,效果極差,就是低效與腐敗。蘇軾采用反對變法的策略,無疑是“舊黨”所希望的策略,自然自己成為新黨打壓和排擠的對象。問題在于,蘇軾在這場囚徒困境的重復博弈中,既反對新黨,選擇不合作策略;但又不完全認同舊黨某些做法,也采取不合作策略;這就導致“新黨”“舊黨”相繼選擇與蘇軾不合作策略,持續(xù)被貶,“黃州惠州儋州”就是黨爭之惡與策略之錯疊加導致的。
最后看蘇軾與章惇重復博弈的策略。早年,章惇對蘇軾極為推重,甚至曾致書蘇軾勸誡他慎言,可見章惇是采用與蘇軾合作的策略;在蘇軾因烏臺詩案面臨可能被殺頭的困境時,章惇挺身而出,四處奔走,怒懟宰輔王珪,為蘇軾說話,可見章惇選擇了ALLC的策略,就是持續(xù)與蘇軾持續(xù)合作的策略。隨后,章惇成為新黨干將,特別在掌權后,對舊黨人士采用ALLD的策略,就是對舊黨進行無情打壓,蘇軾自然也是被打壓對象。
三、在一個皇權時代,我們不僅要學蘇軾,更要學博弈策略
歷史上的黨爭主要是皇權政治的產(chǎn)物。在皇權政治下,皇帝擁有對全國資源的控制和管理權,包括行政、軍事、立法、文教等大權?;蕶啾厝恍纬刹煌狞h派和利益集團。這些黨派為了爭取皇權的青睞和自身的利益,自然展開激烈的爭斗,從而形成黨爭,就形成博弈,形成囚徒困境的重復博弈。此外,獨裁者通常在追求個人權力最大化的同時,利用不同派系之間的斗爭來削弱潛在的對手或分散反對者的注意力。
我們知道,博弈就是Game Theory,就是一個局。局就是王朝、就是皇上、就是獨裁者。在這個局中,黨爭也好,新黨舊黨也好,司馬光、王安石、章惇,還是蘇軾也好,不過是這個局的棋子;如同體制內(nèi)地成員都是體制內(nèi)的棋子一樣。
雖然在皇權或極權政治下,我們都是局中的棋子,但我們還是可以向蘇軾學習很多。一是學習蘇軾樂觀豁達的人生態(tài)度。他一生經(jīng)歷了許多政治風波和人生坎坷,但始終保持著樂觀向上的精神風貌;二是學習蘇軾堅忍不拔的毅力。他一生都在追求真理和美好,不斷超越自我,即使在遭受打擊和困境時,他也沒有放棄自己的夢想和追求,努力前行;三是學習蘇軾的人性關懷。他關注民生疾苦,關心社會進步,具有強烈的社會責任感和使命感。
但是,在皇權或極權時代,我們僅僅學習蘇軾的樂觀豁達的人生態(tài)度、堅韌不拔的毅力與人性關懷是遠遠不夠的。
我想,學習博弈思維,首先,可以處理好“道”與“術”的關系。中國傳統(tǒng)的儒家知識分子都有“橫渠四句”的情懷,但沒有實現(xiàn)“橫渠四句”的思維,而博弈思維正好是踐行“橫渠四句”的有效思維;其次,學習博弈思維,能有效地處理好人與人的關系,處理好自己與集體/團隊的關系,在與合作者進行有效的競爭與合作中,在尊重合作者最大得益的前提下,尋求自身的最大利益;再次,學習博弈思維,特別是學習囚徒困境重復博弈策略,就是認識到囚徒困境是群體無法消除的困境,只能通過重復博弈才能逐步形成穩(wěn)定的合作關系,而“一報還一報”則是最好的策略;最后,博弈思維就是制度分析與人性分析結(jié)合的思維,我們既要考慮制度的優(yōu)化,也要考慮到一次博弈導致的人性之惡與重復博弈中的人性之善。特別要善于在不同制度環(huán)境下,面對不同的博弈方,采用囚徒困境重復博弈中的不同的策略。
德成動態(tài)