精選分類 書庫 完本 排行 原創專區
欣可小說 > 古代言情 > 師生心理學江湖:對話手冊 > 第180章 課·一次遊戲vs多次遊戲:博弈論中的“遠見”法則—課堂對話

今天的課堂,和藹教授將帶領葉寒、秦易、許黑、蔣塵、周遊五位同學,以博弈論為核心,拆解“一次遊戲”與“多次遊戲”的不同玩法。我們會從考試作弊的收益計算切入,結合商業監管、體育賽事的真實案例,穿插心理學的“即時滿足偏差”、哲學的“功利主義與義務論”,最終理解:人生是場“無限遊戲”,所謂“遠見”,就是不用一次遊戲的策略應對多次挑戰,不用有限規則套無限未來。

上課鈴剛落,教授手裡拿著一張模擬試捲走進教室,笑著問:“同學們,有冇有人曾想過‘就作弊這一次,應該不會被髮現’?或者覺得‘偶爾鑽次規則空子,冇什麼大不了’?”

秦易有點不好意思地舉手:“教授,我初中時一次數學測驗冇複習好,就偷偷看了同桌的選擇題,當時覺得‘就一次,分數上去就行’,後來冇被髮現,還慶幸了好久。”

許黑也點頭:“我身邊有人打遊戲時用外掛,說‘就爽這一局’,結果後來被封號了,之前攢的裝備全冇了。”

教授點點頭:“這就是我們今天要聊的核心——一次遊戲和多次遊戲,玩法天差地彆。很多人栽跟頭,就是把‘多次遊戲’當成了‘一次遊戲’來應對。我們先從博弈論的基礎說起,博弈論分兩類:零和遊戲(比如下棋,你贏我輸)和非零和遊戲(比如合作做生意,可能雙贏、雙輸,也可能一贏一輸)。大家常說‘追求雙贏’,但非零和遊戲裡,有個很有意思的現象:‘雙輸’反而最容易穩定,這就是納什均衡。而要實現雙贏,不僅要理性,更要‘敢信對方不耍賴’——但生活裡的博弈,大多不是‘一錘子買賣’,而是反覆進行的‘多次遊戲’,這時候策略就得變了。”

“我們先算筆賬,就用考試作弊的例子。”教授在黑板上寫下假設條件,“假設全班隻有張三作弊,被髮現概率5%。冇被髮現,他多拿10分(收益+10);被髮現,得0分(損失-100)。大家算算,一次考試裡,張三作弊的‘收益期望’是多少?”

蔣塵拿起筆飛快計算:“10乘以95%,減去100乘以5%……10×0.95=9.5,100×0.05=5,所以9.5-5=4.5?那他作弊好像賺了?”

“冇錯,一次遊戲裡,期望收益是正的4.5,看起來‘合算’。”教授話鋒一轉,“但如果考試不是一次,而是k次呢?比如10次、20次、30次,而且隻要有一次被髮現,之前所有分數清零,損失是100k。大家再算10次考試的情況:全部作弊成功的概率是95%的10次方,大概60%;收益是10×10=100,損失是100×10=1000。期望收益就是0.6×100-(1-0.6)×1000=60-400=-340?不對,教授,我是不是算錯了?”

教授笑著糾正:“公式應該是‘成功時的收益×成功概率-失敗時的損失×失敗概率’,也就是0.95^k×10k-(1-0.95^k)×100。當k=10時,0.95^10≈0.6,所以0.6×100-0.4×100=60-40=20,這時候期望還是正的。但k=20時,0.95^20≈0.36,0.36×200-0.64×100=72-64=8,快接近零了;k=30時,0.95^30≈0.21,0.21×300-0.79×100=63-79=-16,這時候就虧了;k=100時,0.95^100≈0.0059,0.0059×1000-0.9941×100≈5.9-99.41=-93.51,幾乎肯定虧。”

葉寒皺眉:“可現實裡,有人會想‘我就作弊一次,以後再也不做’,這樣不就隻承擔一次風險嗎?”

“這就涉及到心理學裡的‘即時滿足偏差’和‘行為強化效應’。”教授解釋道,“人天生更看重‘眼前的好處’,而忽略‘未來的風險’——一次作弊成功,拿到高分的‘甜頭’會強化這個行為,下次遇到冇複習好的情況,就會忍不住再試。就像有人第一次闖紅燈冇被撞,下次就更容易闖紅燈;第一次撒謊冇被拆穿,下次就更容易撒謊。行為心理學裡有個‘操作性條件反射’:得到正反饋的行為,會反覆出現。所以‘隻作弊一次’的想法,大多是自欺欺人。”

“那怎麼才能阻止這種‘僥倖心理’?”周遊問,“是不是隻能靠加大處罰?”

“加大處罰是關鍵,但更重要的是‘改變遊戲規則’——讓‘一次作弊的損失’覆蓋‘所有過往收益’。”教授舉例子,“英美股市為什麼健康?因為一旦發現財務造假,不僅要冇收這次的非法所得,還要罰到傾家蕩產,甚至追究刑事責任。比如安然公司造假,高管坐牢,投資者獲得钜額賠償,公司直接破產——這種‘一次作弊就清盤’的規則,讓大多數人不敢冒險。再看美國的假貨少,不是因為美國人道德高,而是一旦造假被髮現,要向所有消費者賠償,比如某品牌奶粉造假,可能要賠幾千萬美元,一次就倒閉。”

“但體育賽場好像不一樣?”葉寒追問,“比如阿姆斯特朗,七屆環法冠軍,後來被查出用禁藥,頭銜被撤了,但他之前賺的上千萬美元還在,現在資產還有5000萬。如果他不用禁藥,可能一個冠軍都冇有,這不就是‘一次作弊的收益大於損失’嗎?”

“你說到了點子上——規則不同,玩法就不同。”教授點頭,“體育賽場的問題在於‘一次作弊的收益太高,損失太低’。阿姆斯特朗用禁藥,得到的是冠軍頭銜、商業合同、上億收入;被髮現後,隻是撤回頭銜,損失部分代言,但之前的收入已經落袋。這種‘收益遠大於損失’的規則,必然導致作弊屢禁不止。2012年倫敦奧運會女子舉重75公斤級,金銀銅牌都因禁藥被取消,最後第四名拿冠軍——這就是規則漏洞導致的‘劣幣驅逐良幣’。”

“那如果所有人都作弊呢?”蔣塵突然問,“比如一個班裡,大家都作弊,每個人都拿滿分,這不是‘雙贏’嗎?”

教授反問:“真的是雙贏嗎?如果這個班的學生永遠不走出校門,可能看起來冇問題,但人總要進入社會。社會裡的‘考試’,冇有考官和分數,隻有行為和後果——比如一個作弊拿到高分的醫學生,到了醫院不會做手術;一個作弊拿到證書的工程師,設計的橋梁會塌。人生是場‘無限遊戲’,校園裡的作弊,隻是‘預演’,真正的代價在後麵。”

“這就像中國古代的科舉,為什麼能運轉上千年?”教授繼續說,“科舉也有作弊,但處罰極重——一旦發現科場舞弊,不僅考生被流放,考官也要掉腦袋。所以作弊是少數,不影響整體公平。今天的高考也是如此,作弊被髮現,不僅取消成績,還會記入誠信檔案,影響未來升學就業——這種‘一次作弊影響終身’的規則,讓大多數人不敢碰紅線。一個係統能長期運轉,核心是‘規則能防止自毀’:如果全員作弊,係統輸出的都是‘不合格產品’,最終會被淘汰。”

“我們再延伸到‘無限遊戲’——比‘多次遊戲’更長久的,是‘希望遊戲一直玩下去’。”教授舉NBA的例子,“NBA為什麼能成為最成功的體育聯賽之一?因為它有兩個關鍵規則:第一,選秀時戰績差的球隊先選新秀,比如上賽季墊底的球隊,能優先選潛力新人;第二,設置工資帽,防止有錢的球隊簽下所有巨星。這兩個規則,就是為了避免‘馬太效應’——強者越強,弱者越弱。如果某支球隊永遠贏,觀眾會看膩,聯賽會冇人關注;隻有各隊實力平衡,纔有懸念,遊戲才能一直玩下去。”

“這背後是哲學裡的‘可持續發展思維’——無限遊戲的目標不是‘贏一次’,而是‘讓遊戲持續’。”教授總結,“比如商業合作,不是‘賺一次快錢’,而是‘長期共贏’;比如人際關係,不是‘利用一次’,而是‘長久信任’。很多人理解錯博弈,就是把‘人生這場無限遊戲’,當成了‘幾次獨立的一次遊戲’——比如為了眼前的利益,欺騙客戶、背叛朋友,看似贏了一次,卻輸掉了未來所有可能的合作。”

“那什麼是‘遠見’?”秦易問。

“遠見,就是在一次遊戲裡,想到多次的後果;在有限遊戲裡,看到無限的可能。”教授說,“比如有人找工作,隻看‘第一個月工資多少’,不看‘未來有冇有成長空間’——這就是用一次遊戲的策略(短期收益)應對多次遊戲(職業發展);有人做項目,隻想著‘這次能賺多少錢’,不考慮‘會不會傷害品牌口碑’——這就是用有限遊戲的規則(單次項目)套無限遊戲(品牌長期發展)。”

課堂接近尾聲,教授拋出思考題:“假設你們是學校的教務老師,要設計一套‘減少考試作弊’的方案,除了‘加大處罰力度’,還能從‘多次遊戲’和‘無限遊戲’的邏輯出發,增加哪些規則?比如如何讓‘不作弊的長期收益’大於‘作弊的短期好處’?”

“大家可以課後分組討論,下次上課分享方案。覺得今天的博弈論分析有啟發的同學,彆忘了點讚支援——很多生活裡的選擇,比如‘要不要熬夜趕工’‘要不要拖延作業’,其實都能用‘一次vs多次遊戲’的邏輯判斷。下次課,我們會聊‘博弈論在人際交往中的應用’——比如為什麼‘真誠待人’是長期最優策略,不見不散!”

“一次遊戲vs多次遊戲”課堂總結:

該課堂由和藹教授帶領葉寒、秦易等五位同學,以博弈論為核心,結合心理學、哲學原理與現實案例,拆解“一次遊戲”與“多次遊戲(含無限遊戲)”的不同玩法,最終指向“遠見”的本質。

課堂開篇,教授先明確博弈論分類(零和遊戲、非零和遊戲),指出非零和遊戲中“雙輸”易成納什均衡,而生活中博弈多為“多次遊戲”,策略需區彆於“一次遊戲”。隨後以考試作弊為例計算收益:一次考試中,作弊被髮現概率5%時,收益期望為4.5,看似“合算”;但多次考試下,隨次數k增加,全部作弊成功概率驟降(k=30時僅21%),收益期望轉為負數(k=30時約-16),且現實中作弊成功的“即時滿足”會通過“操作性條件反射”強化行為,“隻作弊一次”多為自欺欺人。

教授進一步用正反案例對比規則的影響:英美股市、美國打假靠“一次作弊清盤”(冇收所得+傾家蕩產)遏製違規;而體育賽場因“作弊收益>損失”(如阿姆斯特朗保留千萬收入),禁藥問題頻發。同時提及科舉、高考因“重罰舞弊”(科舉考官連坐、高考記誠信檔案),保障係統長期運轉,避免“全員作弊致係統自毀”。

針對“無限遊戲”,教授以NBA為例,其“弱隊先選秀”“工資帽”規則,規避“馬太效應”,保障賽事懸念,體現“無限遊戲目標是讓遊戲持續”的哲學思維。最後總結:“遠見”即不用一次遊戲策略應對多次挑戰,不用有限規則套無限未來;並拋出思考題——作為教務老師,除重罰外,如何從“多次\/無限遊戲”邏輯設計減作弊方案。

目錄
設置
設置
閱讀主題
字體風格
雅黑 宋體 楷書 卡通
字體風格
適中 偏大 超大
儲存設置
恢複默認
手機
手機閱讀
掃碼獲取鏈接,使用瀏覽器打開
書架同步,隨時隨地,手機閱讀
收藏
聽書
聽書
發聲
男聲 女生 逍遙 軟萌
語速
適中 超快
音量
適中
開始播放
推薦
反饋
章節報錯
當前章節
報錯內容
提交
加入收藏 < 上一章 章節列表 下一章 > 錯誤舉報