特级黄国产片一级视频播放,精品福利视频综合一区二区三区四区,免费人成在线观看网站,亚洲免费99在线

<menu id="gkyya"><noscript id="gkyya"></noscript></menu>
  • <strike id="gkyya"><source id="gkyya"></source></strike>
  • <rt id="gkyya"><code id="gkyya"></code></rt>
  • 歡迎來到優(yōu)發(fā)表網(wǎng)!

    購物車(0)

    期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

    博弈論方法范文

    時間:2023-08-21 16:58:22

    序論:在您撰寫博弈論方法時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

    博弈論方法

    第1篇

    關(guān)鍵詞:博彝論公選課;教學內(nèi)容與方法改革;措施

    中圖分類號:G420 文獻標志碼:A 文章編號:1002-0845(2012)01-0042-03

    博弈論是當代西方經(jīng)濟學體系中最重要的理論課之一,其應(yīng)用前景非常廣泛。幾乎所有社會科學領(lǐng)域中都活躍著與博弈論交叉的分支學科,為滿足當代大學生對博弈論知識的需求,高校加強博弈論公選課建設(shè)迫在眉睫。鑒于此,筆者面向全校開設(shè)了“博弈論與諾貝爾經(jīng)濟學獎”和“博弈問題及其啟示”兩門通識選修課程。

    一、博弈論公選課教學中存在的問題

    由于博弈論與經(jīng)濟學、管理學和數(shù)學等學科有著十分密切的關(guān)系,所以國內(nèi)本科院校的博弈論課程主要面向經(jīng)濟、金融、管理或數(shù)學專業(yè)開設(shè),教學的對象通常是本專業(yè)或本學科相關(guān)專業(yè)的學生,很少面向全校開設(shè)公選課,這主要緣于以下兩個方面的原因:第一,博弈理論的建立只有六七十年的歷史。國內(nèi)高校博弈論課程開設(shè)時間最長的也不到十年,上述情況導(dǎo)致了課程建設(shè)的經(jīng)驗不足、水平不一。第二,研究博弈理論往往需要借助數(shù)學的方法,所以,博弈論課程的講授與學習離不開數(shù)學工具和經(jīng)濟學知識,課程內(nèi)容不得不受制于較高的知識門檻。因而,國內(nèi)博弈論公選課的建設(shè)尚處于起步階段。

    筆者在連續(xù)四個學期開設(shè)博弈論公選課后發(fā)現(xiàn),該課程教學中存在的主要問題如下:

    1 學生問的差異較大

    由于博弈論公選課面對的本科生縱跨二、三、四三個年級。橫跨本校全部學科的所有專業(yè),導(dǎo)致學生的認知平臺和知識面存在較大差異,學習目的和價值取向呈現(xiàn)出多元性,學生在學習態(tài)度、學習習慣和學習能力方也存在較大差別。

    2 理論學習需要有一定的經(jīng)濟學基礎(chǔ)和數(shù)學基礎(chǔ)

    博弈論是從經(jīng)濟學的角度提煉出個體最優(yōu)決策問題后,利用數(shù)學模型對其進行描述,再運用數(shù)學工具對其理論進行研究。2007年的諾貝爾經(jīng)濟學獎得主羅杰?邁爾森(Roger B.Myerson)認為,“博弈論是對理人或決策者之間相互沖突及合作的數(shù)學模型進行的研究”。雖然博弈論具有廣泛的應(yīng)用范圍和較強的解釋能力。但它的標準表達是函數(shù)形式和集合論形式的,研究方法和分析過程依賴于數(shù)學工具。所以,學習博弈論既要有相關(guān)的經(jīng)濟學知識,又要有一定的數(shù)學基礎(chǔ)。正因如此,學生在公選課中接觸博弈論時會覺得比較抽象。

    3 課程的知識容量受限

    為了照顧學生差異,筆者在教學過程中會盡可能詳細地為學生進行講解,因而不得不壓縮知識的容量,這導(dǎo)致了一部分經(jīng)濟學和數(shù)學基礎(chǔ)較好的學生“吃不飽”的問題。筆者嘗試通過布置課后練習的辦法來解決這一問題,但效果不是很明顯。或許一個不可回避的重要原因是,有限的課余時間和較快的學習節(jié)奏限制了多數(shù)學生對公選課知識的進一步學習。

    4 缺少合適的教材

    缺少合適的教材也是博弈論公選課教學中存在的主要問題之一。筆者認為,博弈理論的應(yīng)用性和公選課內(nèi)容的時效性是激發(fā)學生學習興趣的、切入點,教材的編寫應(yīng)將二者有機結(jié)合起來,方能發(fā)揮最大的功效,然而目前的教材往往只能體現(xiàn)前者卻難以涵蓋后者。

    二、課程內(nèi)容與教學方法改革的措施

    1 抓住學生的共性

    大學生具有強烈的關(guān)注現(xiàn)實問題的意愿,對社會熱點問題表現(xiàn)出極高的興趣,尤其在理解焦點問題時具有很強的可塑性和認知共性。因而應(yīng)牢牢抓住這一共性,迎合學生在知識需求上的實用化和功利化的特點,從當前豐富的信息資源中尋找承載博弈論知識的現(xiàn)實問題,以期收到事半功倍的教學效果。在教學實踐中,筆者把豐田汽車賠償、西南五省大旱、相親類節(jié)目“非誠勿擾”、2008股市大跌等現(xiàn)實熱點都搬上了講臺。下面,筆者就通過教學實例進行說明。

    在講授2005年諾貝爾經(jīng)濟學獎得主托馬斯?謝林(Thomas C.Schelling)的博弈承諾及其可信性概念時,筆者以制定《反國家分裂法》為典型案例進行分析。由于祖國統(tǒng)一問題是所有國人關(guān)心的國家大事,大學生也不例外,所以講授過程非常順利,以致學生在課后反饋中把這一案例列為講授最成功的部分。接著,為了講解如何應(yīng)用可信承諾處理現(xiàn)實問題,筆者選擇了電視連續(xù)劇《老大的幸福》第四集中的一個視頻片段,進一步強化了知識點。實踐證明,人物生動的形象在給課堂增添活躍氣氛的同時,也很好地承載了傳遞知識的作用,以縮影的形式把可信承諾的概念和應(yīng)用可信承諾策略的方法植入了學生的頭腦中。最后,筆者以拆遷補償合同簽訂中的一種可信承諾策略為例,對本節(jié)課進行了總結(jié),并請學生加以點評。由于拆遷問題是當前社會的焦點問題,所以學生對點評表現(xiàn)出極大的興趣。這樣,通過抓住學生的認知共性,展示了可信承諾策略在焦點問題上能夠?qū)⒘觿葑優(yōu)閮?yōu)勢的強大作用,成功地引導(dǎo)學生了解并掌握了博弈承諾及其可信性概念。

    2 增強主題的典型性和知識模塊的簡潔性

    以經(jīng)典博弈問題為主題有利于組織素材、選擇教學內(nèi)容;簡潔地安排知識模塊、弱化知識的層次性有利于照顧各類學生在知識面、綜合能力和認知水平上的差異;少而精地選擇課程內(nèi)容有利于突出重點;多角度地反復(fù)講解有利于降低知識門檻,提高學習的效果。

    例如,在主題選擇上,筆者以多數(shù)學生熟知的“囚徒困境”作為第一主題;以試驗性強、易于展開的“理性基礎(chǔ)和有限理性”作為第二主題;以現(xiàn)實性突出的“重復(fù)動態(tài)博弈”作為第三主題。由于“囚徒困境”與經(jīng)濟學中的“理性人假設(shè)”密不可分,所以第一主題既能讓學生感受到博弈問題的趣味性和深刻性,又能激發(fā)他們對該主題的進一步思考,使他們逐漸認識到“理性人假設(shè)”所具有的超越現(xiàn)實、過于理想的特性,從而部分地為第二和第三主題做好鋪墊。另外,有大量關(guān)于“囚徒困境”和理性問題的課外資料易于獲得,這為學生在課程初期進行興趣驅(qū)動的導(dǎo)讀創(chuàng)造了條件。

    在知識模塊設(shè)置上,筆者采取“自成模塊、減少關(guān)聯(lián)”的策略。例如,針對非常重要的“信息不對稱”主題,我們選擇了以二手車市場為核心,構(gòu)建了包含藥品市場、電腦市場和就業(yè)市場等典型主題的知識模塊。一方面,這些市場為學生所熟知,易于接受;另一方面,這些市場中包含著非常典型的“信息不對稱”因素,因而通過對市場現(xiàn)象的自然描述完全可以弱化學生對經(jīng)濟學市場知識的依賴。為了弱化知識的層次性,突出重點內(nèi)容,筆者舍棄了理論體系中的某些知識模塊,例如“海薩尼轉(zhuǎn)換”、“斯賓塞信號傳遞模型”和“斯蒂格利茨信息甄別模型”等。

    3 重視案例應(yīng)用,尤其應(yīng)重視與諾貝爾經(jīng)濟學獎得主有關(guān)的案例

    博弈論有一個顯著特點,那就是它“聲名顯赫”,并且與

    諾貝爾經(jīng)濟學獎的關(guān)系密切。許多諾貝爾經(jīng)濟學獎得主都曾涉足博弈論領(lǐng)域,在博弈論的建立和發(fā)展中直接或間接做出過貢獻?!懊曉谕狻睘椴┺恼摴x課的開設(shè)提供了有利條件,也為課程的講授提供了獨特的視角和豐富的素材。正因如此,筆者才面向全校開設(shè)了博弈論與諾貝爾經(jīng)濟學獎公選課。下面,以1994年諾貝爾經(jīng)濟學獎得主約翰?福布斯?納什(John Forbes Nash Jr.)為例,詳細說明如何應(yīng)用與諾貝爾經(jīng)濟學獎得主有關(guān)的案例以及這樣做的優(yōu)點。

    納什是博弈理論發(fā)展的劃時代人物,納什均衡是博弈論的核心概念,兩者都是公選課中必須包含的內(nèi)容。為此,筆者設(shè)計了以下三個環(huán)節(jié):1)借助“囚徒困境”和“情侶博弈”講授納什均衡及其不唯一性;2)播放電影《美麗心靈》,并進行討論和點評;3)布置以納什為主題的案例設(shè)計作業(yè),讓同學在課堂上演講。第一部分是講解的重點,講好納什均衡意味著博弈論課程成功了一半。第二部分可以把人格培養(yǎng)和素質(zhì)教育有效融合起來?!睹利愋撵`》不僅能讓人體悟到學生心靈中因愛而生的溫暖,還能給出人生原本就是一場博弈的警示,體現(xiàn)出“大人物小故事”的精髓??v然納什這樣的天才也有無法擺脫的困境,何況他人?所以,在人生的博弈中,既要承認能力的差異,又要找尋屬于自己的色彩。同時還應(yīng)看到,縱然如納什般為頑疾所纏都可以逐漸康復(fù),何況其他挫折?所以,要以積極、樂觀、健康的心態(tài)對待人生,要終身學習而不輕言放棄!第三部分是對學生的啟發(fā)環(huán)節(jié)。該環(huán)節(jié)不僅要培養(yǎng)學生對本課程的興趣,加深學生對知識的理解,還要通過為其提供上臺演講、展示成果的機會,鍛煉他們的邏輯思維能力和表達能力。值得一提的是,很多學生在設(shè)計案例時自學了有名的“智豬博弈”和“戀愛博弈”等經(jīng)典模型,鞏固了納什均衡概念,還有學生甚至對納什曾經(jīng)設(shè)計過的一種“六連棋”博弈游戲(筆者對此也知之甚少)進行了分析。

    4 重視學科交叉,尤其應(yīng)重視學科交叉視闕下的學術(shù)前沿成果

    博弈論已逐漸成為一門為諸多學科提供思維方法和分析技巧的學問,可以說,所有與生命有關(guān)的學科都蘊藏著博弈論的應(yīng)用空間。在公選課中,應(yīng)重視從學科交叉的視角供給知識,廣泛培養(yǎng)各專業(yè)學生對課程的興趣。例如,筆者選擇生物演化理論和博弈論交叉所產(chǎn)生的演化博弈論作為知識模塊,以人類社會的同性戀演化作為典型主題,挑選最前沿的學術(shù)研究案例作為教學的主要內(nèi)容為學生進行講解,擴展了學生的知識面。

    在演化博弈論的開創(chuàng)性著作《演化與博弈論》一書中,作者約翰?梅納德?史密斯(JohnMaynardSmith)用精妙的語言、深入淺出的分析和豐富有趣的案例把博弈論的思想融入到生物演化中,推動了對“動物為什么如此”這一問題的深入研究,揭示了動物群體行為演變的動力學機制。筆者首先以“哺乳動物一雄多雌”案例作為引導(dǎo),簡單介紹演化博弈論在性選擇和性別比問題上的研究視角以及邏輯結(jié)構(gòu),然后立刻引出了人類面臨的一個有關(guān)性的問題――同性戀演化主題下的性問題:從進化論的角度來看,男男同性戀的存在完全沒有任何意義,這是因為同性戀相比于異性戀而言成功繁殖后代的可能性太小,那么為什么同性戀的基因沒有被淘汰?顯然,這一問題接近現(xiàn)實熱點,對學生極具誘惑力,而且還具有很強的學術(shù)延伸性。為了講解同性戀基因延續(xù)的演化博弈機制,筆者借助2010年2月24日美國心理科學雜志上發(fā)表的關(guān)于薩摩亞島上男男同性戀的最新研究成果,利用最前沿的學術(shù)案例詳細分析了“親族選擇”假說下的演化博弈機制。教學實踐表明,通過這樣的內(nèi)容設(shè)計,來自不同專業(yè)的學生的學習興趣都被調(diào)動起來,加深了他們對博弈論的理解,順利實現(xiàn)了教學的目標。

    5 重視開放性,尤其應(yīng)重視教學信息交流反饋的開放性

    信息交流有利于幫助學生鞏固所學內(nèi)容,讓有興趣的學生通過查閱相關(guān)資料,獲得知識上的感悟和能力上的提升,并逐步脫穎而出。信息反饋有助于教師突出教學的亮點,發(fā)現(xiàn)教學中存在的不足,以便在今后的教學中加以改進。

    教學實踐中,筆者讓學生通過電予郵件的形式反饋“課堂心得”,并要求他們回答以下三個問題:

    (1)這次課對你影響最深或最成功的是哪部分?

    (2)最失敗或可有可無的又是哪部分?

    (3)對本次課你有什么意見和建議?

    這三個問題一方面可以督促學生對課堂內(nèi)容加以回顧、梳理,另一方面,又可以從中發(fā)現(xiàn)筆者在教學中存在的不足之處。事實上,在交流和反饋中,許多同學都針對課程的內(nèi)容、進程和教師的教學習慣、技能等提出了中肯的批評和建議,幫助教師提高教學水平。這些批評和建議包括“講課的速度有點偏快”、“思考時間較少”、“有些理論過于深奧”、“希望針對時事展開分析”、“希望多些互動”、“理論是需要加強的”等,當絕大多數(shù)學生贊成“少一點數(shù)學知識”并希望“講得詳細點”時,筆者采納了這一建議,并列出了幾本偏重數(shù)學工具的參考書讓那些“吃不飽”的學生自學。

    學生給予的溫馨鼓勵也讓筆者感覺“很給力”。例如,“本節(jié)課內(nèi)容很充實,希望老師保持下去”、“老師的努力我們都看到了,希望老師以后做得更好”等話語激勵著筆者,使筆者能夠維持濃厚的教學熱情使其永不衰減,并且有信心進一步提高自身的專業(yè)能力,挑戰(zhàn)自我的職業(yè)水平。

    教學探索與實踐的過程是循序漸進的過程,學生在這一過程中所起到的作用是巨大的。只要教師能夠及時、充分地了解學生的需求,不斷總結(jié)、深化課程教學改革的經(jīng)驗,就一定能取得更大的成效。

    三、下一步的設(shè)想

    筆者秉承“以人為本,以學生的發(fā)展為中心”的教育理念,希望博弈論公選課能為學生打開“半”扇窗,培養(yǎng)他們對博弈理論的興趣,激發(fā)學生課后自主學習的潛能,做到既為學生提供基本知識,又幫助學生脫穎而出。

    教學實踐表明,的確有不少學生通過自主學習脫穎而出。以下是某學生的反饋:“最近看了一本《博弈三國》,該書用博弈論的方式對三國故事進行解析,感覺博弈論有一種奇妙的功能,就是能把復(fù)雜問題簡單化,而且解析后的過程、緣由都一清二楚了?!备袑W生覺得自己“在研究中發(fā)現(xiàn)了對自己有用的東西,受益匪淺”。也有在深入思考后對教學內(nèi)容提出反詰者:“從平常感知上來說,同性戀的基因遺傳與博弈基本無關(guān)……博弈是一種研究競爭參加者為爭取最大利益應(yīng)當如何做出決策的數(shù)學方法……無法說這樣一種與母系基因聯(lián)系較為緊密的基因遺傳行為可以用博弈的方式去解決,只能說同性戀的基因遺傳在某種程度上體現(xiàn)了社會的平衡態(tài)。”不管這些反饋的具體情境如何,它們至少說明,應(yīng)從公選課的現(xiàn)實性、延伸性、前沿性和開放性出發(fā),強化學生的共性。弱化學生的差異性,充分利用教學內(nèi)容的充實性和教學方法的靈活性,謹慎且大膽地進行教學改革,為滿足高等教育通識選修課的教學需求,進一步提高教學的水平與質(zhì)量,提供一些思路和經(jīng)驗。

    第2篇

    納什均衡是現(xiàn)代博弈論中的核心內(nèi)容和重要基礎(chǔ),許多理論研究和應(yīng)用都是圍繞這一基本理論展開或與此相關(guān)的。隨著博弈論的發(fā)展和博弈研究的不斷深入,人們意識到這種理論和日常經(jīng)濟生活的聯(lián)系越來越緊密。博弈論可以揭示眾多經(jīng)濟問題內(nèi)在規(guī)律和根源,幫助人們分析經(jīng)濟關(guān)系,認識經(jīng)濟現(xiàn)象,評判經(jīng)濟效率,指導(dǎo)人們進行科學的經(jīng)濟決策,無論對企業(yè)等實際經(jīng)濟部門的經(jīng)營活動,還是對政府的管理和政策制度制定,博弈論都有重要的指導(dǎo)意義。要用博弈論解決現(xiàn)實經(jīng)濟中的決策問題,就必須解決博弈模型的理論抽象和架設(shè)與經(jīng)濟問題實際情況的差距等問題,而解決這些問題的關(guān)鍵在于如何運用數(shù)模的思想抽象出問題中的得益矩陣。本文在博弈論的核心內(nèi)容納什均衡的基礎(chǔ)上,介紹了純戰(zhàn)略納什均衡和混合戰(zhàn)略納什均衡的相關(guān)理論,針對日常生活中的污水排放問題進行了分析。

    二、納什均衡在經(jīng)濟生活中的具體運用――污水排放問題

    博弈的分類方法是多種多樣的。根據(jù)參與人的多少,可將博弈分為二人博弈和多人博弈;根據(jù)參與人是否合作,可將博弈分為合作博弈和非合作博弈;根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。一般地,將不允許存在有約束力協(xié)議的博弈稱為“非合作博弈”,與此相對,允許存在有約束力協(xié)議的博弈稱為“合作博弈”?!凹{什均衡”是非合作博弈理論中最重要的一個解概念。政府應(yīng)該怎樣治理污水排放是當今一個熱點,也是本文所探討的問題。政府和企業(yè)之間的關(guān)系可以運用經(jīng)濟學上的監(jiān)督博弈來處理。

    這個博弈的參與人包括政府和企業(yè),政府的戰(zhàn)略選擇是檢查或不檢查,企業(yè)的戰(zhàn)略選擇是排污或不排污。假設(shè)A1是企業(yè)治理污水(不排污)所增加的生產(chǎn)成本,如果排污的話,則可以將A1據(jù)為所有;A2是政府檢查所需成本;W是政府對企業(yè)排污所收取的罰款金額;G是企業(yè)排污所造成的污染而對社會利益的損害;假設(shè)W>A1,且W>A2+G,即政府對排污企業(yè)采取重罰措施。下表即為一個對應(yīng)不同戰(zhàn)略組合的得益矩陣。

    在得益矩陣中,用p代表檢查排污的概率,β代表企業(yè)排污的概率。給定p,政府檢查(p=1)和不檢查(p=0)的期望分別為:

    E(1,β)=(W-A2-G)γ+(-A2)(1-β)=(W-G)β+A2

    E(0,β)=-Bβ+0(1-β)=-Bβ

    由E(1,β)=E(0,β),得β*=A2/W??梢圆扇煞N舉措:

    采取重罰措施;即降低檢查成本A2。另外,給定政府檢查的概率θ,企業(yè)選擇排污(β=1)和不排污(β=0)的期望收益分別為:

    E1(p,1)=(A1-W)p+C1(1-p)=A1-W?p

    E1(p,0)=0

    由E1(P,1)=E(P,0)得P*=A1/G,即在現(xiàn)實經(jīng)濟中有許多企業(yè)和企業(yè)排污所取得的罰款金額W有關(guān),對排污的懲罰越重,企業(yè)因排污所獲得的生產(chǎn)成本越少,企業(yè)的排污概率就越小。

    實際上,政府在治理企業(yè)排污的時候,應(yīng)設(shè)法考慮收益權(quán)的收益問題。由于國民待遇的要求,不可能因企業(yè)性質(zhì)不同而采取不同的罰款數(shù)量。所以解決這個問題只能采用行政手段。

    同時也要注意地方政府在治理污水中的角色。首先,地方政府的行為要受制于中央政府既定的制度。其次,地方政府亦可親自組織創(chuàng)新或擔當起制度創(chuàng)新的重任。最后,地方政府是制度的推行維護者,對違法排污者實施重罰。

    三、主要結(jié)論和后續(xù)工作展望

    第3篇

    [關(guān)鍵詞]博弈論;理性人假定;公共知識;社會科學方法論

    [中圖分類號]C3

    [文獻標識碼]A

    [文章編號]1671-511X(2012)04-0020-03

    博弈論是研究理性人的互動的理論,或者說研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經(jīng)濟行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)應(yīng)用于經(jīng)濟領(lǐng)域,奠定了這一學科的基礎(chǔ)和理論體系。1950-1951年,約翰·納什利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅定的基礎(chǔ)。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動了博弈論的發(fā)展。因此,盡管博弈論是一門新生的學科,但是它今天已經(jīng)發(fā)展成為有較完善的理論體系的科學。

    今天,博弈論已經(jīng)成為社會科學的通用方法論。盡管它是演繹科學,對社會現(xiàn)象有強大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實際博弈結(jié)果存在差異。許多實驗經(jīng)濟學家通過博弈實驗研究實際中人們的博弈過程,分析博弈論的演繹解與博弈實驗結(jié)果之間的差異。如2002年諾貝爾經(jīng)濟學獎就頒發(fā)給了丹尼爾·卡尼曼和邁農(nóng)·史密斯,他們是實驗經(jīng)濟學的先驅(qū)。今天在西方學術(shù)界通過實驗來驗證博弈的理論結(jié)果已經(jīng)成為一種潮流。本文下面設(shè)計并進行了一個博弈實驗,通過分析實驗結(jié)果與理論解的差異,分析博弈論作為社會科學方法論的局限性,并提出改進的可能路徑。

    一、博弈實驗及結(jié)果分析

    1 實驗描述

    我們設(shè)計了如下的一個博弈實驗。該實驗的參與人是南京大學選修文化素質(zhì)課“邏輯與科學方法基礎(chǔ)”的大學生,他們是二三年級的學生,文理科學生均有。

    該實驗是以試題的形式進行的,該試題作為期末試卷中的最后一道題。該題目為:

    在0-100之間選擇一個數(shù)字,規(guī)則是:若你選擇的數(shù)字“是或最接近”在座同學所選擇的數(shù)字的平均數(shù)的2/3(即在座同學所選數(shù)的總和除以總?cè)藬?shù)之后所得數(shù)字的2/3,如:若平均數(shù)為90,你應(yīng)當選2/3×90=60),你將獲勝。請給出你選擇的理由。

    實驗說明:

    (1)實驗參與者即參加考試的學生,事前不知道這是一個實驗;

    (2)該課程教師以講座的形式給實驗參與者傳授過博弈論知識,但沒有提到所進行的博弈;

    (3)因為(2),他們中的大多數(shù)掌握“博弈”、“公共知識”等概念;

    (4)試卷是保密的,沒有任何學生預(yù)先知道考試內(nèi)容,考試過程中學生間無任何交流;

    (5)該博弈的理論解(即納什均衡)為0或1。

    2 實驗結(jié)果

    對于考試中的每個學生,在這個博弈實驗中他能夠獲勝的關(guān)鍵是,他要準確猜測他人是如何選擇的,一旦他猜測正確,他將他猜測的平均數(shù)乘以2/3便是獲勝答案。

    共有176人參加了考試。排除掉5個不明確的選擇,供分析的實際選擇數(shù)為171個(其中3個選擇非整數(shù))。實驗結(jié)果為(按照數(shù)字大小排序):

    “0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。

    3 結(jié)果分析

    在這些所選擇的數(shù)字中,最大的數(shù)字為75,最小的數(shù)字為0。171個數(shù)字相加后的平均數(shù)為21.91,本博弈勝出解:21.84×2/3=14.61。

    這個博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實驗中,0是所選最多的數(shù)字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。

    從上述數(shù)據(jù)可以看出,在這場博弈中,“實驗解”為14.61,最接近該數(shù)的是14或15,這和“理論解”的“0”或“1”不同。在本實驗中,沒有人選擇14,而選擇15的有3人,這3人是該實驗的勝出者。

    若按照區(qū)間來統(tǒng)計,實驗結(jié)果的分布情況見表1。本博弈實驗的“實驗解”14.61落在11-20之間。若我們把11-20看成是勝出區(qū)間,則有7人勝出。

    對于這些選擇,有以下值得注意的幾點:

    第一,67以上的選擇都是不理性的,因為參加考試的學生數(shù)為150-200之間,這是公共知識,即使所有的學生都選擇100,勝出的數(shù)字都不會超過67。但是還有3位學生選擇了大于67的數(shù)字,其中選擇的最大數(shù)為75。他們在給出這些選擇時沒有給出理由。

    第二,分析學生所給出這些選擇的理由,可以看出,絕大部分選擇者在進行他們的選擇時考慮到了他人的選擇以及他人的推理。不同的人對他人的假定不同,所進行推理的步驟也不同。如選擇67的學生假定了他人都選擇100,因而選擇67是最優(yōu)選擇;再比如選擇30-40之間的數(shù)字的同學,其理由大體上有兩個:或者認為平均數(shù)集中在50-60之間,其2/3就集中在35-40之間;或者認為都選100的話,66.7是最優(yōu)選擇,都選擇66.7的話,44是最優(yōu)選擇,而都選44的話,33是最優(yōu)選擇。

    第三,有三個區(qū)間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區(qū)間的選擇者考慮群體的互動推理的步驟存在差別,如0-10區(qū)間的選擇者考慮他人的推理步驟比31-40區(qū)間的選擇者多些。

    第四,值得注意的是,11-20區(qū)間里的選擇較少(事實上是,在這個博弈中所選擇的數(shù)字落在這個區(qū)間是最有可能勝出的)。原因可能是,一旦選擇者進行了多步的互動推理,他們便能夠?qū)⑦@樣的推理進行下去,從而將選擇向理論解0或1靠近。

    第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒有選擇理論解。盡管他們的選擇沒有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個。一位選擇22的學生是這樣給出他所選擇的理由的:“作為理性人,我不會選擇大于2/3×100的數(shù),因為即使所有人都選擇最大數(shù),平均數(shù)的2/3也不會超過2/3×100。如果大家和我一樣理智,那么大家都不會選擇大于2/3×100,那么我不會選擇大于100×2/3×2/3。因為他們選擇最大的他們可能會選的數(shù),平均數(shù)的2/3也不會超過2/3×2/3×100。依此類推,如果全班都充分理智,那么全班最終都會選擇1,然而我不認為班里的人都是足夠理智,故平均數(shù)的2/3會大于1。根據(jù)兩次游戲,平均數(shù)的2/3在20~30。如果是我,我會選擇靠近20的數(shù),那我就22吧。”一個選擇10的學生的理由是:“如果其他人都是隨機選擇,那么平均數(shù)最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數(shù),那么33為平均數(shù),33×2/3≈22……如此推理應(yīng)該為1。但是并非所有人均是理性、均會如此計算。我對南大有信心,所以,我將數(shù)字選得接近1一點,選10?!?/p>

    第六,有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由:“大家都認為60是及格分,所以我選擇59”,“58是我的幸運數(shù)字”,等等。

    二、博弈的理論解分析

    本實驗是一個多人完全信息靜態(tài)博弈:參與者同時選擇行動,然后根據(jù)所有參與者的選擇,每個參與者得到各自的結(jié)果,每一參與者的收益函數(shù)在所有參與者之間是公共知識。

    在這個實驗中,參加考試的176位學生是參與者,每個考生同時對0-100之間的數(shù)字進行選擇行動,即每個參與者的策略空間Si∈(0,100),即有101種可能的策略。根據(jù)所有考生的選擇,每個考生最后得出自己的結(jié)果,對每個考生來說,結(jié)果無非就是,自己的選擇是“大家所選數(shù)字的平均數(shù)的2/3”,勝出;要么與“大家所選數(shù)字的平均數(shù)的2/3”不一致,失敗。

    我們假定該博弈的參與人都是絕對理性人(事實上,這個要求在實際中難以達到,這也是本文要得到的一個結(jié)論)。

    我們來分析絕對理性人的推理過程。

    在這個博弈中策略組合有176×101種,每種策略組合下,每個人的收益是公共知識。如:如所有人都選100,平均數(shù)為100,此時每人都失敗,勝出結(jié)果是100×2/3=67;如175人都選100,有一個人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識。

    我們看到,任何人都不應(yīng)該選67或以上,或者選擇67或以上是非理性的,因為所選擇的數(shù)字的最大平均數(shù)為100,此時勝出的數(shù)字為67,因此選擇67以上而獲勝的可能性是沒有。因此,作為理性人他們都不會選擇67或以上。

    每個人都不會選擇67或以上,這本身也是公共知識。在這樣的公共知識的前提下,45以上的選擇都是不合理的,因為對每個人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。

    每個人都不會選擇45或以上,這本身也是公共知識。于是,每個人都認為不應(yīng)該選擇30或以上。

    ……

    結(jié)論是:每個人選擇0或1是合理的,它們是該博弈的理論解。

    事實上,每個人選擇0或都選擇1是納什均衡:對每個人而言,在其他人不改變選擇的情況下,當下的選擇是最優(yōu)的。

    在所有人均選擇0的情況下,因為對于每個人而言,若所有人都選擇0的話,0便成為平均數(shù),該數(shù)的2/3還是0。這樣,他選擇0是最優(yōu)選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點構(gòu)成納什均衡。

    在所有人均選擇1的情況下,同樣,對于每個人而言,在其他人選擇1的情況下,平均數(shù)1的2/3為0.67,此時1最接近該數(shù)。因此,他選擇1是最優(yōu)選擇,并且若他改變了他的選擇他將失敗。因此,這點也構(gòu)成納什均衡。

    當然,面對多個納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個博弈中,每個人要考慮的是,他選擇0還是選擇1才能勝出呢?

    他會這樣思考:沒有理由認為其中一個比另外一個更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數(shù)應(yīng)該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優(yōu)選擇。

    從上面的分析可見,盡管0和1是納什均衡點,但選擇。是最優(yōu)選擇。

    三、改進博弈論的可能路徑

    本文已經(jīng)表明,上述博弈是一個完全信息靜態(tài)博弈,然而,本實驗的實驗解(14.61)與理論解(0或1)之間發(fā)生偏離。本文認為,有兩個主要原因:

    第一,博弈論中所假定的理想主體與實際中的決策主體不相符合。理想的博弈參與人是絕對理性人;他們能夠進行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時完成的,而實際博弈中人們是有界理性的。在我們的博弈實驗中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應(yīng)當知道0和1是均衡解,也能夠預(yù)測O是最有可能實現(xiàn)的結(jié)果。本實驗表明,并不是所有人都能夠做出這樣分析的。并且,在實際中存在完全非理性的選擇,如本實驗中選擇大于67的3人,這不是完全偶然現(xiàn)象。

    第4篇

    一、抓住學生的共性

    大學生具有強烈的關(guān)注現(xiàn)實問題的意愿,對社會熱點問題表現(xiàn)出極高的興趣,尤其在理解焦點問題時具有很強的可塑性和認知共性。因而應(yīng)牢牢抓住這一共性,迎合學生在知識需求上的實用化和功利化的特點,從當前豐富的信息資源中尋找承載博弈論知識的現(xiàn)實問題,以期收到事半功倍的教學效果。在教學實踐中,筆者把豐田汽車賠償、西南五省大旱、相親類節(jié)目《非誠勿擾》、2008股市大跌等現(xiàn)實熱點都搬上了講臺。下面,筆者就通過教學實例進行說明。

    在講授2005年諾貝爾經(jīng)濟學獎得主托馬斯?謝林(Thomas C. Schelling)的博弈承諾及其可信性概念時,筆者以制定《反國家分裂法》為典型案例進行分析。由于祖國統(tǒng)一問題是所有國人關(guān)心的國家大事,大學生也不例外,所以講授過程非常順利,以致學生在課后反饋中把這一案例列為講授最成功的部分。接著,為了講解如何應(yīng)用可信承諾處理現(xiàn)實問題,筆者選擇了電視連續(xù)劇《老大的幸?!返谒募械囊粋€視頻片段,進一步強化了知識點。實踐證明,人物生動的形象在給課堂增添活躍氣氛的同時,也很好地承載了傳遞知識的作用,以縮影的形式把可信承諾的概念和應(yīng)用可信承諾策略的方法植入了學生的頭腦中。最后,筆者以拆遷補償合同簽訂中的一種可信承諾策略為例,對本節(jié)課進行了總結(jié),并請學生加以點評。由于拆遷問題是當前社會的焦點問題,所以學生對點評表現(xiàn)出極大的興趣。這樣,通過抓住學生的認知共性,展示了可信承諾策略在焦點問題上能夠?qū)⒘觿葑優(yōu)閮?yōu)勢的強大作用,成功地引導(dǎo)學生了解并掌握了博弈承諾及其可信性概念。

    二、增強主題的典型性和知識模塊的簡潔性

    以經(jīng)典博弈問題為主題有利于組織素材、選擇教學內(nèi)容,簡潔地安排知識模塊、弱化知識的層次性有利于照顧各類學生在知識面、綜合能力和認知水平上的差異,少而精地選擇課程內(nèi)容有利于突出重點,多角度地反復(fù)講解有利于降低知識門檻,提高學習的效率。

    例如:在主題選擇上,筆者以多數(shù)學生熟知的“囚徒困境”作為第一主題,以試驗性強、易于展開的“理性基礎(chǔ)和有限理性”作為第二主題,以現(xiàn)實性突出的“重復(fù)動態(tài)博弈”作為第三主題。由于“囚徒困境”與經(jīng)濟學中的“理性人假設(shè)”密不可分,所以第一主題既能讓學生感受到博弈問題的趣味性和深刻性,又能激發(fā)他們對該主題的進一步思考,使他們逐漸認識到“理性人假設(shè)”所具有的超越現(xiàn)實、過于理想的特性,從而部分地為第二和第三主題做好鋪墊。另外,有大量關(guān)于“囚徒困境”和理性問題的課外資料易于獲得,這為學生在課程初期進行興趣驅(qū)動的導(dǎo)讀創(chuàng)造了條件。

    在知識模塊設(shè)置上,筆者采取“自成模塊、減少關(guān)聯(lián)”的策略。例如:針對非常重要的“信息不對稱”主題,我們選擇以二手車市場為核心,構(gòu)建包含藥品市場、電腦市場和就業(yè)市場等典型主題的知識模塊。一方面,這些市場為學生所熟知,易于接受,另一方面,這些市場中包含著非常典型的“信息不對稱”因素,因而通過對市場現(xiàn)象的自然描述完全可以弱化學生對經(jīng)濟學市場知識的依賴。為了弱化知識的層次性,突出重點內(nèi)容,筆者舍棄了理論體系中的某些知識模塊,如“海薩尼轉(zhuǎn)換”“斯賓塞信號傳遞模型”和“斯蒂格利茨信息甄別模型”。

    三、重視案例應(yīng)用,尤其應(yīng)重視與諾貝爾經(jīng)濟學獎得主有關(guān)的案例

    博弈論有一個顯著特點,那就是它“聲名顯赫”,并且與諾貝爾經(jīng)濟學獎的關(guān)系密切。許多諾貝爾經(jīng)濟學獎得主都曾涉足博弈論領(lǐng)域,在博弈論的建立和發(fā)展中直接或間接作出過貢獻?!懊曉谕狻睘椴┺恼摰脑幱嫻x課的開設(shè)提供了有利條件,也為課程的講授提供了獨特的視角和豐富的素材。

    納什是博弈理論發(fā)展的劃時代人物,納什均衡是博弈論的核心概念,兩者都是公選課中必須包含的內(nèi)容。為此,筆者設(shè)計以下三個環(huán)節(jié):(1)借助“囚徒困境”和“情侶博弈”講授納什均衡及其不唯一性;(2)播放電影《美麗心靈》,并進行討論和點評;(3)布置以納什為主題的案例設(shè)計作業(yè),讓學生在課堂上演講。

    第一部分是講解的重點,講好納什均衡意味養(yǎng)博弈論課程成功了一半。第二部分可以把人格培養(yǎng)和素質(zhì)教育有效融合起來,《美麗心靈》不僅能讓人體會到學生心靈中因愛而生的溫暖,還能給出人生原本就是一場博弈的警示,體現(xiàn)出“大人物小故事”的精髓??v然納什這樣的天才也有無法擺脫的困境,何況他人?所以,在人生的博弈中,既要承認能力的差異,又要找尋屬于自己的色彩。同時還應(yīng)看到,縱然如納什般為頑疾所纏都可以逐漸康復(fù),何況其他挫折?所以,要以積極、樂觀、健康的心態(tài)對待人生,終身學習而不輕言放棄。第三部分是對學生的啟發(fā)環(huán)節(jié)。該環(huán)節(jié)不僅要培養(yǎng)學生對本課程的興趣,加深學生對知識的理解,還要通過為其提供上臺演講、展示成果的機會,鍛煉他們的邏輯思維能力和表達能力。值得一提的是,很多學生在設(shè)計案例時自學了有名的“智豬博弈”和“戀愛博弈”等經(jīng)典模型,鞏固了納什均衡概念,還有學生甚至對納什曾經(jīng)設(shè)計過的一種“六連棋”博弈游戲進行了分析。

    四、重視學科交叉,尤其應(yīng)重視學科交叉視閾下的學術(shù)前沿成果

    博弈論己逐漸成為一門為諸多學科提供思維方法和分析技巧的學問,可以說,所有與生命有關(guān)的學科都蘊藏著博弈論的應(yīng)用空間。在公選課中,應(yīng)重視從學科交叉的視角供給知識,廣泛培養(yǎng)各專業(yè)學生對課程的興趣。例如:筆者選擇生物演化理論和博弈論交叉所產(chǎn)生的演化博弈論作為知識模塊,以人類社會的同性戀演化作為典型主題,挑選最前沿的學術(shù)研究案例作為教學的主要內(nèi)容,為學生進行講解,擴展了學生的知識面。

    在演化博弈論的開創(chuàng)性著作《演化與博弈論》一書中,作者約翰?梅納德?史密斯(John Mavnard Smith)用精妙的語言、深入淺出的分析和豐富有趣的案例把博弈論的思想融入到生物演化中,推動了對“動物為什么如此”這一問題的深入研究,揭示了動物群體行為演變的動力學機制。筆者首先以“哺乳動物一雄多雌”案例作為引導(dǎo),簡單介紹演化博弈論在性選擇和性別比問題上的研究視角以及邏輯結(jié)構(gòu),然后立刻引出了人類面臨的一個有關(guān)性的問題――同性戀演化主題下的性問題:從進化論的角度來看,男男同性戀的存在完全沒有任何意義,這是因為同性戀相比于異性戀而言成功繁殖后代的可能性太小,那么為什么同性戀的基因沒有被淘汰?顯然,這一問題接近現(xiàn)實熱點,對學生極具誘惑力,而且還具有很強的學術(shù)延伸性。為了講解同性戀基因延續(xù)的演化博弈機制,筆者借助2010年2月24日美國心理科學雜志上發(fā)表的關(guān)于薩摩亞島上男男同性戀的最新研究成果,利用最前沿的學術(shù)案例詳細分析了“親族選擇”假說下的演化博弈機制。教學實踐表明,通過這樣的內(nèi)容設(shè)計,來自不同專業(yè)學生的學習興趣都被調(diào)動起來,加深了他們對博弈論的理解,順利實現(xiàn)了教學的目標。

    五、重視開放性,尤其應(yīng)重視教學信息交流反饋的開放性

    信息交流有利于幫助學生鞏固所學內(nèi)容,讓有興趣的學生通過查閱相關(guān)資料,獲得知識上的感悟和能力上的提升,并逐步脫穎而出。信息反饋有助于教師突出教學的亮點,發(fā)現(xiàn)教學中存在的不足,以便在今后的教學中加以改進。

    教學實踐中,筆者讓學生通過電子郵件的形式反饋“課堂心得”,并要求他們同答以下三個問題:(1)這次課對你影響最深或最成功的是哪部分?(2)最失敗或可有可無的又是哪部分?(3)對本次課你有什么意見和建議?

    這三個問題一方而可以督促學生對課堂內(nèi)容加以回顧、梳理,另一方而又可以從中發(fā)現(xiàn)自己在教學中存在的不足之處。事實上,在交流和反饋中,許多學生都針對課程的內(nèi)容、進程和教師的教學習慣、技能等提出中肯的批評和建議,幫助教師提高教學水平。這些批評和建議包括講課的速度有點偏快、思考時間較少、有些理論過于深奧、希望針對時事展開分析、希望多些互動、理論是需要加強的等,當絕大多數(shù)學生贊成“少一點數(shù)學知識”并希望“講得詳細點”時,筆者采納了這一建議,并列出了幾本偏重數(shù)學工具的參考書,讓那些“吃不飽”的學生自學。

    教學探索與實踐的過程是循序漸進的過程,學生在這一過程中所起到的作用是巨大的。只要教師能夠及時、充分地了解學生的需求,不斷總結(jié)、深化課程教學改革的經(jīng)驗,就一定能取得更大的成效。

    在缺少合適的教材這一問題上,筆者設(shè)想,可以采取靈活性較強的活頁方式(如當前許多大學英語教材中都有活頁內(nèi)容)改變這一現(xiàn)狀?;铐摲绞郊瓤梢酝怀鲋黝}的典型性,又可以涵蓋即時事件,滿足學生的需要。同時,教材活頁的積累還能為課程建設(shè)尤其是優(yōu)質(zhì)博弈論公選課教材的編著奠定基礎(chǔ)。

    只要教師能夠了解學生的需求,選擇恰當?shù)慕虒W方式、方法,不斷加以分析、總結(jié),進一步完善教學環(huán)節(jié),激發(fā)學生的學習興趣,就一定能順應(yīng)高等教育教學改革的趨勢,在確保教學質(zhì)量的基礎(chǔ)上,逐漸把博弈論的詭計公選課建設(shè)好。

    參考文獻:

    [1]顧建民.高等教育學[M].杭州:浙江人學出版社,2008.

    [2]裘松良.轉(zhuǎn)型期高校教育研究與實踐[M].北京:高等教育出版社,2010.

    [3]胡劍鋒.高校經(jīng)管類教育研究與實踐[M].杭州:浙江人學出版社,2011.

    [4]潘月明,郭秀芝.人學英語口語公選課教學模式設(shè)計與實踐[J].高等教育學刊,2009(2).

    [5]川浦徐進.本科博弈論教學過程中的案例運用[J].江南人學學報:教育科學版,2009(12).

    [6]葉國榮,等.高校本科生教育中研究型教學模式探討[J].中國高教研究,2009 (3).

    第5篇

    所謂“博弈”(Game),是指某些個人或組織作出相互有影響的決策,它不僅包括撲克、橋牌等游戲,也包含現(xiàn)實生活中大量的合作和沖突現(xiàn)象。博弈論又稱“對策論”,研究的核心是決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡問題。

    博弈論的原始思想萌芽于2000多年前,中國春秋戰(zhàn)國時代的典籍如《孫子兵法》、《孫臏兵法》中都充滿了博弈的案例。“田忌與齊王賽馬”就是我國耳熟能詳?shù)牟┺膶嵗?,但這不過是博弈思想的雛形,現(xiàn)代意義上的博弈論則是20世紀的貢獻了。一般認為,1944年同馮·諾伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作發(fā)表的《博弈論與經(jīng)濟行為》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,標志著現(xiàn)代博弈論的開始。50年代,博弈論巨匠輩出,納什(Nash)提出了非合作博弈論,塔科爾(Tucker)定義了“囚徒困境”,從而奠定了現(xiàn)代非合作博弈的理論基石。60后代,澤爾騰(Selten)將納什均衡引入動態(tài)分析,創(chuàng)立了“精煉納什均衡”的概念;海薩尼(Harsanyi)則把不完全信息引入博弈論研究,隨后出現(xiàn)了不完全信息博弈論。至此,博弈論的理論構(gòu)架基本完成。

    博弈論可以劃分為合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的區(qū)別主要在于參與人能否在行為時達成有約束力的協(xié)議,達成則是合作博弈;反之,不能強制他方遵守協(xié)議,各參與人只能選擇自己的最優(yōu)戰(zhàn)略,則是非合作博弈。合作博弈強調(diào)團體理性、效率、公平和公正;非合作博弈則強調(diào)個人理性、個人最優(yōu)決策。我們談到的博弈多指非合作博弈。

    博弈有兩種劃分:從參與人出場的先后順序來看,博弈分為靜態(tài)博弈(static game)和動態(tài)博弈(dynamic game)。靜態(tài)博弈指博弈參與人同時選擇行動或非同時行動但對前者行動一無所知;動態(tài)博弈指參與人行動有先后順序,且后行動者能夠觀察到先行動者的選擇。從參與人對其他參與人的知識來分析,博弈分為完全信息博弈和不完全信息博弈,前者指每一個參與人對其他參與人的特征、戰(zhàn)略和支付函數(shù)有確切的了解;后者則恰好相反。將兩種分析結(jié)合起來,我們就有四種類型的博弈:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動態(tài)博弈。

    1.完全信息靜態(tài)博弈:納什均衡

    完全信息靜態(tài)博弈講的是,假設(shè)博弈中所有參與人事先達成一項協(xié)議,規(guī)定每個人的行為規(guī)則,那么,在沒有外在強制性約束時,參與人是否會自覺遵守協(xié)議。如果參與人自覺遵守該協(xié)議,則構(gòu)成一個納什均衡:給定其他參與人遵守協(xié)議的情況下,沒有人積極偏離協(xié)議規(guī)則。換言之,如果一個協(xié)議不構(gòu)成納什均衡,它就不可能自動實施,因為至少有一個參與人會違背這個協(xié)議,不滿足納什均衡要求的協(xié)議是沒有意義的。“囚徒困境”(Prisoner's Dilemma)和“性別戰(zhàn)”(Battle of theSexes)是任何一本博弈論著作都會提到的納什均衡特例。

    2.完全信息動態(tài)博弈:子博弈精煉納什均衡

    動態(tài)是世間萬物的基本特征。完全信息靜態(tài)博弈只是一種獨特的理想狀態(tài)。在現(xiàn)實中,當后一個參與人行動時,自然會根據(jù)前者的選擇而調(diào)整自己的選擇,而前者也會理性地預(yù)期到這一點,所以不可能不考慮自己的選擇對他人的影響。1965年,澤爾騰通過對動態(tài)博弈的分析,提出了“子博弈精煉納什均衡”的概念,它要求任何參與人在任何時間、地點的決策都是最優(yōu)的,決策者應(yīng)該隨機應(yīng)變,而不是固守前謀。這就推導(dǎo)出子博弈的概念。當參與人的戰(zhàn)略在每一個子博弈中都構(gòu)成納什均衡時,則形成“子博弈精煉納什均衡”。也就是說,組成“子博弈精煉納什均衡”的戰(zhàn)略必須在每一個子博弈中都是最優(yōu)的。

    3.不完全信息靜態(tài)博弈:貝葉斯納什均衡

    不完全信息靜態(tài)博弈指的是,參與人共同行動,沒有機會觀察他人的選擇。每個參與人的最優(yōu)戰(zhàn)略只能是在給定自己的類型和他人類型依從戰(zhàn)略的情況下,最大化自己的期望效用。在項目投標中各承包者的標價高低之爭就是一個應(yīng)用例證。

    4.不完全信息動態(tài)博弈:精煉貝葉斯納什均衡

    在不完全信息動態(tài)博弈中,后行動者觀察前者的選擇并獲得其偏好、戰(zhàn)略空間等信息,修正自己的判斷;而先行為者也知道自己行為的效用,會有意識地選擇某種行動掩蓋或揭示自己的真實目的?!扒H技窮”就是一個不完全信息動態(tài)博弈的例證。

    國際機制理論的理性主義流派概述

    當前,國際機制的研究在理論與實踐層面都對國際關(guān)系理論學者形成沖擊,引起他們持續(xù)的濃厚興趣,并表現(xiàn)出非凡的整合能力,對國際機制研究的不同思路和方法加以整理和批評已經(jīng)成為學者們重視的工作。德國著名國際機制理論家沃科爾·利特伯格認為,國際機制理論有兩種理性主義流派:新現(xiàn)實主義國際機制理論和新自由主義國際機制理論。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International

    Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)

    新現(xiàn)實主義國際機制理論的基本出發(fā)點是行為體之間的權(quán)力資源分配極大地影響著機制的出現(xiàn)、某問題領(lǐng)域機制的存在及其性質(zhì),特別是合作中的利益分配;國家會考慮無政府狀態(tài)下的相對權(quán)力,對國際機制的效率形成制約。這些觀點都體現(xiàn)在霸權(quán)穩(wěn)定理論中。利特伯格認為,霸權(quán)穩(wěn)定理論是“基于權(quán)力的國際機制理論的經(jīng)典理論模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International

    Regimes(London:Cambridge University Press,1997),pp.86.)而克勞福德認為,霸權(quán)穩(wěn)定理論是新現(xiàn)實主義對機制產(chǎn)生最權(quán)威、最普遍認同的解釋。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸權(quán)穩(wěn)定理論的基本機制理論主張是:霸權(quán)國家建立了自己的霸權(quán)體系,并制定該體系的基本原則、規(guī)則、規(guī)范和決策程序,霸權(quán)國的實力與威望是其他國家接受這些國際機制的重要前提;霸權(quán)國利用這些機制維持霸權(quán)體系,最大限度地獲得自己的利益;同時,為了維持該體系,它愿意向體系內(nèi)的其他國家提供“公共商品”(Public Goods),容忍“搭便車行為”(Free-rider);霸權(quán)國的衰落或急劇變化,則該體系的國際機制發(fā)生相應(yīng)變化。

    新自由主義機制理論在過去10多年影響巨大,成為分析國際機制的主流理論。其基本機制理論主張是:國家是追求絕對收益的理性自我主義者,只關(guān)心自己的得失;承認權(quán)力在國際機制中的作用,但認為國際機制是國際關(guān)系中的獨立變量(independent variable),強調(diào)國際機制在幫助國家實現(xiàn)共同利益中的重大作用;活躍在特定問題領(lǐng)域的國家擁有只能通過合作才能實現(xiàn)的共同利益;不確定性是國際機制形成理論的核心,世界政治存在廣泛的不確定性。國際機制幫助達成政府之間意愿的契合。行為體相信這種安排會幫助達成互利的安排。換言之,沒有國際機制,則協(xié)議無法達成。國際機制正是通過降低不確定性來促進國際合作的。新自由主義機制理論是國際機制理論的主流學派,其影響也最大。該派理論用相互依賴的概念將現(xiàn)實主義和自由主義結(jié)合起來,具有重要的理論整合意義。

    博弈論與國際機制理論

    在過去十多年里,國際機制理論在國際合作的分析中獨占翹楚,而博弈論在分析社會、經(jīng)濟和政治現(xiàn)象中應(yīng)用最為廣泛。兩種理論都以探討無政府狀態(tài)下的競爭與合作問題為核心命題。這種平行并非巧合,因為機制理論從博弈論中借取了許多知識能量。理解促進合作的戰(zhàn)略邏輯是解釋無政府狀態(tài)下國際機制起作用的關(guān)鍵。在討論霸權(quán)、問題聯(lián)系、相對收益和相互依賴時,博弈論的解釋力有目共睹。這些恰恰是國際機制理論討論的重心問題。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International

    Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)

    早期的博弈論分析國際合作的總體問題,其目標在于探究國際合作在無政府狀態(tài)下如何發(fā)生,但對國際機制的特殊作用關(guān)注不夠,國際機制在合作中的作用沒有得到突出和明確的分析??死辜{、基歐漢等使用博弈論分析國際機制的作用,促使現(xiàn)實主義和自由制度主義的國際機制理論逐步成熟。

    第6篇

    關(guān)鍵詞:群體決策;信息集結(jié);博弈論;信息獲??;審議;透明性

    一、引言

    群體決策的研究涉及多個學科,不同學科對群體決策的研究所采取的方法和著重點不一樣。在經(jīng)濟學、政治學、管理學領(lǐng)域?qū)θ后w決策的研究側(cè)重于偏好的集結(jié),較少考慮影響偏好形成的潛在背景信息。其中社會選擇理論與公共選擇理論利用數(shù)學分析的方法和福利經(jīng)濟學的一些基本原理,研究如何“公平合理地”將群體成員的偏好集結(jié)為群體的偏好并據(jù)以作出群體的選擇,這方面的研究源于Condorcet投票悖論的提出,從20世紀50年代開始經(jīng)過Arrow、Sen、Gibbard和Satterthwaite等人的進一步發(fā)展,已形成完整的理論體系,通過對理性社會選擇本質(zhì)的剖析,促進了人們對選舉、立法以及政治機構(gòu)運作等問題的理解。

    在管理科學領(lǐng)域,對群體決策的研究主要強調(diào)如何通過對群體成員以不同形式表達的偏好的集結(jié),使得群體成員就最終決策達成某種程度上的一致,而一致性則意味著“正確性”,這方面最具代表性的是社會決策圖式理論。

    在社會心理學領(lǐng)域?qū)θ后w決策的研究主要采用實驗性方法,通過對群體成員之間交互過程的分析研究群體決策的信息集結(jié)有效性,一般假定群體成員具有共同的目標,很少考慮決策過程中的策略,心理學研究的主要成果是對群體思維和群體極化現(xiàn)象的分析。

    近年來國外出現(xiàn)了不少用博弈論作為理論工具研究群體決策信息集結(jié)問題的文獻,這些文獻主要發(fā)表于經(jīng)濟學、政治學與政治經(jīng)濟學期刊,通過對群體決策過程中群體成員的動機和理的分析,給出了一些與人們的直覺完全相反的結(jié)論。筆者將對此領(lǐng)域的研究進展從決策信息的獲取、審議過程中信息的披 露、透明性的影響與最優(yōu)決策規(guī)則四個方面進行評述。需要說明的是,這四個方面緊密關(guān)聯(lián),特別是決策群體成員的信息披露動機直接受到?jīng)Q策過程對公眾是否透明以及最終的投票表決規(guī)則的影響,而群體成員的信息獲取動機則部分地取決于信息披露動機,但由于利用博弈論分析群體決策問題的復(fù)雜性,現(xiàn)有的文獻主要還是相對集中于其中的一兩個方面。

    文[1]是注意到此領(lǐng)域較早的綜述性文章,該文發(fā)表于1999年,討論了當時出現(xiàn)不久的研究政治機構(gòu)信息集結(jié)作用的文獻,其中對最先考慮策略性投票表決行為的文[2-5]等進行了簡要介紹。同年9月份,《美國國家科學院院刊》發(fā)文評述了研究選舉的信息集結(jié)作用及因投票者私有信息的不準確而導(dǎo)致的策略性投票表決行為的成果[6],其中提及的部分研究工作尚處于未發(fā)表狀態(tài)。文[7]對研究貨幣政策委員會決策過程中的動機問題的文獻進行了系統(tǒng)討論。文[8]總結(jié)了貨幣政策委員會決策機制設(shè)計應(yīng)該考慮的各種因素,對與群體決策相關(guān)的經(jīng)濟學與社會心理學理論與實驗分析文獻進行了評述,其中討論了信息集結(jié)問題。應(yīng)該說文[9]是目前評述基于博弈論的群體決策信息集結(jié)研究文獻較為全面和細致的文章,該文從策略性投票、信息獲取、利益沖突和交流四個方面進行了詳細評述,并討論了此領(lǐng)域的研究成果對貨幣政策委員會決策機制設(shè)計的參考價值。

    本研究與文[9]的差別在于:第一,文[9]的討論基本上局限于基于博弈論的群體決策信息集結(jié)研究本身,而筆者從研究方法、研究對象與研究成果等方面將基于博弈論的群體決策信息集結(jié)研究與經(jīng)濟學、政治學、管理學以及社會心理學領(lǐng)域?qū)θ后w決策的傳統(tǒng)主流研究進行了對比,分析了博弈論作為理論工具研究群體決策信息集結(jié)問題的優(yōu)缺點,并深入探討了現(xiàn)有研究工作存在的不足之處,也即指出了此領(lǐng)域可能的研究方向,因此,筆者的深度與廣度有所超越。第二,文[9]對此領(lǐng)域研究成果的評述思路稍顯混亂,文獻分類較不合理。第三,筆者特別關(guān)注了研究決策過程的透明性對群體成員信息獲取與信息披露動機以及投票表決行為的影響的文獻,而文[9]對此幾乎沒有涉及。第四,文[9]發(fā)表后此領(lǐng)域出現(xiàn)了不少具有重要參考價值的文獻,筆者對這些最新的文獻給予了較為詳細的評述。

    二、決策信息的獲取

    (一) Condorcet陪審團定理與搭便車問題

    與決策問題相關(guān)的各類信息一般以分散的、局部的形式存在于社會系統(tǒng),群體決策的意義之一,是可能更充分地利用這些信息,因而更有可能作出正確的決策。不考慮其他因素,僅從信息集結(jié)的角度看,讓更多擁有信息的個體參與決策可以改善決策質(zhì)量,這種觀點符合人們的直覺,其形式化證明出自18世紀Condorcet給出的陪審團定理。該定理認為:群體決策可以有效集結(jié)信息,在多數(shù)決定規(guī)則下,增加群體成員數(shù)量可以增加作出正確決策的概率,并且隨著成員數(shù)量趨于無窮,作出正確決策的概率趨于1。

    Condorcet陪審團定理及其后來的很多拓展往往都有個潛在的假設(shè):群體決策者所掌握的與決策問題相關(guān)的信息是事前外部給定的,或是以零成本獲得的[9]。但對于許多現(xiàn)實決策情形,信息并不是不需要投入成本和努力就能輕易得到的,如審稿專家需要付出一定的時間和精力才能決定稿件是否符合錄用標準,因此決策者必須決定是否付出以及付出多少代價以獲取信息。而在群體決策中,與決策問題相關(guān)的信息是公共物品,因而存在典型的所謂社會惰化(social loafing)現(xiàn)象或搭便車問題(freerider problem)。

    文[10]對陪審團決策中的信息獲取問題進行了研究,認為陪審員的信息準確程度取決于陪審團的大小,更大的陪審團的陪審員具有更少的動機認真聽取審判過程,所以更大的陪審團作出正確判決的概率可能更小,從而導(dǎo)致陪審團定理不再成立。文[11-17]進一步研究了群體決策中的理性無知(rational ignorance)問題,對仍能有效集結(jié)信息時信息獲取成本或成本函數(shù)需要滿足的條件進行了分析,這些文獻針對多數(shù)決定規(guī)則,假定所有群體成員具有完全相同的決策偏好。其中文[11,13-15]證明,當全體或部分群體成員的信息獲取成本函數(shù)在獲取零信息處的二階導(dǎo)數(shù)為零,則Condorcet陪審團定理仍然有效。

    另外,文[18]通過一個僅有兩個成員的群體決策模型,指出群體成員間的交流可能會惡化信息獲取中的搭便車問題。在該文中,決策成員首先收集關(guān)于一項工程實施后果的信息,然后相互交流,再投票表決是否實施該項工程。文章指出,如果交流的作用僅限于信息集結(jié),則交流可能會減少作出正確決策的概率,特別是當高質(zhì)量的信息很容易獲得時,交流會減少決策成員收集信息的動機,加劇信息收集中的搭便車問題,但當信息收集需要付出高昂的代價時,更多的交流通常會增加作出正確決策的概率。

    (二)搭便車問題避免措施

    因為信息獲取活動一般是不可觀測的,搭便車者可以通過提供一個虛假的信息假裝已經(jīng)給予了足夠的投入,所以無法通過有效的懲罰措施以阻止搭便車問題,只能夠從決策群體的成員組成和決策規(guī)則等方面考慮避免該問題的發(fā)生。

    文[19-20]的研究結(jié)論從決策群體人員組成方面為避免信息獲取中的搭便車問題提供了理論參考,指出具有極端偏好的成員相對來說更具有收集高成本信息的動機,但這兩篇文獻的研究內(nèi)容不屬于嚴格意義上的群體決策,因為其中的委員會成員僅負責收集與報告信息,自身并沒有決策權(quán)。在文[19]中,委員會成員在信息收集之前相互間沒有偏好差異,在投入不可觀測的努力收集信息后形成各自不同的政策偏好,該文證明最優(yōu)的委員會規(guī)模和總的社會剩余有時會隨委員會成員偏好差異期望值的增大而增大,因為預(yù)期的偏好差異為成員提供了收集信息的動機。文[20]指出,如果信息收集的成本較低,委員會成員的偏好應(yīng)該與決策者的偏好類似,這是因為一方面與決策者偏好類似的成員會收集決策者想要的信息,另一方面由于偏好類似所以在報告時不會產(chǎn)生信息的扭曲問題;如果信息收集的成本較高,則委員會應(yīng)該由具有極端偏好的成員組成,只有這些成員才具有足夠強烈的動機付出代價收集信息,但因為信任問題,他們往往只會收集硬信息,即客觀上可驗證的信息。對于在投票表決前需要對決策選項進行審議的群體決策來說,文[20]的研究結(jié)論尤其具有參考價值。

    從群體決策機制設(shè)計的角度看,如果存在信息獲取問題,則機制設(shè)計者必須既要考慮如何提供充分的激勵促使群體成員獲取信息,又要考慮如何有效集結(jié)成員所獲得的信息,以最大化群體決策的期望效用。

    文[21]證明,采用適當保守的決策規(guī)則可以促進群體成員收集證據(jù),從而改善決策質(zhì)量。文[22-23]對存在信息獲取時的群體決策最優(yōu)規(guī)則與最優(yōu)群體成員數(shù)量進行了研究。文[22]指出,盡管一致性規(guī)則使每個群體成員的投票選擇對最終結(jié)果都具有決定性影響力,但一致性規(guī)則并不能為獲取信息提供適當?shù)募?,而且一致性?guī)則特別不適合于信息較不準確的情形,也即更需要群體決策的情形,在只考慮單調(diào)純策略均衡的條件下,除非群體成員的信息足夠準確,否則一致性規(guī)則或接近于一致性規(guī)則的規(guī)則不可能最優(yōu)。文[23]認為,為了提供足夠的信息獲取激勵,對于相當普遍的決策情形,事前最優(yōu)的決策機制事后可能是非最優(yōu)的,即不必然利用了所有群體成員獲取的信息導(dǎo)致從統(tǒng)計學角度有最優(yōu)的信息集結(jié),該事前最優(yōu)的決策機制是在激勵成員獲取信息與最大程度提取成員信息之間折中的產(chǎn)物。需要指出的是,文[21-23]均假定決策群體成員具有相同的偏好。

    三、審議過程中信息的披露

    決策群體,尤其是規(guī)模較小的群體,一般會在投票表決前對決策選項進行審議,交流各自的私有信息。信息的共享能引起成員信念的收斂。但群體成員通常代表著不同的利益集體,具有不同的利益追求或偏好,因而具有操縱或隱藏私有信息的動機,從而限制了信息共享的可能性,成員間策略性的信息操縱與反操縱甚至導(dǎo)致比純粹偏好沖突更大程度上的意見不一致。

    絕大多數(shù)群體決策文獻對審議(deliberation)、交流(communication)、辯論(debate)、廉價磋商(cheap talk)等類似表述用語沒有進行明確的區(qū)分,雖然這些用語在不同場合有一些微妙甚至較大的差異,如文[24]認為審議是辯論的子集。

    研究審議對群體決策的影響的文獻一般將決策過程建模為兩階段博弈:先審議后正式投票表決,通過對貝葉斯Nash均衡策略和均衡存在條件的分析,研究審議是否以及如何對群體決策發(fā)生作用。這類文獻一般假定無論是以公共利益還是以私人利益作為評判標準,好的決策選擇總是部分取決于世界的真實狀態(tài),而世界的真實狀態(tài)對決策群體成員來說無法確切知道,他們僅不對稱地掌握了有關(guān)世界真實狀態(tài)的部分信息。在正式投票表決之前的審議過程可以使群體成員有機會告訴其他成員他們所掌握的私有信息,然后,根據(jù)各自已掌握的關(guān)于世界真實狀態(tài)的部分信息,群體成員形成自己對世界真實狀態(tài)的判斷,進而根據(jù)自己的評判標準形成各自的決策選擇偏好,如果他們的決策選擇偏好不一致,就有可能在審議的過程中不披露自己的真實信息,或提供虛假的信息以誘導(dǎo)其他成員作出對自己有利的決策選擇。因此,此類文獻注重從信息集結(jié)角度對完全信息披露均衡和完全信息集結(jié)均衡的分析。

    Coughlan在文[25]中認為,當所有群體成員的決策偏好完全相同或足夠接近,在審議過程中每個成員都具有真實披露私有信息的動機。文[26]則進一步證明,只要群體成員主觀上認為多數(shù)成員與他擁有共同偏好具有較大的可能性,客觀上的偏好差異不會影響信息的真實共享。然而,該文同時指出,審議并不總是能有效集結(jié)信息,特別是當群體成員沒有較強的先驗信念認為自己的價值取向就是群體主流的價值取向時,可能出現(xiàn)有意的相互欺騙。需要說明的是,在文[26]給出的模型中,所有群體成員的偏好或者完全相同,或者完全相反,與此相符的現(xiàn)實群體決策情形很少,甚至幾乎沒有。文[24,27-28]證明一致性規(guī)則在很多情況下為群體成員在審議過程中策略性地隱藏信息提供了動機,多數(shù)決定規(guī)則比一致性規(guī)則能引導(dǎo)出更多的信息共享。文[28]還證明,在相當一般的條件下,審議使得除一致性規(guī)則以外的所有其他規(guī)則具有相同的序貫均衡集合,也即審議使得所有的無否決權(quán)規(guī)則在序貫均衡方面等價,從而說明如果群體成員在投票表決前有向所有成員公開宣布各自私有信息的機會,那么采用除一致性規(guī)則以外的其他任何決策規(guī)則,都會產(chǎn)生相同的決策結(jié)果。文[29]對陪審團在審議階段信息的披露進行了實驗研究,以無約束力的意向性投票形式實現(xiàn)信息的交流,實驗結(jié)果與理論分析基本近似。

    另外,文[30]給出了一個兩成員的交流與決策模型,兩個成員投票表決是否組成具有不確定回報的合伙關(guān)系,他們的偏好不一致且為私有信息。文章分析了均衡的特征,發(fā)現(xiàn)在均衡時僅有部分信息被傳遞,交流對于雙方的福利是有益的。

    對于很多現(xiàn)實決策問題,決策者可能擁有客觀上可驗證的信息,即所謂硬信息(hard information)。文[31]對硬信息在具有偏好沖突的委員會中的交流進行了研究,證明完全信息集結(jié)均衡在偏好為私有信息的情況下比在偏好為常識情況下更有可能存在,即允許更大程度上的偏好差異;另外該文證明,如果信息可驗證,完全信息集結(jié)均衡的存在條件等同于完全信息披露均衡的存在條件。文[32]指出,在審議階段群體成員共享私有信息的動機一定程度上取決于其私有信息的可驗證性,如果決策成員能夠為自己的信息提供驗證材料,則一致性規(guī)則比其他規(guī)則提供了更強的信息共享激勵,更有可能實現(xiàn)完全信息共享。文章給出了在一致性規(guī)則下審議階段存在完全信息披露均衡的充分必要條件。

    文[33]指出,盡管偏好與信息的差異可能使得部分成員在審議過程中具有錯誤表達私有信息的動機,但給予群體成員適當?shù)耐獠考钅芟祟悇訖C,促進信息與偏好的完全集結(jié),而且隨著群體規(guī)模的擴大,外部激勵的強度可以很小,外部激勵的具體措施包括對成員決策能力的肯定等。

    四、透明性的影響

    隨著社會的進步,公眾對涉及自身利益的重要決策過程的透明性提出了越來越高的要求。透明的決策過程意味著公眾可以評價決策群體成員的偏好、能力與貢獻,從而引起決策者對自身聲譽的關(guān)注,而對聲譽的關(guān)注既可能促進信息的獲取和真實信息的披露,但也有可能導(dǎo)致信息傳遞與投票表決行為的扭曲。

    在文[34]中,委員會成員在前一時期表現(xiàn)出的決策能力影響了他在后一時期能否獲得連任,而作為委員會成員可為其帶來一定的效用。該文證明公開個人投票記錄可以促進委員會成員努力獲取信息。文[35]認為,僅公布最終決策結(jié)果,不公開個人投票記錄,會誘導(dǎo)委員會成員按照現(xiàn)有偏見作出投票選擇,因此,委員會的決策傾向于保守化,向公眾公開成員的投票記錄則能夠減少現(xiàn)有偏見對決策的影響。該文同時認為,群體決策機制的設(shè)計應(yīng)該不僅考慮決策過程的透明性,也要考慮決策規(guī)則的適當性,如果決策規(guī)則選擇合適,則不透明的決策過程可能比透明的決策過程得到更好的決策結(jié)果。在文[34-35]所給出的模型中,都沒有考慮委員會成員在投票表決前可能會相互交流各自的私有信息。

    在文[36]中,委員會代表公眾對一項新工程的實施與否進行表決,委員會成員既關(guān)心工程的實際價值,又關(guān)心委員會在公眾中的聲譽,如果維持現(xiàn)狀,不實施新工程,則暴露出委員會成員意見的不一致,從而給委員會的聲譽帶來負面影響,而公眾僅能注意到委員會的決策結(jié)果,事后不能觀測到工程的實際價值。該文證明,在審議階段,部分成員對聲譽的過分關(guān)注可能使他們不愿真實披露私有信息,而是夸大工程的價值,導(dǎo)致更容易采取實施新工程的決策。文[37]認為,公開委員會的具體審議記錄可能會降低決策質(zhì)量。由于委員會成員關(guān)心公眾對其決策能力的判斷,使得他們在正式會議交流過程中可能隱藏內(nèi)部存在的意見分歧,公眾對于決策過程透明性的要求,可能導(dǎo)致委員會在正式會議之前組織秘密的非正式預(yù)備會議,將真正實質(zhì)性的討論從公開的正式會議階段轉(zhuǎn)移到秘密的預(yù)備會議階段,從而對公眾消除委員會內(nèi)部意見的不一致,而非正式的會議更具有不穩(wěn)定性,因此,透明性要求并不一定能增加社會福利。

    在文[38-40]中,外部利益關(guān)聯(lián)者可以觀察到公開委員會每個成員的具體投票記錄和決策結(jié)果,但對于秘密委員會則只能看到最終決策結(jié)果,而委員會成員既關(guān)心決策結(jié)果又關(guān)心外部利益關(guān)聯(lián)者所給予的回報。文[38]和[39]認為,不公布委員會成員的個人投票記錄可以減少外部利益關(guān)聯(lián)者對決策的影響,在某些情況下秘密委員會優(yōu)于公開委員會。文[39]還特別指出,由于隨著群體成員數(shù)量的增加,單個成員的投票對最終決策具有決定性影響的概率減小,對單個成員而言不誠實投票的代價隨之減小,所以對于公開委員會來說,其成員更容易因外部利益關(guān)聯(lián)者承諾給予的回報而不誠實投票,因此Condorcet陪審團定理可能不再成立。在文[40]中,對于秘密委員會,外部利益關(guān)聯(lián)者可以根據(jù)投票表決規(guī)則的閾值和最終決策結(jié)果對委員會成員的投票作出推斷。文章分析了秘密委員會的最優(yōu)決策規(guī)則,指出決策規(guī)則中增加選擇某一選項需要的投票比例可能會導(dǎo)致該選項更容易成為最終決策結(jié)果,傳統(tǒng)看法認為降低決策規(guī)則的閾值可以防止委員會過于保守的看法未必正確,但對于公開委員會則不存在此問題。文[41]雖然不是直接研究透明性,但其研究結(jié)論與此處內(nèi)容相關(guān),該文通過一個博弈模型,說明在特定情況下,外部利益集團可以不用付出任何代價就能操縱委員會的決策。

    另外,不少文獻從理論與實證兩方面研究了決策過程的透明性對貨幣政策委員會決策的影響。文[7,42]對這方面的文獻進行了綜述。文[42]區(qū)分了三種類型的透明性:決策目標透明性;知識透明性,這里的知識指決策所依據(jù)的經(jīng)濟數(shù)據(jù)或經(jīng)濟模型等;操作透明性,包括委員會會議記錄與投票記錄的透明性以及決策結(jié)果的透明性等。該文評述的文獻有部分運用了博弈理論作為分析工具。文[7]專門討論了貨幣政策委員會決策過程中的動機問題,指出貨幣政策委員會的最優(yōu)規(guī)模與透明性等仍有待進一步研究。

    類似于文[34],研究透明性對貨幣政策委員會決策信息集結(jié)有效性的影響的文獻,一般認為委員會成員希望得到社會公眾對其決策能力或決策偏好的正面評價,從而獲得連任的機會,如文[43]假設(shè)委員會成員希望公眾認為他是通貨膨脹的強硬抵制者,而最近的文獻如文[44-46]等,則假設(shè)委員會成員希望公眾認為他是具有較強決策能力者。文[44]認為,公開審議過程的詳細記錄會使得貨幣政策委員會成員不愿意表達不同的意見,該文通過對美聯(lián)儲聯(lián)邦公開市場委員會在被要求公開會議記錄之前和之后的會議記錄的分析說明了理論結(jié)果的有效性。文[45-46]分析了投票記錄的公開對委員會成員投票表決行為的影響,認為投票記錄對公眾的透明帶來的負面效應(yīng)占主導(dǎo)地位,透明性不能增加社會福利。

    五、最優(yōu)決策規(guī)則

    顯而易見,不同的決策規(guī)則極大地影響了群體決策的信息集結(jié)效率,尤其是決策群體成員的偏好或能力不完全一致時,決策規(guī)則更是直接影響了群體成員的投票選擇行為,進而影響了決策結(jié)果的正確性。前述文獻大多不同程度地討論了決策規(guī)則的比較和選擇,除此以外,另有部分文獻對各種情況下的最優(yōu)決策規(guī)則進行了研究。

    文[47-48]從最大化期望效用的角度對固定規(guī)模的委員會形式集體決策的最優(yōu)決策規(guī)則進行了分析,文[49-50]研究了在特定約束條件下的最優(yōu)決策規(guī)則。然而,這些早期的文獻都有個潛在的假設(shè):決策成員僅按照自身獲得的信息作出投票選擇。文[2,51]等指出,即使決策群體成員的偏好完全一致,也不能保證一定能夠如Condorcet陪審團定理所預(yù)測的那樣有效集結(jié)各成員的信息,因為群體成員僅根據(jù)自身信息作出非策略性的選擇不符合理性要求,當且僅當所使用的決策規(guī)則為集結(jié)群體成員私有信息的最優(yōu)規(guī)則時,所有群體成員僅按自身信息投票才是Nash均衡,而最優(yōu)決策規(guī)則則取決于特定的決策情形。

    文[52]證明,當采用文[48]所定義的最優(yōu)決策規(guī)則時,所有成員僅按照自身獲得的信息投票表決形成Nash均衡,但僅按自身信息投票可能不是有效的,因為部分成員聯(lián)合決定策略性投票可以增加期望效用。文[53]討論了投票者對不同決策選項具有可用基數(shù)表示的效用時的誠實投票問題,試圖給出當決策機制允許多種消息類型時誠實投票的準確定義。為使投票者具有誠實投票的動機,文[54]提出了一種在隨機選擇的投票表決集合上運用多數(shù)決定規(guī)則得到最終決策的方法,在對所有投票者的表決結(jié)果運用多數(shù)決定規(guī)則和僅對投票表決結(jié)果的隨機抽樣子集運用多數(shù)決定規(guī)則之間進行隨機選擇,可以激勵投票者誠實投票,從而得到Condorcet陪審團定理的有效性收斂結(jié)果。

    文[55]基于陪審員的私有信息和策略性表決行為構(gòu)建了一個陪審團決策模型,證明一致同意規(guī)則可能會導(dǎo)致無辜被告得到有罪判決和有罪被告得到無罪判決這兩種錯誤的概率都增加。文[56]分析了決策群體所投票表決的決策選項不獨立于投票表決規(guī)則的情形:給定決策群體的投票表決規(guī)則,提案者向決策群體提出一個要么完全接受要么完全拒絕的議案,群體投票表決是接受還是拒絕該議案。該文證明由于一致同意規(guī)則能促使提案者提出更有吸引力的議案,所以增加了決策群體的期望效用,在某些情況下,一致同意規(guī)則甚至是Pareto最優(yōu)的表決規(guī)則,因為它也增加了提案者的期望效用,即使提案者與決策群體的利益追求可能完全相反??偨Y(jié)考慮一致性規(guī)則的文獻[22,24,27,28,32,55,56],可見博弈分析得到的結(jié)論往往與人們直觀上的認識截然相反,一致性規(guī)則是不是合適的決策規(guī)則完全取決于特定的決策情形。

    既然投票表決規(guī)則直接影響了投票者的投票選擇行為,那么,對于群體決策機制的設(shè)計者來說,他在選擇投票表決規(guī)則時是否需要考慮投票者在各種表決規(guī)則下的投票行為,換言之,機制設(shè)計者關(guān)于投票者在各種規(guī)則下的博弈行為的信念是否會影響到最優(yōu)決策規(guī)則的選擇。文[57-58]對此問題進行了研究,其中假設(shè)群體成員的決策偏好完全一致。文[57]分析了決策成員的能力存在差異且這種差異是常識的情況下的投票表決規(guī)則,指出最優(yōu)的匿名單調(diào)投票規(guī)則并不取決于成員是否按照自身信息投票或策略性投票。類似于文[57]的結(jié)論,文[58]認為,決策機制設(shè)計者對最優(yōu)投票表決規(guī)則的選擇與機制設(shè)計者關(guān)于投票者在不同表決規(guī)則下的投票行為的信念無關(guān),在該文中,機制設(shè)計者為決策群體選擇投票表決規(guī)則,其目的是為了最大化決策群體的期望福利,文章證明,僅從信息集結(jié)的角度看,關(guān)于投票者在各種表決規(guī)則下的投票行為的不同假設(shè)對于最優(yōu)決策規(guī)則的選擇來說,結(jié)論是一樣的,不同的行為假設(shè)導(dǎo)致相同的結(jié)論。對于具有相同偏好的決策群體來說,文[57-58]的研究結(jié)論大大簡化了決策規(guī)則的選擇。

    現(xiàn)實中的決策群體往往存在具有極端偏好的成員,這些成員的存在為信息的有效集結(jié)帶來較大的困難。文[59]對存在極端偏好者和中立者的群體面對二分決策問題時的最優(yōu)決策規(guī)則進行了研究,考慮了決策成員之間存在轉(zhuǎn)移支付的情況,指出最優(yōu)投票表決規(guī)則相對于轉(zhuǎn)移支付可能性的大小來說是非單調(diào)的。文[60]對由兩類具有完全相反的偏好的成員所組成的委員會決策進行了分析,對比了一致性規(guī)則與非一致性規(guī)則的信息集結(jié)效率。文[61]給出了一個現(xiàn)實中較難接受的非單調(diào)性決策規(guī)則――超多數(shù)懲罰(supermajority penalty)規(guī)則,當選擇某一選項的投票過多時,將該選項作為群體決策最終結(jié)果的概率反而會下降,該文證明,當對于每個選項都存在極端偏好者時,超多數(shù)懲罰規(guī)則是最優(yōu)匿名激勵相容規(guī)則。

    前述文獻都假定群體成員的偏好相互獨立,而文[62]對群體成員具有相互關(guān)聯(lián)但不完全相同的偏好的情況進行了分析,其中的決策選擇空間是連續(xù)的,該文分別討論了采用平均規(guī)則與中值規(guī)則時所對應(yīng)博弈的對稱貝葉斯Nash均衡的存在性問題,并比較了這兩種規(guī)則在不同偏好關(guān)聯(lián)程度下的性能。

    由于從眾心理,群體成員經(jīng)常會根據(jù)對其他成員行為的觀察相應(yīng)調(diào)整自己的行為。文[63-64]對從眾心理對群體決策的影響進行了研究,其中假定群體成員一方面希望選出好的決策選項,另一方面又希望自己成為勝出的一方。文[63]分析了群體規(guī)模較大時同時投票機制與順序投票機制的均衡特征和信息集結(jié)質(zhì)量,文[64]指出這種從眾心理導(dǎo)致同時存在多個均衡,而且對于這些均衡中的多數(shù),信息不能被有效集結(jié)。文[64]從某種程度上說明了最優(yōu)決策規(guī)則設(shè)計的困難。

    六、現(xiàn)有研究工作的不足之處

    其一,社會選擇理論與公共選擇理論以及管理學領(lǐng)域?qū)θ后w決策的研究,主要考慮偏好集結(jié)的有效性,而其中的偏好則是指對決策選項的偏好,這種偏好取決于決策者對最終結(jié)果的更根本意義上的偏好和對世界真實狀態(tài)的信念。在現(xiàn)實社會中,純粹以偏好的有效集結(jié)為終極目標的重要群體決策問題幾乎不存在,例如社會選擇理論與公共選擇理論最重要的應(yīng)用領(lǐng)域――選舉,既是偏好集結(jié)(這里指更根本意義上的偏好),更是信息集結(jié)。僅考慮偏好的集結(jié)問題,不考慮偏好的形成過程以及信息在偏好形成過程中的潛在作用,無法分析群體內(nèi)外部交流與互動等對決策的影響,無法解釋現(xiàn)實中的很多現(xiàn)象,因而對相關(guān)決策機制設(shè)計的指導(dǎo)作用較為有限。

    其二,社會心理學從認知的角度研究群體決策,其結(jié)論出自于對實驗和經(jīng)驗數(shù)據(jù)的統(tǒng)計學分析,易于為人們接受。但由于從實驗或經(jīng)驗數(shù)據(jù)中利用統(tǒng)計學方法推導(dǎo)出群體的偏好分布參數(shù)極為困難,所以無法深入研究群體決策過程中因偏好不一致而導(dǎo)致的隱藏與扭曲私有信息等策略。

    其三,與社會選擇理論和公共選擇理論一樣,用博弈論研究群體決策信息集結(jié)問題的文獻也是以理性選擇假設(shè)作為判斷與決策的微觀基礎(chǔ)。盡管所有群體成員嚴格按照貝葉斯規(guī)則更新自己的信念等完全理性假設(shè)對于心理學家和普通人來說都是難以接受的,但博弈論文獻還是以其數(shù)學分析的簡潔與嚴謹顛覆了很多直覺上的認識,通過對群體決策者動機的分析,有助于我們理解決策機制的哪些方面可能會引起不利于決策目標實現(xiàn)的策略,進而有助于決策機制的改進。隨著群體成員偏好差異程度和決策問題重要程度的增加,審議方式和決策規(guī)則趨向于書面化和正規(guī)化,群體思維與群體極化現(xiàn)象將很少出現(xiàn),決策結(jié)果也將更接近于博弈分析的預(yù)測。

    目前對群體決策信息集結(jié)問題的研究尚處于起步階段,還有很多不完善之處,在某些方面甚至存在根本性的缺陷。

    第一,可能是受到信息經(jīng)濟學研究的誤導(dǎo),本領(lǐng)域的很多理論與實驗分析文獻,包括一些奠基性的文獻,混淆了信息與在信息基礎(chǔ)上形成的判斷。真實信息的披露不會引起其他群體成員以及公眾對自己決策能力的負面評價,更不會如判斷的披露那樣引起認知上的從眾,如果決策者掌握了確鑿可靠的信息,則其不會因為其他人基于其他信息產(chǎn)生的不同看法而輕易改變自己的信念。

    除個別文獻外,現(xiàn)有研究群體決策信息集結(jié)問題的文獻幾乎都是將審議完全等同于信息經(jīng)濟學領(lǐng)域的廉價磋商,將交流限制為每個群體成員同時向所有其他成員發(fā)送一輪公開的消息。在現(xiàn)實群體決策過程中,審議至少包括對各方面提供的信息的真實性的審議,以及對信息與世界真實狀態(tài)之間的邏輯關(guān)聯(lián)(即潛在的決策模型)的審議。因此,將審議建模為完全的廉價磋商的現(xiàn)實意義極為有限,對于偏好差異較大的群體更是如此。

    第二,客觀上難以驗證的信息的可接受性,取決于接收者對于信息發(fā)送者的偏好的信念,例如,人們有充分的理由懷疑壟斷企業(yè)單方面提供的企業(yè)運營成本數(shù)據(jù)的真實性。另一方面,在很多情況下,信息的軟硬程度(可驗證程度)與信息獲取者和信息接收者的成本投入相關(guān)。因此,群體成員獲取可驗證信息與不可驗證信息的動機,以及群體成員對信息軟硬程度的投入,既取決于是否有審議階段以及審議方式和決策規(guī)則,也取決于群體成員的偏好和群體成員關(guān)于群體偏好差異程度的先驗信念。諸如此類問題現(xiàn)有文獻幾乎沒有涉及。

    群體決策在現(xiàn)代社會無處不在,如政府部門對重大戰(zhàn)略性問題的決策、公司董事會對重要項目投資與實施問題的決策、審判委員會對犯罪嫌疑人的判決、專家對科學基金項目申請書的評審等。從組織或社會的目標出發(fā),針對特定的決策問題,為了盡可能作出正確的決策,應(yīng)該如何組成決策群體,選擇何種決策規(guī)則?此類群體決策的科學化與民主化問題很久以來一直是管理、政治、法律和經(jīng)濟等領(lǐng)域討論的中心,其研究結(jié)果對于各類政治、社會、經(jīng)濟組織的運行機制設(shè)計具有重要的意義。

    中國學者對群體決策的理論與方法進行了大量的研究,提出了不少新的概念和方法,作出了很多重要貢獻,國家自然科學基金委員會對群體決策理論與方法研究也較為重視,曾將其列為優(yōu)先資助領(lǐng)域。但根據(jù)現(xiàn)有的各類文獻和歷年的基金項目研究摘要,總體感覺國內(nèi)對決策群體成員的動機和理考慮較少,到目前為止還沒有發(fā)現(xiàn)國內(nèi)其他學者利用博弈論研究群體決策信息集結(jié)問題。

    筆者試圖利用不完全信息博弈論和機制設(shè)計理論,研究決策群體成員的策略性信息獲取、信息傳遞和投票表決行為,揭示決策群體人員組成、審議方式、決策規(guī)則、透明性等決策機制的各個方面對群體決策的信息集結(jié)有效性的具體影響。并試圖從信息集結(jié)角度,為一些典型公共決策情形優(yōu)化決策機制。

    參考文獻:

    [1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.

    [2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.

    [3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.

    [4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.

    [5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.

    [6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.

    [7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.

    [8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.

    [9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.

    [10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.

    [11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.

    [12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.

    [13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.

    [14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.

    [15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.

    [16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.

    [17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.

    [18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.

    [19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.

    [20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.

    [21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.

    [22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.

    [23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.

    [24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.

    [25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.

    [26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.

    [27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.

    [28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.

    [29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.

    [30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.

    [31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.

    [32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.

    [33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.

    [34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.

    [35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.

    [36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.

    [37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.

    [38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.

    [39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.

    [40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.

    [41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.

    [42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.

    [43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.

    [44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.

    [45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.

    [46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.

    [47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.

    [48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.

    [49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.

    [50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.

    [51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.

    [52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.

    [53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.

    [54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.

    [55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.

    [56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.

    [57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.

    [58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.

    [59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.

    [60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.

    [61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.

    [62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.

    第7篇

    關(guān)鍵詞:認知無線電;功率控制;非合作博弈;納什均衡;效用函數(shù)

    中圖分類號:TN014文獻標識碼:A文章編號:1672-3198(2009)16-0265-02

    0 前言

    認知無線電(cognitive radio,CR)是以軟件無線電(software radio)技術(shù)為基礎(chǔ)的能夠提高無線通信頻譜利用率的新技術(shù)。在很多國家,傳輸效率較高的頻段是以授權(quán)分配的方式分配給無線通信業(yè)務(wù)部門和運營企業(yè)的,但這些頻段的授權(quán)用戶并不是在任何時刻都使用分配給他的頻段,因此不少傳輸效率很高的授權(quán)頻段會經(jīng)常處于空閑狀態(tài),這就浪費了寶貴的頻譜資源。根據(jù)美國聯(lián)邦通信委員會(FCC)所進行的大量研究表明,在大部分地區(qū),授權(quán)頻段的平均利用率在15%―85%之間,而一些傳輸效率較高的非授權(quán)頻段則過于擁擠。于是Joseph Mitola博士在1999年首先提出了認知無線電概念,目的就是解決頻譜資源的有效利用問題。

    博弈論(Game Theory)又被稱為對策論,是現(xiàn)代數(shù)學的一個分支,也是運籌學的一個重要組成部分,是研究互動決策的理論。John Nash博士在1950年提出了納什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。該理論指出,在一策略組合中,所有的參與者都面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的,此時便達到了納什均衡。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的沖動。這種參與者為了各自利益的最大化不斷改變策略的做法,與CR中各認知用戶為爭得傳輸效率的最大化對頻譜和功率不斷進行調(diào)整的自適應(yīng)算法策略相符。因此,可以引入非合作博弈論模型對CR的頻譜分配和功率控制算法進行檢測和優(yōu)化。

    本文以認知用戶的滿意度為設(shè)計目標,引入代價函數(shù)得到一種新的基于非合作認知無線電功率控制的博弈模型,并結(jié)合對該模型的分析介紹了非合作博弈論在CR中的一般分析方法。

    1 認知無線電體系結(jié)構(gòu)

    認知無線電是對軟件無線的擴展,因此具備軟件無線可重新配置的特點,并且能夠?qū)崿F(xiàn)基于環(huán)境認知的自動配置。S•Haykin根據(jù)CR所必需的頻譜掃描、信號分析、參數(shù)測量、頻譜決策、協(xié)議分析等功能,給出了CR系統(tǒng)構(gòu)成的基本功能結(jié)構(gòu),該結(jié)構(gòu)將CR系統(tǒng)分為三個功能模塊。

    (1)無線頻譜分析模塊。

    該模塊通過接收環(huán)境中的射頻激勵,并利用自身算法對激勵信號進行動態(tài)分析,實時提供對環(huán)境中頻譜空穴的檢測情況,搜集可使用的頻譜空穴的信息。

    (2)無線信道估計模塊。

    該模塊根據(jù)無線頻譜分析模塊的分析結(jié)果,對無線信道狀態(tài)和容量進行估計,為系統(tǒng)通信信道的選擇提供依據(jù)。

    (3)傳輸功率控制和動態(tài)頻譜管理模塊。

    該模塊根據(jù)頻譜分析模塊和信道估計模塊的分析結(jié)果,選擇最優(yōu)的頻譜空穴進行通信。在通信過程中對傳輸功率進行實時控制,使得首要用戶和次要用戶均能達到最優(yōu)的通信水平。

    S•Haykin給出的三個功能模塊共同構(gòu)成了CR系統(tǒng)的物理層,從各個模塊所具備的功能可以看出認知無線電是應(yīng)用了多種現(xiàn)代信號處理技術(shù)的綜合性通信平臺。

    2 非合作博弈論在認知無線電中的分析方法

    認知無線電中的策略選擇問題及相關(guān)算法的設(shè)計是該技術(shù)的研究核心。利用非合作博弈論,可以按以下方法及步驟對自適應(yīng)算法進行分析:

    (1)該算法是否能達到納什均衡。即驗證算法是否能達到納什均衡,具體步驟為:先將所研究的問題抽象為相應(yīng)的非合作博弈算法模型,然后證明該模型中NE的存在性和唯一性。

    (2)該算法達到納什均衡(NE)后的穩(wěn)定狀態(tài)是否符合帕累托最優(yōu)(Pareto Optimality)。即根據(jù)系統(tǒng)的目標函數(shù)衡量這一穩(wěn)定狀態(tài)是否是實際應(yīng)用環(huán)境中的最優(yōu)情況。

    (3)該算法達到納什均衡和帕累托最優(yōu)的約束條件。

    3 基于非合作博弈論的認知無線電功率控制模型

    在認知無線電中,非授權(quán)用戶接入處于空閑狀態(tài)的授權(quán)用戶頻段,可以提高系統(tǒng)的頻譜利用率,但是該接入過程必然會導(dǎo)致授權(quán)用戶和非授權(quán)用戶之間的干擾。這是由于在CR系統(tǒng)中通常采用動態(tài)功率控制以擴大通信系統(tǒng)的工作范圍,而每個用戶的發(fā)射功率都會對其他用戶造成干擾。2003年,為了規(guī)范移動頻段的非授權(quán)操作,美國聯(lián)邦通信委員會(FCC)提出了新的量化和管理干擾的指標――干擾溫度。在給定干擾溫度和頻譜空穴的限制下控制發(fā)射功率,可以看做為一組策略問題,而且在實際環(huán)境中很好的符合了非合作博弈的模型。在CR中,每個用戶都從自身的利益出發(fā),追求功率的最大化,而任何用戶發(fā)射功率的增大都會對其他用戶利益造成影響。因此需要提供一種有效的算法對各個用戶的發(fā)射功率進行動態(tài)控制,以達到所有用戶的總利益最大化。

    在CR中可以用信道利用率、系統(tǒng)吞吐量、系統(tǒng)信干比等指標來衡量用戶的利益。假設(shè)以系統(tǒng)信干比來衡量,設(shè)計算法時就應(yīng)當以系統(tǒng)的總干擾水平最小化為設(shè)計目標。

    通常把授權(quán)用戶稱為主要用戶(Primary User),非授權(quán)用戶稱為次要用戶(Secondary User)。假設(shè)通信環(huán)境中多個主要用戶和次要用戶同時工作,次要用戶具有認知能力,即把次要用戶看做認知用戶。假設(shè)認知用戶i的發(fā)射功率為pi,傳輸增益為gi,且認知用戶與基站存在通信鏈路,基站接收到的該用戶的功率為pigi,第j個主要用戶對第i個次要用戶的干擾為Qij并有M個主要用戶,則相應(yīng)的次要用戶在基站處的信干比(SNIR)為:

    ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)

    其中σ2為基站處背景噪聲,Ri為傳輸速率,W為第i個用戶在的擴頻帶寬。

    文獻提出的非合作的認知無線電網(wǎng)絡(luò)的功率控制純策略的博弈模型(NPCG)定義了:參與者I={1,2,…,N}為認知網(wǎng)絡(luò)中非授權(quán)用戶的集合;策略空間pi,認知用戶在一次博弈中選擇的策略構(gòu)成功率矢量P={p1,p2,…,pN};用 表示用戶i的效用,即用戶i對所選策略的滿意程度,其中p-i是除i外其他N-1個用戶的功率。

    在該模型中,每個認知用戶的策略都是盡量增大功率,以獲得更高的效用。但當功率超過干擾溫度后,整個系統(tǒng)的性能會迅速惡化,進而造成每個用戶的效用都會降低。因此,必須選定合適的代價函數(shù),使用戶獲得更高效用時付出相應(yīng)的代價??紤]到在低于干擾溫度時,用戶只需付出較小的代價,而當超過干擾溫度時,每增加一定的效用必須讓用戶付出更高昂的代價,筆者選擇SINR的正切函數(shù)做為代價函數(shù):

    Ci=tg(kri)(2)

    其中k為干擾系數(shù),在認知用戶發(fā)射功率接近干擾溫度時,kri的取值接近π2 。

    在非合作的認知無線電網(wǎng)絡(luò)的功率控制純策略的博弈模型的基礎(chǔ)上,結(jié)合式(2)筆者提出基于非合作的功率控制算法的數(shù)學模型:

    ui(pi,p-i)=Ripif(ri)-λpiritgri(3)

    其中piri表示增加單位信干比所要增加的功率,λ為懲罰因子,代表代價函數(shù)有效性的量度。該模型通過引入代價函數(shù)增加了懲罰機制,以此來控制認知用戶為追求信干比一味增大發(fā)射功率的行為。當功率超過干擾溫度后的嚴厲懲罰,會使所有認知用戶意識到,犧牲一定的信干比可以帶來效用的最優(yōu),從而將發(fā)射功率控制在干擾溫度以下,避免了超過干擾溫度后系統(tǒng)性能迅速下降的惡性情況出現(xiàn)。

    按照上節(jié)介紹的分析步驟對式(3)給出的模型進行分析,討論該模型是否存在納什均衡(NE)以及是否符合帕累托最優(yōu)。對式(3)求一階導(dǎo)數(shù)后可求得微分方程的駐點,進而再求出二階導(dǎo)數(shù),易證式(3)的二階導(dǎo)數(shù)小于零。因此可得出該非合作博弈過程中NE的存在性和唯一性,所求得的駐點為唯一的納什均衡點,同時該駐點即為所應(yīng)滿足的約束條件。

    4 結(jié)論

    認知無線電概念提出的20年以來,隨著相關(guān)技術(shù)的研究不斷深入、相關(guān)傳輸標準的確立以及計算機處理能力的提高,CR的應(yīng)用越來越廣泛。本文首先介紹了CR物理層的基本結(jié)構(gòu),然后結(jié)合一種新的基于NPCG的非合作非合作功率控制模型的構(gòu)建,介紹了非合作博弈論在認知無線電中的分析方法。綜上所述,我們有理由相信,隨著相關(guān)理論和技術(shù)的不斷進步,非合作博弈論必將在認知無線電的功率分配、頻譜分配以及其他核心研究方向發(fā)揮更大的作用。

    參考文獻

    [1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.

    [2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.