新宇

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 102|回复: 0

《合作的进化》读书笔记

[复制链接]

3

主题

3

帖子

9

积分

新手上路

Rank: 1

积分
9
发表于 2023-1-9 12:30:37 | 显示全部楼层 |阅读模式
核心问题

第一,潜在的合作策略如何才能在不合作占优势的环境中取得最初的立足之地?第二,何种策略能在由其他各种简单和复杂的策略组成的多样化环境中脱颖而出?第三,在何种条件下,这样的策略一旦在群体中完全立足,就能抵御不合作策略的侵入?
即 初始成活性、鲁棒性和稳定性

基本假设

模型:重复囚徒困境

  • 非集权
  • 非零和
  • 自私
目的

建立一个合作理论以帮助我们理解合作出现的必要条件。了解了合作出现的条件,就可以采取适当的行动来培育某个特定环境下的合作

从囚徒困境出发

条件

  • 策略的单人回报关系满足 单方背叛>合作>双方背叛
  • 整体回报关系满足 双方合作 > 单方背叛
折扣系数w:第n回的收益为当前回合i收益的w^(n-i)倍,0<w<1
命题1:如果折扣系数w足够大,则不存在独立于对方所采用的策略的最优策略。

优势策略的特征

一个成功的决策规则所应有的四个特性:

  • 只要对方合作你就合作以避免不必要的冲突;优先合作
    (有一个特性可以把得分相对高的程序和得分相对低的程序区别开来,它就是善良性,即从不首先背叛)
  • 面对他人的无理背叛你是可激怒的;立即报复
    (否则会被小人规则“唐宁”利用,进而拉低得分)
  • 在给挑衅以反击之后你是宽容的;不记仇
    (一次背叛后永远背叛的策略“弗里德曼”也会导致低分)
  • 行为要简单清晰,使对方能适应你的行为模式;可预期
    (“乔斯”的偶尔背叛能让其小赢一报还一报,但却导致对其他策略时得分很低)
区分善良决策(博弈开始默认合作)之间差异的因素:

  • 面对检验者,一个专门欺负老好人的规则。不能及时报复的规则会被占不少便宜
  • 面对镇定者,
能占小便宜的规则在对其他及时报复的规则时表现很差,导致整体得分偏低。捡了芝麻丢了西瓜。

合作产生,演化

1.起始阶段:合作可以在一个无条件背叛的世界里产生。零散个体之间几乎没有机会交往,合作也就不会产生。然而,以相互回报合作为宗旨的小群体之间,一旦有交往的可能,合作便会出现。
2.中间阶段:基于回报的策略能够在许多不同类型的策略组成的环境里成长起来。
3.最后阶段:基于回报的合作一旦建立起来,就能防止其他不太合作的策略的侵入。因此,社会进化的齿轮是不可逆转的。

命题2:当且仅当w足够大时,“一报还一报”是集体稳定的。且w的临界值是四个收益参数T、R、P和S的函数。

命题3:只有当w足够大时,任何可能首先合作的策略才可能是集体稳定的。

命题4:对于善良的策略,如果是集体稳定的,它就必须能被对方的第一个背叛所激怒。

-> 是否合作很大程度上取决于人们对今后是否还能合作的预期

命题5:“总是背叛”策略总是集体稳定的。
前提是合作者是单个加入这个“总是背叛”的集体。如果是以小团体形式加入,合作依然有可能产生(在合理假设下,一报还一报策略的团体只需要占5%即可)

命题6:能以最小p值的一个小群体侵入“总是背叛”的策略是那些具有最大识别力的策略,如“一报还一报”。

命题7:如果一个善良的策略不能被单个个体侵入,那么它也不能被这类个体的小群体侵入。

应用与启发

在持续的“重复囚徒困境”中应如何表现,下面是四个简单的建议:
1.不要嫉妒;
2.不要首先背叛;
3.对合作与背叛都要给以回报;
4.不要耍小聪明。
零和博弈下隐藏自己的真实想法,让对方猜不透是有益处的,而非零和博弈却相反,因为合作才能产生更大的收益,而合作建立在能够预见对方不会背叛的基础上
促进双方合作可以从三个方面着手:使得未来相对于现在更重要些;改变对策者的四个可能的结果的收益值;教给对策者那些促进合作的准则、事实和技能
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|新宇

GMT+8, 2025-3-15 18:05 , Processed in 0.072694 second(s), 19 queries .

Powered by Discuz! X3.4 技术支持:迪恩网络

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表