关于纳什均衡和帕累托最优

纳什均衡，是非合作博弈中的一种策略组合。

所谓非合作博弈，是指一组博弈者在给定各自策略空间时，以期望效用最大化为目的进行策略选择，最终基于全部博弈者的策略实现一组结果的过程。

非合作博弈按照静态/动态和信息是否完全两个维度可以分为四类，分别是：

所谓纳什均衡，就是指：

完全信息静态博弈中存在的一个所有博弈者的符合以下条件的策略组合，给定其他博弈者策略不变，每一个博弈者都没有动机改变自己的策略。

纳什均衡是完全信息静态博弈中各博弈者策略构成的一个组合。

帕累托最优是指资源分配的一种理想状态。

假定固有的一群人和可分配的资源，如果从一种分配状态到另一种状态的变化中，在没有使任何人境况变坏的前提下，使得至少一个人变得更好，这就是帕累托改善。帕累托最优的状态就是不可能再有更多的帕累托改善的状态。

换句话说，不可能再改善某些人的境况，而不使任何其他人受损。

在传统博弈论中要想在纳什均衡中实现或趋近帕累托最优，一般的条件如下：

1、对合作行为给予奖励，对不合作行为给予惩罚。

这样，囚徒困境中双方不合作带来的回报将不再是最高，明显低于合作行为所得到的回报。

2、信息对称。

我知道你的选择，你知道我的选择；我知道你知道我的选择，你知道我知道你的选择，我知道你知道我知道你的选择。

3、重复博弈。

愿意吃亏、诚实的人更容易得到别人的信任。

因此，当博弈的次数足够多的话，建立良好合作形象的人更能得到与别人合作的机会。

而在这三个条件，最为重要的是重复博弈机制。

在一般的现实社会中，重复博弈机制很难被实现，更多的是单次博弈；而信息对称机制，更因为交易双方收集信息能力的差异性，一般都是非对称信息。

所以更多的时候虽然人们极力想避免囚徒困境，但更多的时候达成的结果是一种私利最优而社会福利最低的纳什均衡状态。

Leave a Reply 取消回复