数学建模博弈理论与实践国防科大版

4.博弈模型

本讲介绍博弈模型，包括博弈论（Game theory，又称对策论）中最基本的一些概念，以及非合作博弈论中的纳什平衡和帕雷托最优概念，同时介绍博弈论中的几个著名案例：囚徒困境、智猪博弈、脏脸之谜等。

1705677332424

博弈有5个基本要素：

局中人（选手）参与博弈的个人或团体。
策略（对策）可供局中人选择的行动方案。
赢利（获益）局中人的收益或支付。
信息在策略选择中，信息是最关键的因素。
均衡博弈的最终结果。

n人博弈模型的几个符号约定：

选手集：N={1, 2, …, n}

策略集：S1, S2, …, Sn

决策集：D∈S=S1xS2x···x Sn

赢利函数：f1,f2, …, fn D→R

例如：田忌赛马

S齐=S田={(上中下), {中下上}, {下上中}, {上下中}, {中上下}, {下中上}}

f齐{(上中下), (下上中)} = 0

f田{(上中下), (下上中)} = 1

下面讨论合作与不合作两种情形下的博弈。

如果选手k知道了其他选手的策略xi，(i=1,2,…,n,i≠k），自然希望取策略 xk∈Sk

4.1.Nash平衡点和帕雷托最优

定义选手k的合理反应集为

Rk={(x1,.., xn)∈D|(x1, …, xn)使得(*)成立}

各选手都希望好、决策在各自的合理反应集中，所以称(x1, …, xn)∈R1∩···∩Rn

为n人非合作对策的一个纳什平衡点。

对于Nash平衡点，在别人不改变对策的情况下，每个选手的对策都是最好的，故他们都不会轻易去改变自己的对策。所以，非合作博弈的解将在Nash平衡点处出现。

Nash定理 非零和非合作博弈的Nash平衡点一定存在

问题 Nash平衡点对博弈各方是否一定是最优的？

再考虑合作情形。

记f=(f1,f2, …, fn)

定义：Dn={x∈D|f(x)≥f(x0)} x0是纳什平衡点

Dn称为合理集，最终的合作决策必定出自合理集中。

决策x∈D称为帕雷托（Pareto）最优的是指：D中不存在决策y使得f(y)>f(x)

4.2.囚徒困境

囚徒困境——非零和博弈

设两偷盗犯因被发现藏有被盗物品而被拘留。现被分别单独关押。两人都知道，如果都不承认偷盗，将以窝赃罪各判1年监禁；如果都承认，将以偷盗罪各判5年。但如果一人招认而另一人不承认，则坦白者将从宽处理获得释放，而抗拒者从严被判10年。这两个囚犯该如何选择自己的最优策略？

两个囚犯的策略集都是{x(招认), y(不招认)}

盈利函数分别为：

f1(x,x) = -5

f1(x,y) = 0

f1(y,x) = -10

f1(y,y) = -1

f2(x,x) = -5

f2(x,y) = -10

f2(y,x) = 0

f2(y,y) = -1

各自的合理反应集为：

R1 = {(x,x), (x, y)}

R2 = {(x,x),(y,x)}

4.3.智猪博弈

智猪博弈一弱势方的抉择

猪圈里有一头大猪，一头小猪。猪圈的一头有一个食槽，另一头有一个控制猪食供应的按钮按一次按钮，有10个单位的猪食入槽，但是按按钮要付出两个单位的跑动成本。若大猪先到食槽则大猪吃到9个单位猪食，小猪吃到1个单位；若两猪同时到达食槽，大猪吃7个单位猪食，小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位。

1705844162321

大猪按钮，小猪不动

4.4.脏脸之谜

脏脸之谜一共同知识

三姐妹从外面回到家里，她们的脸都是脏的，但她们自己并不知道。母亲见到她们后说道：“你们三人中至少有一个人的脸是脏的”，她们没有反应，因为这是一个显然的事实，她们认为母亲说的是一句“废话”。但当母亲追问一句“你们知道是谁吗？”她们先是互相看了一下，然后都脸红了，都知道自己的脸是脏的，这是为什么？

共同知识一每个人都知道这个事实，每个人都知道每个人都知道这个事实，每个人都知道每个人都知道每个人都知道这个事实，…

5.军事问题数学建模

5.1.兰彻斯特作战模型

第一次世界大战时提出的预测战争结局的模型

只考虑双方兵力多少和战斗力强弱。

兵力：

因战斗减员而减少
因非战斗减员而减少
因增援而增加

战斗力：

与射击率（单位时间的射击次数)、射击命中率以及战争的类型(常规战、游击战)等有关。

5.1.1.一般战斗模型

假设：

每一方的战斗减员率取决于双方的兵力和战斗力，用f(x,y)和g(x,y)表示。
每一方的增员率是给定的函数，用u(t)和v(t)表示。

模型如下：

1705935620080

-f(x,y) 单位时间内因为战斗减员而减少的兵力数

-ax 单位时间内因非战斗减员而减少的兵力数量

u(t) 单位时间内因增援而增加的兵力数量

dx/dt 单位时间内增加或减少的兵力数量

-g(x,y) 则是乙方的

1705974277732

将非战斗减员与增员归于初值中，则模型进一步简化为：

常规战模型相轨线

1705975570178

这就是平方律模型

5.1.2游击战模型

甲乙双方都用游击部队作战。

甲方士兵在乙方士兵看不到的某个面积为S的隐蔽区域内活动，乙方士兵不是向甲方士兵开火，而是向这个隐蔽区域射击，并且不知道杀伤情况。这时甲方战斗减员率不仅与乙方兵力有关，而且随着甲方兵力的增加而增加。

f可简单假设为：

f = ay = (cx)y = cxy

乙方的战斗有效系数

1705976263130

1705976271820

5.1.3.混合战模型

1705976441547

1705976479581

5.2.硫磺岛战役

思考题

1705977985018

原文链接：https://blog.csdn.net/Williamtym/article/details/136775206