数学建模博弈理论与实践国防科大版

目录


4.博弈模型

本讲介绍博弈模型,包括博弈论(Game theory,又称对策论)中最基本的一些概念,以及非合作博弈论中的纳什平衡和帕雷托最优概念,同时介绍博弈论中的几个著名案例:囚徒困境、智猪博弈、脏脸之谜等。

1705677332424

博弈有5个基本要素:

  1. 局中人(选手)参与博弈的个人或团体。

  2. 策略(对策)可供局中人选择的行动方案。

  3. 赢利(获益)局中人的收益或支付。

  4. 信息 在策略选择中,信息是最关键的因素。

  5. 均衡 博弈的最终结果。

n人博弈模型的几个符号约定:

选手集:N={1, 2, …, n}

策略集:S1, S2, …, Sn

决策集:D∈S=S1xS2x···x Sn

赢利函数:f1,f2, …, fn D→R

例如:田忌赛马

S齐=S田={(上中下), {中下上}, {下上中}, {上下中}, {中上下}, {下中上}}

f齐{(上中下), (下上中)} = 0

f田{(上中下), (下上中)} = 1

下面讨论合作与不合作两种情形下的博弈

如果选手k知道了其他选手的策略xi,(i=1,2,…,n,i≠k),自然希望取策略 xk∈Sk

4.1.Nash平衡点和帕雷托最优

定义选手k的合理反应集为

Rk={(x1,.., xn)∈D|(x1, …, xn)使得(*)成立}

各选手都希望好、决策在各自的合理反应集中,所以称(x1, …, xn)∈R1∩···∩Rn

为n人非合作对策的一个纳什平衡点。

对于Nash平衡点,在别人不改变对策的情况下,每个选手的对策都是最好的,故他们都不会轻易去改变自己的对策。所以,非合作博弈的解将在Nash平衡点处出现。

Nash定理 非零和非合作博弈的Nash平衡点一定存在

问题 Nash平衡点对博弈各方是否一定是最优的?

再考虑合作情形。

记f=(f1,f2, …, fn)

定义:Dn={x∈D|f(x)≥f(x0)} x0是纳什平衡点

Dn称为合理集,最终的合作决策必定出自合理集中。

决策x∈D称为帕雷托(Pareto)最优的是指:D中不存在决策y使得f(y)>f(x)

4.2.囚徒困境

囚徒困境——非零和博弈

设两偷盗犯因被发现藏有被盗物品而被拘留。现被分别单独关押。两人都知道,如果都不承认偷盗,将以窝赃罪各判1年监禁;如果都承认,将以偷盗罪各判5年。但如果一人招认而另一人不承认,则坦白者将从宽处理获得释放,而抗拒者从严被判10年。这两个囚犯该如何选择自己的最优策略?

两个囚犯的策略集都是{x(招认), y(不招认)}

盈利函数分别为:

f1(x,x) = -5

f1(x,y) = 0

f1(y,x) = -10

f1(y,y) = -1

f2(x,x) = -5

f2(x,y) = -10

f2(y,x) = 0

f2(y,y) = -1

各自的合理反应集为:

R1 = {(x,x), (x, y)}

R2 = {(x,x),(y,x)}

4.3.智猪博弈

智猪博弈一弱势方的抉择

猪圈里有一头大猪,一头小猪。猪圈的一头有一个食槽,另一头有一个控制猪食供应的按钮按一次按钮,有10个单位的猪食入槽,但是按按钮要付出两个单位的跑动成本。若大猪先到食槽则大猪吃到9个单位猪食,小猪吃到1个单位;若两猪同时到达食槽,大猪吃7个单位猪食,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。

1705844162321

大猪按钮,小猪不动

4.4.脏脸之谜

脏脸之谜一共同知识

三姐妹从外面回到家里,她们的脸都是脏的,但她们自己并不知道。母亲见到她们后说道:“你们三人中至少有一个人的脸是脏的”,她们没有反应,因为这是一个显然的事实,她们认为母亲说的是一句“废话”。但当母亲追问一句“你们知道是谁吗?”她们先是互相看了一下,然后都脸红了,都知道自己的脸是脏的,这是为什么?

共同知识一每个人都知道这个事实,每个人都知道每个人都知道这个事实,每个人都知道每个人都知道每个人都知道这个事实,…

5.军事问题数学建模

5.1.兰彻斯特作战模型

第一次世界大战时提出的预测战争结局的模型

只考虑双方兵力多少和战斗力强弱。

兵力:

  1. 因战斗减员而减少

  2. 因非战斗减员而减少

  3. 因增援而增加

战斗力:

  1. 与射击率(单位时间的射击次数)、射击命中率以及战争的类型(常规战、游击战)等有关。

5.1.1.一般战斗模型

假设:

  1. 每一方的战斗减员率取决于双方的兵力和战斗力,用f(x,y)和g(x,y)表示。

  2. 每一方的增员率是给定的函数,用u(t)和v(t)表示。

模型如下:

1705935620080

-f(x,y) 单位时间内因为战斗减员而减少的兵力数

-ax 单位时间内因非战斗减员而减少的兵力数量

u(t) 单位时间内因增援而增加的兵力数量

dx/dt 单位时间内增加或减少的兵力数量

-g(x,y) 则是乙方的

1705974277732

将非战斗减员与增员归于初值中,则模型进一步简化为:

常规战模型相轨线

1705975570178

这就是平方律模型

5.1.2游击战模型

甲乙双方都用游击部队作战。

甲方士兵在乙方士兵看不到的某个面积为S的隐蔽区域内活动,乙方士兵不是向甲方士兵开火,而是向这个隐蔽区域射击,并且不知道杀伤情况。这时甲方战斗减员率不仅与乙方兵力有关,而且随着甲方兵力的增加而增加。

f可简单假设为:

f = ay = (cx)y = cxy

乙方的战斗有效系数

1705976263130

1705976271820

5.1.3.混合战模型

1705976441547

1705976479581

5.2.硫磺岛战役

思考题

1705977985018

版权声明:本文为博主作者:Williamtym原创文章,版权归属原作者,如果侵权,请联系我们删除!

原文链接:https://blog.csdn.net/Williamtym/article/details/136775206

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
乘风的头像乘风管理团队
上一篇 2024年4月16日
下一篇 2024年4月16日

相关推荐