单项选择题
下面对混合策略纳什均衡描述正确的是()
A.博弈过程中,博弈方以非概率形式随机从可选收益中选择一个收益,而达到的纳什均衡被称为混合策略纳什均衡
B.博弈过程中,博弈方以概率形式随机从可选收益中选择一个收益,而达到的纳什均衡被称为混合策略纳什均衡
C.博弈过程中,博弈方通过概率形式随机从可选策略中选择一个策略而达到的纳什均衡被称为混合策略纳什均衡
D.博弈过程中,博弈方通过非概率形式随机从可选策略中选择一个策略而达到的纳什均衡被称为混合策略纳什均衡
点击查看答案&解析
相关考题
-
单项选择题
下面对博弈研究分类不正确的是()
A.静态博弈与动态博弈
B.完全信息博弈与不完全信息博弈
C.合作博弈与非合作博弈
D.囚徒困境与纳什均衡 -
单项选择题
在强化学习中,通过哪两个步骤的迭代,来学习得到最佳策略()
A.动态规划与Q-Learning
B.策略优化与策略评估
C.Q-learning 与贪心策略优化
D.价值函数计算与动作-价值函数计算 -
单项选择题
下面哪一种方法不是通过迭代计算贝尔曼方程来进行策略评估()
A.动态规划
B.深度学习
C.时序差分(Temporal Difference)
D.蒙特卡洛采样
