欢迎来到易学考试网易学考试官网

注册

全部科目 > 大学试题 > 计算机科学 > 人工智能

单项选择题

下面对博弈研究分类不正确的是（）

A.静态博弈与动态博弈
B.完全信息博弈与不完全信息博弈
C.合作博弈与非合作博弈
D.囚徒困境与纳什均衡

点击查看答案&解析

上一题目录下一题

相关考题

单项选择题
在强化学习中，通过哪两个步骤的迭代，来学习得到最佳策略（）

A.动态规划与Q-Learning
B.策略优化与策略评估
C.Q-learning 与贪心策略优化
D.价值函数计算与动作-价值函数计算
单项选择题
下面哪一种方法不是通过迭代计算贝尔曼方程来进行策略评估（）

A.动态规划
B.深度学习
C.时序差分（Temporal Difference）
D.蒙特卡洛采样
单项选择题
深度强化学习是深度学习与强化学习的结合。在深度强化学习中，神经网络被用来进行哪个函数的学习（）

A.Bellman方程
B.贪心策略函数
C.q函数
D.蒙特卡洛采样函数

微信小程序免费搜题

All Rights Reserved 版权所有©易学考试网(yxkao.com)

备案号：湘ICP备2022003000号-3

关注
顶部

微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题