欢迎来到易学考试网易学考试官网

注册

全部科目 > 资格类 > 人工智能训练师

判断题

强化学习中的策略梯度方法是一种直接优化策略参数的算法，不需要估计价值函数。

【参考答案】

正确

(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)

点击查看答案&解析

上一题目录下一题

相关考题

微信小程序免费搜题

All Rights Reserved 版权所有©易学考试网(yxkao.com)

备案号：湘ICP备2022003000号-3

关注
顶部

微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题