欢迎来到易学考试网 易学考试官网
全部科目 > 大学试题 > 计算机科学 > 人工智能

单项选择题

下面哪一种方法不是通过迭代计算贝尔曼方程来进行策略评估()

    A.动态规划
    B.深度学习
    C.时序差分(Temporal Difference)
    D.蒙特卡洛采样

点击查看答案&解析
微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题