欢迎来到易学考试网 易学考试官网
全部科目 > 大学试题 > 计算机科学 > 人工智能

单项选择题

下面对上限置信区间(Upper Confidence Bound,UCB)算法在多臂赌博机中的描述,哪句描述是不正确的()

    A.UCB算法是优化序列决策问题的方法
    B.UCB算法每次随机选择一个赌博机来拉动其臂膀
    C.UCB算法既考虑拉动在过去时间内获得最大平均奖赏的赌博机,又希望去选择那些拉动臂膀次数最少的赌博机
    D.UCB算法在探索-利用(exploration-exploitation)之间寻找平衡

点击查看答案&解析

相关考题

微信小程序免费搜题
微信扫一扫,加关注免费搜题

微信扫一扫,加关注免费搜题