单项选择题
在Q-Learning中,所谓的Q函数是指()。
A.状态动作函数 B.状态值函数 C.动作值函数 D.策略函数
单项选择题 ()有跟环境进行交互,从反馈当中进行不断的学习的过程。
单项选择题 典型的“鸡尾酒会”问题中,提取出不同人说话的声音是属于()。
判断题 梯度下降算法是最常用也是最有效的神经网络的优化办法,完全可以满足不同类型的需求。