在ε-greedy策略当中，ε的值越大，表示采用随机的一个动作的概率越（），采用当前Q函数值最大的动作的概率越（）。A.大；小B.大；大C.小；小D.小；大

单项选择题

在ε-greedy策略当中，ε的值越大，表示采用随机的一个动作的概率越（），采用当前Q函数值最大的动作的概率越（）。

A.大；小
B.大；大
C.小；小
D.小；大

相关考题

单项选择题在强化学习的过程中，学习率α越大，表示采用新的尝试得到的结果比例越（），保持旧的结果的比例越（）。

单项选择题 Q函数Q（s，a）是指在一个给定状态s下，采取某一个动作a之后，后续的各个状态所能得到的回报的（）。

单项选择题在Q-Learning中，所谓的Q函数是指（）。

经营许可证号：湘B2-20140064

人工智能与信息社会