问题描述:
[单选]
2在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。
A.探索;开发
B.开发;探索
C.探索;输出
D.开发;输出
参考答案:查看无
答案解析:无
答案解析:无
- 我要回答: 网友(3.19.61.115)
- 热门题目: 1.10用于监督分类的算法有() 2.9基因遗传算法的两个常用的结 3.8关于人工智能的概念,下列表