• 标签: Q-Learning 共 1 个结果.
  • Q-Learning是一种用于强化学习的算法,用于训练智能体(agent)在环境中做出决策以最大化累积奖励的能力。Q-Learning是基于值函数的方法,通过学习一个值函数Q(s, a),其中s表示状态,a表示动作,来指导智能体在不同状态下选择最...
  • 上一页
  • 1
  • 下一页