发布于2023-04-20
强化学习MuJoCo环境安装
这玩意儿是个大坑,网上很多都说mujoco200及以上的版本不能在windows上用。经过不断尝试,反复创建、删除了多次虚拟环境后终于在win11上装好了MuJoCo210版本以及MultiAgent_MuJoCo,为此写篇博客记录一下。
发布于2023-03-31
策略梯度(Policy Gradient)
本学期讨论班让讲解强化学习的基本原理和算法,用以发掘从原理上可以改进的Idea,所以对之前学过的一些算法进行了总结,回顾和解决了一些以前初学时未注意到的细节问题。本篇即为其中的第一个算法:策略梯度。
发布于2022-09-27
机器学习笔记(八)——决策树
决策树(分类树)是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。
发布于2022-04-27
机器学习笔记(六)——Logistic回归
机器学习笔记(六)——Logistic回归
(吴恩达机器学习)视频链接:https://www.bilibili.com/video/BV1LE411h7P4?p=32
发布于2022-04-17
机器学习笔记(三)——多元线性回归
机器学习笔记(三)——多元线性回归
(吴恩达)视频链接:https://www.bilibili.com/video/BV1LE411h7P4?p=18
发布于2022-04-14
机器学习笔记(二)——单变量的线性回归
机器学习笔记(二)——单变量的线性回归
(吴恩达)视频链接:https://www.bilibili.com/video/BV1LE411h7P4?p=5