发布于2023-04-20

强化学习MuJoCo环境安装

原创 997阅读 人工智能

这玩意儿是个大坑,网上很多都说mujoco200及以上的版本不能在windows上用。经过不断尝试,反复创建、删除了多次虚拟环境后终于在win11上装好了MuJoCo210版本以及MultiAgent_MuJoCo,为此写篇博客记录一下。

发布于2023-03-31

策略梯度(Policy Gradient)

原创 470阅读 人工智能

本学期讨论班让讲解强化学习的基本原理和算法,用以发掘从原理上可以改进的Idea,所以对之前学过的一些算法进行了总结,回顾和解决了一些以前初学时未注意到的细节问题。本篇即为其中的第一个算法:策略梯度。

发布于2022-10-19

降维—局部线性嵌入算法(LLE)

转载 244阅读 人工智能

转载文章,LLE降维算法,作者写的很详细易懂

发布于2022-09-27

机器学习笔记(八)——决策树

原创 396阅读 人工智能

决策树(分类树)是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。

发布于2022-05-14

机器学习笔记(七)——BP神经网络

原创 127阅读 人工智能

机器学习(七)——BP神经网络。
结合吴恩达课程和周志华《机器学习》整理出的推导过程。

发布于2022-04-27

机器学习笔记(六)——Logistic回归

原创 145阅读 人工智能

机器学习笔记(六)——Logistic回归
(吴恩达机器学习)视频链接:https://www.bilibili.com/video/BV1LE411h7P4?p=32

发布于2022-04-27

机器学习笔记(五)——k 近邻法

原创 227阅读 人工智能

机器学习笔记(五)——k 近邻法。
基于 李航《统计学习方法》第 3 章

发布于2022-04-22

机器学习笔记(四)——感知机

原创 140阅读 人工智能

机器学习笔记(四)——感知机。
参照 李航《统计学习方法》第 2 章。

发布于2022-04-17

机器学习笔记(三)——多元线性回归

原创 160阅读 人工智能

机器学习笔记(三)——多元线性回归
(吴恩达)视频链接:https://www.bilibili.com/video/BV1LE411h7P4?p=18

发布于2022-04-14

机器学习笔记(二)——单变量的线性回归

原创 276阅读 人工智能

机器学习笔记(二)——单变量的线性回归
(吴恩达)视频链接:https://www.bilibili.com/video/BV1LE411h7P4?p=5