从零开始的机器学习

一天三只皮卡丘

2024年06月01日 18:54

什么是机器学习？顾名思义，用计算机模拟学习，那么要学习你首先要有一系列知道结果的数据，就好比是我们在刷题对答案，这些数据就是训练数据。举个例子，我们可以把训练数据组织成表格的形式，行对应对象，列对应对象特征，把对应的结果叫做类别标记label。

我们用这些训练数据训练模型，当模型收到新的样本数据时，就会根据新样本生成对应的结果。所以我们看出，这个所谓的‘模型’就是机器学习的核心产物，它是从数据中产生出来的，可以是神经网络，甚至可以是一条规则。机器学习的目的就是通过学习算法从数据中获得模型。

机器学习的目的就是以很高的概率得到一个近似正确的解。我们一般假设无论训练的数据还是预测的数据都是独立同分布的，这样才可以进行学习。突破这个假设是当前机器学习研究的重点方向之一。

下面介绍一些机器学习的常见术语：

事例instance：没有给结果的一条数据，一个事例由多个属性attribute/特征feature组成

样例example：有结果的数据

属性值：一个属性的取值

属性空间：我们可以把拥有不同属性的一个事例，看作一个向量（特征向量），不同的属性值就是不同坐标的数据，这样每条数据都存在于属性空间中。我们也可以把属性空间称为样本空间，输入空间。

输出空间：输出的内容也都是多元的，同样我们也可以把输出的内容到放到一个向量空间中

无监督学习：训练数据没有结果的学习（可以进行分类）

cv34987466

分享至

投诉或建议