什么是机器学习?顾名思义,用计算机模拟学习,那么要学习你首先要有一系列知道结果的数据,就好比是我们在刷题对答案,这些数据就是训练数据。举个例子,我们可以把训练数据组织成表格的形式,行对应对象,列对应对象特征,把对应的结果叫做类别标记label。
我们用这些训练数据训练模型,当模型收到新的样本数据时,就会根据新样本生成对应的结果。所以我们看出,这个所谓的‘模型’就是机器学习的核心产物,它是从数据中产生出来的,可以是神经网络,甚至可以是一条规则。机器学习的目的就是通过学习算法从数据中获得模型。
机器学习的目的就是以很高的概率得到一个近似正确的解。我们一般假设无论训练的数据还是预测的数据都是独立同分布的,这样才可以进行学习。突破这个假设是当前机器学习研究的重点方向之一。

下面介绍一些机器学习的常见术语:
事例instance:没有给结果的一条数据,一个事例由多个属性attribute/特征feature组成
样例example:有结果的数据
属性值:一个属性的取值
属性空间:我们可以把拥有不同属性的一个事例,看作一个向量(特征向量),不同的属性值就是不同坐标的数据,这样每条数据都存在于属性空间中。我们也可以把属性空间称为样本空间,输入空间。
输出空间:输出的内容也都是多元的,同样我们也可以把输出的内容到放到一个向量空间中
无监督学习:训练数据没有结果的学习(可以进行分类)