【浙大机器学习】第一章

作者:wallace-lai
发布:2023
更新:2023

P1 机器学习定义

Arthur Samuel对机器学习的定义:

Machine Learning is Fields of study that gives computers the ablity to learn without being explicityly programmed

机器学习是这样的领域,它赋予计算机学习的能力,这种学习能力不是通过显著式编程获得的

Tom Mishell对机器学习的定义

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T T, as measured by P, improves with experience E

一个计算机程序被称为可以学习,是指它能够针对某个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着敬仰E的增加而提高

P2 机器学习的分类

按照任务是否需要和环境交互获得经验,机器学习可分为:

  • 监督学习

  • 强化学习

对监督学习进行更细致分类:

(1)按照训练数据是否存在标签,将监督学习分为:

  • 传统监督学习

  • 非监督学习

  • 半监督学习

(2)按照标签是否连续,将监督学习分为:

  • 分类问题

  • 回归问题

P3 机器学习算法的过程

P4 没有免费午餐定理

没有免费午餐定理:任何一个预测函数,如果在一些训练样本上表现好,那么必然在另一些训练样本上表现不好,如果不对数据在特征空间的先验分布有一定的假设,那么表现好与表现不好的情况一样多。

没有免费午餐定理说明,如果不对特征空间的先验分布有假设,那么所有的算法表现都一样;机器学习的本质是通过有限的已知数据,在复杂的高维特征空间中预测未知样本的属性和类别。然而,我们并不知道未知样本到底在哪里,它的性质到底如何,因此再好的算法也存在犯错误的风险。没有免费午餐定理说明,没有放之四海而皆准的最好算法。因为评价算法的好坏涉及到对特征空间先验分布的假设,然而没有人知道特征空间先验分布的真实样子

P5 总结