机器学习笔记1
课程网址:
http://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html
学习资料下载:
https://cs229.stanford.edu
preliminaries:
- 线性代数
- 概率论
- matlab/Octave
Machine Learning definition
-Arthur Samuel: Filed of study that gives computers the ability to learn without being explicitly programmed.
-Tom Mitchell: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
本课程主要包括下面四个方面:
Supervised Learning
监督学习分为两类,一类是回归(Regression),一类是分类(Classification),分别针对连续数据和离散数据。
Regression
以房屋买卖为例子,我们可以根据房屋的面积和价格建立联系,然后让机器学习提供他们之间的联系,然后当我提供其他输入的时候,机器可以返回给我一个答案。
之所以称为“监督”学习,是因为我们提供了标准答案,例如上面的价格。
Classification
以肿瘤为例子,我们可以搜集数据判断肿瘤是良性的或者恶性的。
##Learning Theory ##
理论的证明,比如如何证明能够将邮编的识别率达到99%。
Unsupervised Learning
我们不知道正确答案,比如给一些数据,能够得到什么数据结构。
聚类问题是其中的一类。
应用:
-用一张照片构建3D模型,wow
-Cocktail party problem (从party上所有说话的人中提取你感兴趣的那个人)
Reinforcement Learning
强化学习主要用在不需要进行一次决策的领域。比如在利用监督学习进行肿瘤预测的时候,你只需要预测一次。但是在强化学习中,需要在一段时间内做出一系列决策。比如,我们需要做一系列好的决策才能让无人机飞起来。
强化学习的基础是回报函数(reward function)。比如,狗狗做了好事,你会夸奖他”good dog”,做了坏事,你会说”bad dog”,贱贱地,他就学会了怎样做更多的好事。