First of all,最近打算系统的学习一遍《统计学习方法》这本书,把里面提到的概念和公式都好好学习和推导一遍.因此今后的一系列文章将会记录一些我在阅读本书时的一些心得体会.
统计学习作为数据挖掘的手段,其目的就是通过对已知数据的学习,对未知的数据进行预测.第一章中主要介绍了一些基本的概念如监督学习\非监督学习,损失函数的定义,过拟合与欠拟合,回归和分类任务等基本的概念在此我就不细说了,下面重点说几个印象比较深同时也是以前没怎么搞懂的知识点.
风险函数与正则化
我们知道损失函数(loss function)可以用来度量模型一次预测的好坏,风险函数可以用来评价模型在平均意义下的预测好坏。我们把理论上的模型
我们学习的目标就是得到一个期望风险最小的模型,但是因为我们事先无法得到联合分布
当N趋向于无穷大时,经验风险就会趋向于我们所要的期望风险。但是现实情况下我们所获得的训练样本数往往不够,如果按照经验风险最小的约束进行训练,往往会导致模型出现过拟合的现象,我们往往会在经验风险后添加正则化项,从而实现结构风险最小,可有效的防止过拟合的发生.
其中
泛化误差上界的证明
事实上,泛化误差就是指所学习到的模型的期望风险,书中提到了二分类问题的泛化误差上界的证明问题,在此也想结合自己的理解把证明过程推导一遍。
首先证明需要用到Hoeffding不等式
以下是Hoeffding不等式的一个推论
其中
令
因
所以对于任意f,根据(7)式都有
令
即期望风险
(10)
不等式(10)的右侧即为二分类问题的泛化误差上界.
以上即为对《统计学习方法》一书第一章阅读后的一些感想与记录,之后我会按照大概一周一篇的速度更新对后续章节的阅读思考。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。