【西瓜书】线性模型

作者:wallace-lai
发布:2024-05-20
更新:2024-05-20

【pending】

本章的叙述逻辑:

(1)给出线性模型的基本形式

(2)介绍在线性模型之上的线性回归

(3)介绍单个属性时的线性回归模型的解法

(4)将单个属性的线性回归模型的解法推广到多元线性回归上

(5)介绍广义线性模型

(6)介绍广义线性模型的特例——对数几率回归,使用对数几率回归来解决分类问题

(7)介绍线性判别分析

(8)介绍多分类学习,即利用二分类学习器来解决多分类问题

(9)介绍如何解决类别不平衡问题

1. 基本形式

(1)线性模型的基本形式

给定由\(d\)个属性描述的示例\(\symbf{x} = (x_1;x_2;...;x_d)\),其中\(x_i\)\(\symbf{x}\)在第\(i\)个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测的函数,即:

\[ f(\symbf{x})=w_1x_1 + w_2x_2 + ... + w_dx_d + b \]

一般用向量形式写成:

\[ f(\symbf{x}) = \symbf{w}^T\symbf{x} + b \]

其中\(\symbf{w} = (w_1;w_2;...;w_d)\)\(\symbf{w}\)\(b\)学得之后,模型就得以确定。

2. 线性回归

(1)什么是线性回归?

(2)单属性的线性回归闭式解的推导

(3)一般的多变量线性回归的闭式解的推导

什么是线性回归?很简单,线性回归就是利用线性模型尽可能准确地去预测输出。

先考虑最简单的情形,即输入属性的数目只有一个。此时,线性回归试图学得

\[ f(x_i) = wx_i + b,使得f(x_i) \simeq y_i \]

为了确定\(w\)\(b\)的值,鉴于均方误差是回归任务中最常用的性能度量,因此可以试图让均方误差最小化,即

\[ (w^*,b^*) = arg min \]

没搞懂: (1)式3.7的推导

(2)式3.10的推导

(3)非满秩矩阵时,引入正则项如何做?

9. 类别不平衡问题

(1)为什么“再缩放”(rescaling)的思想在实际操作中非常困难?