# 【西瓜书】线性模型
作者:wallace-lai
发布:2024-05-20
更新:2024-05-20
【pending】
本章的叙述逻辑:
(1)给出线性模型的基本形式
(2)介绍在线性模型之上的线性回归
(3)介绍单个属性时的线性回归模型的解法
(4)将单个属性的线性回归模型的解法推广到多元线性回归上
(5)介绍广义线性模型
(6)介绍广义线性模型的特例——对数几率回归,使用对数几率回归来解决分类问题
(7)介绍线性判别分析
(8)介绍多分类学习,即利用二分类学习器来解决多分类问题
(9)介绍如何解决类别不平衡问题
## 1. 基本形式
(1)线性模型的基本形式
给定由$d$个属性描述的示例$\symbf{x} = (x_1;x_2;...;x_d)$,其中$x_i$是$\symbf{x}$在第$i$个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测的函数,即:
$$
f(\symbf{x})=w_1x_1 + w_2x_2 + ... + w_dx_d + b
$$
一般用向量形式写成:
$$
f(\symbf{x}) = \symbf{w}^T\symbf{x} + b
$$
其中$\symbf{w} = (w_1;w_2;...;w_d)$,$\symbf{w}$和$b$学得之后,模型就得以确定。
## 2. 线性回归
(1)什么是线性回归?
(2)单属性的线性回归闭式解的推导
(3)一般的多变量线性回归的闭式解的推导
什么是线性回归?很简单,线性回归就是利用线性模型尽可能准确地去预测输出。
先考虑最简单的情形,即输入属性的数目只有一个。此时,线性回归试图学得
$$
f(x_i) = wx_i + b,使得f(x_i) \simeq y_i
$$
为了确定$w$和$b$的值,鉴于均方误差是回归任务中最常用的性能度量,因此可以试图让均方误差最小化,即
$$
(w^*,b^*) = arg min
$$
没搞懂:
(1)式3.7的推导
(2)式3.10的推导
(3)非满秩矩阵时,引入正则项如何做?
## 9. 类别不平衡问题
(1)为什么“再缩放”(rescaling)的思想在实际操作中非常困难?