分类目录归档:学习 | Digital Garden

分类目录归档：学习

1429 views

1 线图
2 散点图
3 条形图
4 直方图
5 箱线图
6 阶梯图
7 针状图
8 羽状图
9 等高线图
10 极坐标图
11 误差条形图
12 角度直方图

1 线图

x = 0:0.05:5;
y1 = sin(x.^2);
y2 = cos(x.^2);
plot(x,y1,x,y2)

附件/Pasted image 20210818175450.png

2 散点图

load patients Height Weight Systolic    % load data
scatter(Height,Weight,20,Systolic)      % color is systolic blood pressure
xlabel('He

MATLAB基础

发表评论

1699 views

1 MATLAB界面
2 变量和基本运算
3 基本绘图
4 程序流控制与脚本
脚本和函数

1 MATLAB界面

主界面：附件/Pasted image 20210818004547.png

命令行 Command Window

命令历史 Command History clc：清除命令窗口的内容

工作

MATLAB常用函数

发表评论

1808 views

1 固有函数
2 基本运算函数
3 三角函数
4 向量运算函数
5 format style
6 cylinder函数
7 mesh函数 | surf函数

1 固有函数

2 基本运算函数

3 三角函数

4 向量运算函数

5 format style

style - 输出显示格式
short （默认） | long | shortE | longE | ...

6 cylinder函数

[X,Y,Z] = cylinder 返回圆柱的 x、y 和 z 坐标而不对其绘图。返回的圆柱的半径等于 1，圆周上有 20 个等距点，底部平行于 xy 平面。

该函数以三个

统计分析总结

发表评论

1432 views

1 变量类型与统计方法
2 一张图看懂数据分析算法

1 变量类型与统计方法

附件/Pasted image 20210818215245.png

2 一张图看懂数据分析算法

附件/Pasted image 20210818215259.png

数据分析评价指标

发表评论

2403 views

1 金融领域常见指标
2 模型常见评价指标
3 多重共线性相关指标
4 信息准则类指标
- 4.1 AIC
- 4.2 BIC
- 4.3 HQ

1 金融领域常见指标

1.1 WoE（Weight of Evidence）

#WoE #风险评估 #评分卡

一般情况下，我们将正常客户标记为0，违约客户标记为1。

时间序列分析

发表评论

2251 views

单位根
平稳性
DF 检验
ADF 检验
自相关和偏自相关
奥恩斯坦-乌伦贝克过程
赫斯特指数

单位根

单位根又叫（unit root）。

当一个自回归过程中： $$y_{t} = by_{t-1} + a + \epsilon _{t}$$ 如果滞后项系数b为1，就称为单位根。当单位根存在时，自变量和因变量之间的关系具有欺骗性，因为残差序列的任何误差都不会随着样本量（即时期数）增大而衰减，也就是说模型中的残差的影响是永久的。这种回归又称作伪回归。如果单位根存在，这个过程就是一个随机漫步（random walk）。

补充：解释变量（即滞后被解释变量）的系数应该有三种情况：

小于1：不

数据处理技巧

发表评论

1639 views

1 正则化
2 核技巧
3 归一化处理
4 数据平衡
5 哑变量处理

1 正则化

通过对损失函数引入正则项，避免模型的过拟合的情况。

正则化的分析：随着$\delta$取值的增大，系数$\theta$趋近于0

#正则化

2 核技巧

将原始样本通过函数进行高维映射，并作为特征进行模型输入，提高模型对于信息的提取能力

比如最常见的高斯核/RBF核(RBF:Radial basis function/径向基函数)

$$k(x,\mu_i,\lambda)=exp{(-\frac{1}{\lambda}||x-\mu_i||^2)}$$

转换过程： $$\phi(x)=[k(x,\mu_1,\

回归算法族

发表评论

1594 views

1 线性回归
2 Lasso回归
3 ridge回归
4 非线性回归
5 逻辑回归
6 自回归
其他进阶技巧
实战案例

1 线性回归

面对$N$个形式为$(x_i,y_i)$样本组成的样本集，线性回归就是为了寻找形式为$y_{N\times1}=X_{N \times d}\theta_{d\times 1}$的线性方程，使其能最大程度拟合样本，而第一步便是建立线性回归的损失函数/目标函数： $$Loss(\theta)= (y-X\theta)^T(y-X\theta) $$

其中$y$表示真实值，$X\theta$表示的预测值，所以损失函数$Loss(\theta)$表示的便是真实

最小二乘法

发表评论

1419 views

1 最小二乘法

1 最小二乘法

狭义上的最小二乘法，主要针对线性回归问题，以残差平方和的总和最小为原则，化一般情况下，运用矩阵运算寻找最优的系数解，具体实现可参考1 线性回归的求解过程。

广义上的最小二乘法，增加了针对非线性问题的处理，围绕均方误差构建损失函数，使用迭代优化策略（比如梯度下降法）解决最小化优化问题

狭义最小二乘法的算法分析：

求解方便，不需要迭代优化，可以直接通过矩阵运算求出解析解
仅能处理线性回归问题，当特征维度高时矩阵求逆的运算成本偏高

梯度下降法族

发表评论

1668 views

1 梯度下降法-简单版
2 梯度下降法-矩阵版
3 批次（Batch）梯度下降法
4 随机（Stochastic ）梯度下降法
5 小批次（mini-batch）梯度下降法
6 带有动量（Momentum）的梯度下降法
7 自适应梯度下降（AdaGrad）算法
8 RMSProp算法
9 AdaDelta算法
10 Adam算法
11 其他优化技巧
进阶阅读
参考

1 梯度下降法-简单版

大部分机器学习模型的构建都是寻找最小损失函数的过程，而梯度下降法（Gradient Descent）便是一种常见迭代优化算法，用于寻找损失最小的参数解。

以简单二次函数为例进行算法的简单说明，模型形式

个人笔记

Digital Garden | 王半仙

1 线图

2 散点图

1 MATLAB界面

1 固有函数

2 基本运算函数

3 三角函数

4 向量运算函数

5 format style

6 cylinder函数

1 变量类型与统计方法

2 一张图看懂数据分析算法

1 金融领域常见指标

1.1 WoE（Weight of Evidence）

单位根

1 正则化

2 核技巧

1 线性回归

1 最小二乘法

1 梯度下降法-简单版