1 XML文件
XML 指的是可扩展标记语言(eXtensible Markup Language),和json类似也是用于存储和传输数据,还可以用作配置文件。类似于HTML超文本标记语言,但是HTML所有的标签都是预定义的,而xml的标签可以随便定义。
<!--注释-->
<book category="python">
<title> xml test <\title>
<\bo
XML 指的是可扩展标记语言(eXtensible Markup Language),和json类似也是用于存储和传输数据,还可以用作配置文件。类似于HTML超文本标记语言,但是HTML所有的标签都是预定义的,而xml的标签可以随便定义。
<!--注释-->
<book category="python">
<title> xml test <\title>
<\bo
一般情况下,我们将正常客户标记为0,违约客户标记为1。
单位根又叫(unit root)。
当一个自回归过程中: $$y_{t} = by_{t-1} + a + \epsilon _{t}$$ 如果滞后项系数b为1,就称为单位根。当单位根存在时,自变量和因变量之间的关系具有欺骗性,因为残差序列的任何误差都不会随着样本量(即时期数)增大而衰减,也就是说模型中的残差的影响是永久的。这种回归又称作伪回归。如果单位根存在,这个过程就是一个随机漫步(random walk)。
补充:解释变量(即滞后被解释变量)的系数应该有三种情况:
通过对损失函数引入正则项,避免模型的过拟合的情况。
正则化的分析:随着$\delta$取值的增大,系数$\theta$趋近于0
将原始样本通过函数进行高维映射,并作为特征进行模型输入,提高模型对于信息的提取能力
比如最常见的高斯核/RBF核(RBF:Radial basis function/径向基函数)
$$k(x,\mu_i,\lambda)=exp{(-\frac{1}{\lambda}||x-\mu_i||^2)}$$
转换过程: $$\phi(x)=[k(x,\mu_1,\
维数灾难(英语:curse of dimensionality,又名维度的诅咒)是一个最早由理查德·贝尔曼(Richard E. Bellman)在考虑优化问题时首次提出来的术语,用来描述当(数学)空间维度增加时,分析和组织高维空间(通常有成百上千维),因体积指数增加而遇到各种问题场景。
当维数提高时,空间的体积提高太快,因而可用数据变得很稀疏。稀疏性对于任何要求有统计学意义的方法而言都是一个问题,为了获得在统计学上正确并且有可靠的结果,用来支撑这一结果所需要的数据量通常随着维数的提高而呈指数级增长,也使得很多策略变得十分低效。
6_course/机器学习/斯坦福CS224W 图机器学习/CS224W 图机器学习-课程总结 ⭐⭐⭐⭐⭐
MIT18.01单变量微积分-课程总结 ⭐⭐⭐⭐⭐
MIT18.02多变量微积分-课程总结⭐⭐⭐⭐⭐
DL.ai 大模型系列-课程总结 ⭐⭐⭐⭐
肖星-《财务分析与决策》课程总结⭐⭐⭐⭐⭐
项目整体耗时:2h 项目完成时间:2018-08-14 项目回顾时间:2021-09-01
设 $x_1,x_2,......x_m$ 是反映旅游经济状况的m个指标($x$均为正数) 设 $y_1,y