信息论基础 发表评论 1677 views 1 信息 2 熵 2.1 联合熵 2.2 条件熵 3 信息增益 3.1 信息增益比 4 基尼系数 5 KL散度 6 交叉熵 参考 1 信息 信息是不确定性的减少或消除——香农 对于随机变量X来说,其取值可能为x0,x1,...,xn 假设变量X对应的概率分布为p,则X=x0的信息量为 I(x0)=−log(p(x0)) 2 熵 熵(entropy)度量了事物的不确定性 不确定越高的事物,它的熵就越大。 随机变量X的熵可以表示如下: H(X)=−Σi=1npilog(pi) 其中n表示X的所有 Read more
数据分析评价指标 发表评论 2358 views 1 金融领域常见指标 1.1 WoE(Weight of Evidence) 1.2 CAP曲线 1.3 GINI/AR (Accuracy Ratio) 1.4 K-S检验 (Kolmogorov-Smirnov Test ) 2 模型常见评价指标 3 多重共线性相关指标 3.1 统计检验类 3.2 拟合优度的衍生 3.3 特征值与解释度 4 信息准则类指标 4.1 AIC 4.2 BIC 4.3 HQ 1 金融领域常见指标 1.1 WoE(Weight of Evidence) #WoE #风险评估 #评分卡 一般情况下,我们将正常客户标记为0,违约客户标记为1。 Read more