1 模型特征
特征的选择是非常个性化的过程
因子的选择取决于你对问题的理解
常见基础指标列举: 基础指标 常见经济指标 常见股指 常见汇率
常见技术指标列举(包含python实现)
2 模型建立
探究了决策树和随机森林之间的关系,并引出了对集成算法的讨论,内容较为简略,深度不够,不再赘述。
之后简单提及了一些模型和概念 逻辑回归 1_study/algorithm/分类回归算法/支持向量机 SVM]] [[基础神经网络 损失函数
Machine Learning is the field of study that gives computers the ability to learn without being explicitly programmed. ---- Arthur Samuel (1959)
机器学习应用
任务目标
金融数据源
存储方式:csv、sql、nosql
数据格式
- 交易所信息
- 数据来源
- Ticker/symbol
- 价格
- 企业行为(stock splits
病毒感染数据模拟
视频变成连续照片
中英文对齐+位置互换 = 数据增强 + 迁移学习的兼容性提高
场景不同的迁移学习 = 根据常见关键点 抽取 前后矩阵 进而提取 转化矩阵 实现自动化迁移
matlab基本界面 matlab变量和基本运算 matlab基本绘图技巧和常用绘图列表 matlab循环和判断逻辑 matlab函数定义和脚本撰写 matlab进行微分、积分、数据拟合、数值求解的方法
相关练习: 编写函数:计算n的阶乘 基于蒙特卡洛法计算pi 解方程 log x sin x
国内现状:目前以商业银行和消费金融公司为主,主要通过个人基本信息、银行数据(授权)、交易数据、社交数据等,来进行信用评级
评分卡分类:
名称 | 所处阶段 | 所含数据 |
---|---|---|
申请评分卡 | 评价申请阶段客户信用风险 | 只有基本信息,无客户交易信息 |
申请评分卡 | 通过客户的行为评估客户风险 | 包含基本信息和客户行为信息 |
催收评分卡 | 对已逾期或违约的客户进行评分 | 额外的催收后客户反应等数据 |
评分卡的观察期
% fact.m
function output = fact(n)
% FACT Calculate factorial of a given positive integer.
output = 1;
for i = 1:n
output = output*i;
end