作者文章归档:王半仙
1 主流神经网络架构
An overview of the main types of neural network architecture
1.1 前馈神经网络
Feed-forward neura
1 为什么需要机器学习
Why do we need machine learning?
面对一个复杂而多变的场景,我们很难通过单纯的程序逻辑去诠释:
- 如何在复杂环境中判断三维物体在不同灯光和角度下的状态?
- 如何合理推测信用卡欺诈的可能性?欺诈是一个动态可变的过程
机器学习的优势:
- 可以通过示例的输入输出进行算法自动学习,得到海量弱规则
- 好的(没有过拟合的)模型不仅适用于训练集,也适用于新的数据
- 面对动态可变的过程,可以通过新增数据训练,不断优化完善模型
神经网络
基本信息
1 课程标题:《机器学习与量化交易实战》
2 授课讲师:- 量化冯老师
3 授课日期:2016-10
4 品读时间:2021-08-19~2021-08-27
5 整体耗时:约35h
6 摘要
量化交易综述、机器学习综述、常用量化指标、基本建模流程 风险控制策略、模型评估改进、交易系统架构、指导深入方向
特征值与特征向量
浓缩矩阵的信息 ../../../1_study/math/线性代数基础
特征值、特征向量、谱定理、矩阵的快速幂、SVD
以上算是PCA的相关数学基础
PCA其中变量解耦的过程是值得衍生到其他领域的
投资组合风险控制
$$ \mathop{min}\limits_{w} (Risk) = w^T \Sigma w$$ $$ s.t. \ w_1+...w_n=1$$
- $\Sigma$表示投资组合的协方差矩阵
- $w$表示投资组合中各证券的权重
求解方式有
1 斐波那契数列
在文章开始之初,首先为大家介绍一个新生物,那就是斐波那契兔子。
斐波那契兔子是一种很神奇的物种,这种兔子寿命很长,而且具备很固定的繁殖周期和繁殖能力。每一只小兔子都需要经历一个月的成长周期变成大兔子,而每一对大兔子在坠入爱河后,都会历经一个月的生育周期繁衍出一对小兔子。
这么来看的话,如果第一个月有1对小兔子,那第二个月就会有1对大兔子,而第三个月又会出现2对兔子(一对是大兔子,一对小兔子)。以此类
ExtraTreesRegressor
- 相比随机森林的随机性更强
- 更好的避免过拟合
- 效果一般也会好一丢丢
模型分析
模型评价-mertic(mse、acc、r^2。。。)
问题分析-ROC AUC
此处指标详见../../../1_study/DataAnalysis/评价指标
NLP与量化建模
如何将新闻文本转化为训练集?
- 对文本进行中文分词(jieba)
- 去除一些不重要的停止词(常用+人工筛选)
常见问题
../../../1_study/DataAnalysis/数据平衡:数据可视化理解数据、选择模型
参数空间:样本与参数的经验规律、合理的寻参空间
独有特征:招行股价vs咨询舆情量化(NLP)
集成学习
三个臭皮匠 顶个诸葛亮
- 特征抽取
- 反复建模(弱学习器)
- 模型集成(强学习器)
相关概念:stocking、blending、voting、boost
讨论了adboost的理论以及三个特性
- 较低误差下限
- 难以过拟合
- 权重更新时候的加速计算技巧