分类目录归档:学习

特征工程

特征工程常用

常用特征处理:

  • 常见时间日期类特征:年/月/时、第几周/周次、是否周末、节假日、时差等
  • 日期类聚合特征:客户最活跃的月份、某类产品上周累计销售、特定客户的周末消费额等
  • 常用统计类特征:最值、均值、唯一值、偏度、峰度、KStat、分位数等

更多时序类衍生特征可参考1_study/Python/Python 数据处理/tsfresh 时序特征聚合工具

其他特征处理技巧:

  • 多项式特征(preprocessing.PolynomialFeatures
  • 分箱(数值型变量 转 类别型变量,pandas.cut
  • 对数化(修正存

Read more

支持向量机

支持向量机(support vector machine,简称为SVM)

  • 作为经典的有监督学习算法,常用于分类与回归分析问题中
  • 支持向量机有着完备而优雅的数学理论,并且计算成本低效果好
  • 在集成学习与深度学习流行前,SVM 在很多领域都是非常主流的算法

SVM 算法图解:

  • SVM 核心思想在于通过寻找一个超平面,尽可能的分隔不同类别间的样本
  • 支持向量(support vector):用于确定超平面边缘的部分样本

SVM 借助核技巧将输入隐式映射到高维特征空间中,从而有效地进行非线性分类

常见的核函数:

核函数 表达式 备注
Linear Kerne

Read more

金融常见理论

市场有效假说

  1. 在市场上的每个人都是理性的经济人
  2. 股票的价格反映了这些理性人的供求的平衡
  3. 股票的价格也能充分反映该资产的所有可获得的信息,即"信息有效"

#有效市场 #充分竞争 #完全竞争 #市场有效

CAPM

个股的CAPM:

$$r_i(t)=beta_i\times r_m(t)+alpha_i(t)$$ $$E(alpha(t))=0$$ 公式解析:个股的收益率主要取决于市场收益率$r_m$、个股和市场收益率的关系$beta_i$和个股的波动性$alpha_i$,模型默认个股波动性的期望值为0(市场有效假说成立)。

投资组

Read more

量化投资指标

TA-LIB-内置 150 量化指标计算器

1 常见缩写

  • Time lags:过去时间点的特征,有不同的时间窗口
  • MA(Moving Average):移动平均
  • EMA(Exponential moving average):指数移动平均
  • SMA(Simple Moving Average):简单移动平滑
# Moving Averages

Read more

基金的分类

主动式 vs 被动式

被动式管理:复制大盘指数,持有。 主动式管理:选择个股,频繁交易

交易所交易基金 ETF

交易所交易基金(Exchange Traded Fund,ETF)是一种开放式指数基金,旨在为投资者提供对某个特定市场、行业或投资策略的广泛暴露。

  • ETF的交易方式类似于个股,可以在证券交易所上市交易,可以通过普通经纪账户进行买卖
  • 与传统指数基金相比,ETF具有更高的流动性和交易灵活性,可以在交易日内任何时间进行交易
  • ETF通常以低廉的费用提供多元化投资机会,因此成为越来越受欢迎的投资工具之一

Read more

股票交易术语

Limit Order Book 限价指令簿

A limit order book is a record of outstanding limit orders maintained by the security specialist who works at the exchange. A limit order is a type of order to buy or sell a security at a specific price or better. A buy limit order i

Read more

MATLAB进阶

1 高级数据类型

1.1 元胞数组

  1. 其他数组的副本为元素的多维数组
  2. 使用 cell 函数可以创建空矩阵的元胞数组
  3. 通过花括号 {} 来创建元胞数组更常见
  4. 元胞数组可用于存储不同大小的矩阵序列
M = cell(8,1);
for n = 1:8
   M{n} = magic(n);
end
M
% reuslt
M = 
    [           1]
    [ 2x2  d

Read more

MATLAB常用绘图

1 线图

x = 0:0.05:5;
y1 = sin(x.^2);
y2 = cos(x.^2);
plot(x,y1,x,y2)

附件/Pasted image 20210818175450.png

2 散点图

load patients Height Weight Systolic    % load data
scatter(Height,Weight,20,Systolic)      % color is systolic blood pressure
xlabel('He

Read more

MATLAB基础

1 MATLAB界面

主界面: 附件/Pasted image 20210818004547.png

命令行 Command Window

命令历史 Command History clc: 清除命令窗口的内容

工作

Read more

MATLAB常用函数

1 固有函数

附件/Pasted image 20210818010102.png

2 基本运算函数

附件/Pasted image 20210818005252.png

3 三角函数

附件/Pasted image 20210818005319.png

4 向量运算函数

附件/Pasted image 20210818005928.png

5 format style

style - 输出显示格式
short (默认) | long | shortE | longE | ...

附件/Pasted image 20210818142553.png

6 cylinder函数

[X,Y,Z] = cylinder 返回圆柱的 x、y 和 z 坐标而不对其绘图。返回的圆柱的半径等于 1,圆周上有 20 个等距点,底部平行于 xy 平面。

该函数以三个

Read more