自编码器,一种借助神经网络结构进行无监督学习的算法,常用于降维
自编码器主要有两个部分组成
- 编码器,用于将输入数据编码为低维稠密向量
- 解码器,根据低维稠密向量解码还原输入向量
最简单的自编码器形式是一个前馈无循环的神经网络,如下所示:
(图源:维基百科-自编码器)
自编码器VS主成分分析(PCA)
- 自编码器是非线性降维,PCA是线性降维,前者效果一般更好
- 前者通过梯度下降法训练,训练速度慢且不容易收敛
- 后者通过特征分解直接计算,计算成本低效率高
主成分分析(Principal components analysis,PCA),一种常用的线性降维方法
算法步骤:
图像理解:
(图源:维基百科-主成分分析)
PCA 的优缺点分析:
尺度不变特征变换匹配算法(Scale Invariant Feature Transform 简称 SIFT)
SIFT算法常用来提取用于描述影像中的局部性特征,算法主要从空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量
算法过程:
期望最大化(Expectation-Maximum,简称EM)算法是一种机器学习常见基础算法
EM算法常用于处理存在隐变量的最大似然估计模型,训练过程简单描述如下:
以K-means聚类为例进行直观理解:
EM算法作为一种基础算法,广泛应用于多种算法模型的学习过程,比如:隐马尔可夫模型 HMM
这类算法思想在其他模型中也经常遇见,比
DOI:缺失
作者:Geoffrey E Hinton, Zoubin
输入重定向:
<
:将指定文件的内容作为前面命令的参数
输出重定向:
>
:直接把输出覆盖保存到指定文件
>>
:把输出尾部追加保存到指定文件
/dev/null
- 类Unix系统中的一个特殊的设备文件
- 作用是像垃圾桶一样接收一切写入其中的数据并丢弃
- 写入操作会提示成功,读取操作会返回一个EOF报错
用于不挂断地运行命令(关闭当前session不会中断程序,只能通过kill等命令删除) 默认情况下该程序的输出都会被重定向到nohup.out文件中,也可以通
计算机视觉应具备的两个特性:
为了满足以上两点,神经网络引入了卷积层的概念
复习:卷积的公式定义如下: