1 Time in : 学习后的短暂静思
Look inside:内省是必要的
哈佛教授研究:将老鼠反复的扔进迷宫中,一个不停的放入迷宫,一个每次从迷宫出来后稍作休息。并扫描脑电波。在短暂的休息中,会增强之前知识的理解和记忆,是学习的一个重要时期。
So what they say is that "replay maight consitutude a general mechanism of learning and memo
Look inside:内省是必要的
哈佛教授研究:将老鼠反复的扔进迷宫中,一个不停的放入迷宫,一个每次从迷宫出来后稍作休息。并扫描脑电波。在短暂的休息中,会增强之前知识的理解和记忆,是学习的一个重要时期。
So what they say is that "replay maight consitutude a general mechanism of learning and memo
随机矩阵:元素为随机变量的矩阵,属于概率论与矩阵分析的交叉领域
系综:对符合某种分布的随机变量进行多次取值,得到的矩阵集合
具有统计独立性的实或复矩阵系综,在基变换下分布具有不变性,如果变换是正交的(orthogonal)、酉的(unitary)或辛的(symplectic),则分别得到高斯正交系综(Gaussian Orthogonal Ensemble,GOE),高斯酉系综(Gaussian Unitary Ensemble,GUE)或高斯辛系综(Gaussian Symplectic Ensemble,GSE)
此处可先简单理解为,酉变换是实数域的正交变换在复数域上的拓展。对应关系
瑞利熵(Rayleigh quotient)函数定义如下: $$R(A,x)=\frac{x^HAx}{x^Hx}$$
瑞利熵$R(A,x)$的重要性质: $$\lambda_{min}\leq R(A,x)\leq \lambda_{max}$$
血气是指血液中所含的$O_2$和$CO_2$气体
拉普拉斯特征映射(Laplacian Eigenmaps,简称LE)是一种基于图的降维算法
LE算法核心思想:在低维空间内,尽可能保证局部样本间的结构不变
LE算法步骤:
LE算法分析:
谱聚类(spectral clustering):一种基于图的聚类算法
前置知识:图论基础概念、图论基础#3.1 理解拉普拉斯矩阵
核心思想:将数据转化为图的形式,距离近的数据间对应的边权重高,距离远的数据间对应的边权重低。之后通过切图的方式,使得不同子图间的边权值和尽可能低,子图内部的边权值和尽可能高,从而达到聚类的目的
核心思想:把每个样本看作一个节点,然后构建任意两点$(x_i,x_j)$间权重边$w_{ij}$
方法1
正则表达式(Regular Expression,简写为regex、或RE)是一种描述句法规则的字符串,常用来匹配符合某个模式(pattern)的文本,以实现针对特定文本的检索(search,findall)、替换(replace)等目的。
常见应用:文本/文件查找、数据/网页清洗、非格式化数据转格式化
在线测试:https://www.mklab.cn/utils/regex
图论起源:柯尼斯堡七桥问题
图 (graph) 常用$G=(V,E)$表示,其中$V$表示顶点/节点的集合,$E$表示边的集合
相邻的 (adjacent)/关联的 (incident)
顶点的度 (degree):与该顶点关联的边的条数。
AlpacaEval是一种由斯坦福大小推出的LLM自动评估工具