分类目录归档:学习

因果推断

因果推断基础

辛普森悖论 提醒我们在分析数据时要仔细考虑分组和混杂因素的影响,而因果推断的作用就是使用适当的方法识别和控制这些因素,从而可以更好地解释数据中的关系,并做出可靠的结论。

相关性与因果性:

  • 相关性描述了事物之间存在的关联,因果性则代表了事物之间的内在联系
  • 不同于相关性,因果性一般是单向的,即 A 是 B 的因,B 就不应该是 A 的因
  • 传统模型一般学习的只是相关性,这也是导致模型泛化能力不足的重要原因

因果关系的三个阶段(由易到难):

  1. 关联性 Assoc

Read more

贝叶斯神经网络 BNN

前置知识:贝叶斯算法高斯过程回归

BNN 的定义

贝叶斯神经网络(Bayesian neural networks, BNNs):

  • 神经网络中的可训练参数,即权重(weight)和偏置(bias)都表示为一个分布
  • 一种最简单的 BNN 就是将模型参数看作服从均值为 $\mu$,方差为 $\delta$ 的高斯分布;考虑到中心极限定理的存在,一般认为模型参数符合高斯分布是一种合理的假设
  • 在预测时,BNN 会从每个高斯分布采样,得到一个确定的神经网络,然后用于预测;也可以对参数多次采样后分别进行预测,然后将多次预测结果进行汇总(类

Read more

术后谵妄 POD

谵妄的定义

谵妄的定义:POD 是一种急性发作的、暂时性脑功能异常。POD 多数发生在术后 1 周内, 以注意力不集中、意识水平变化和认知功能急性改变为特征。POD 可增加患者术后其他并发症发生率、延长住院时间、增加医疗费用和 30d 再人院率, 从而影响患者预后。

谵妄的常见临床表现:

  1. 注意力障碍: 患者对各种刺激的警觉性及指向性下降, 如注意力难唤起、表情茫然或注意力不能集中
  2. 意识水平紊乱: 表现为对周围环境认识的清晰度下降或出现不同程度的木僵或昏迷
  3. 认知功能障碍: 是 POD 最常见的表现之一,

Read more

脓毒症休克 SepticShock

脓毒症休克的定义

荟萃分析显示:脓毒症休克患者的住院死亡率为 39%,与评估的时间点无关

脓毒性休克的定义:持续低血压,尽管进行了适当的容量复苏(20-30 毫升/千克,2 升液体在 30 分钟内),仍然需要血管加压药物维持平均动脉压≥65 mm Hg 且血清乳酸水平大于 2 mmol/L;

脓毒性休克理解已从传统“血压降低”表象深入至“低灌注”病理生理本质

脓毒症休克的原因

休克的原因:

  1. 感染性休克
  2. 心源性休克
  3. 神经源性休克
  4. 过敏性休克

脓毒性休克和心源性休克的相互影响以及不同的演变过程

  1. 休克可分为脓毒性休克(血管扩

Read more

液体治疗

液体治疗是围手术期管理的重要组成部分,其内容包括补充机体正常生理液体需要量以及麻醉和手术所导致的循环血容量改变和液体缺失,维持良好的组织灌注和内环境稳定,避免细胞代谢紊乱和器官功能损伤

液体治疗常见类型

围手术期推荐的常用液体治疗种类包括晶体液和胶体液

  • 晶体液包括生理盐水、乳酸钠林格注射液、复方醋酸钠林格注射液、碳酸氢钠林格注射液等;晶体液可有效补充人体生理液体需要量及电解质,手术出血患

Read more

心源性休克

心源性休克的定义

心源性休克是一种复杂的综合征:

  • 特征是由于各种潜在原因导致的心输出量减少而引起的组织灌注不足
  • 尽管心血管重症监护取得了进展,心源性休克的短期死亡率仍停滞在约40-50%

心源性休克的定义(克学术研究联盟 SHARC)

  • 收缩压低于 90mmHg 超过30分钟,或需要使用正性肌力药、血管加压药或机械循环支持(MCS)来维持适当的血压,同时存在全身低灌注的证据
  • SHARC 定义还承认了一种血压正常的心源性休克亚型,即尽管收缩压等于或大于90mmHg且不需要血管加压药、正性肌力药或MCS,但仍存在低灌注

Read more

急性肾损伤 AKI

急性肾损伤,导致肾脏结构或功能变化的损伤引起的肾功能减退

急性肾损伤的定义

AKI 诊断标准:48h 内肌酐升高≥0.3 mg/dl,或在前 7 天内超过基线的 1.5 倍

AKIN 标准,为血清肌酐比术前水平增加绝对值>0.3 mg/dL,增加 ≧ 50%,或每小时尿量<0.5 mL/kg 持续 6 小时以上

急性肾损伤(AKI)的理解:

  • 急性肾损伤常发生在大手术后,包括腹部、心脏、呼吸和神经外科手术
  • 对短期手术结果的影响取决于手术类型、手术程序和患者群体
  • 即使肾功能完全恢复,围手术期 AKI 患者死亡率仍然较

Read more

时序变点检测

变点检测的定义

变点检测(Change point detection, CPD)是指在时间序列中发现统计特性发生重大变化的点

变点检测示例(斯匹次卑尔根岛的年均气温趋势):

变点检测的分类:

  • 按照是否回顾整个历史数据集,分为离线检测和在线/实时检测
  • 按照预测目标可以分为变点识别(分类)、变化度预测、变点时间预测
  • 按照训练过程是否使用数据集标签,分为有监督方法和无监督方法

常见变点检测算法

变点检测的有监督方法:

  • 常见分类器:决策树、朴素贝叶斯、贝叶斯网络、SVM、KNN、HMM、CRF 等
  • 虚拟分类器:定义第一个窗口内的所有连

Read more

大模型开发技巧

低显存GPU环境调试大模型

方案:将 config.json 文件中 num_hidden_layers 的值修改为较小的值(比如 1)

原理:隐藏层中 block 的输入输出维度是一致的,因此去除重复的 block 并不会影响模型的处理逻辑;但需要注意该方法会影响模型的性能,因此只适合模型调试阶段使用。

低显存 GPU 环境推理大模型

分层推理法:将模型根据层来进行拆分存储,推理时分批次将要处理的层导入显存

代码示例:

from accelerate import init_empty_weights
from accele

Read more

BM25 搜索排序算法

BM25(Best Matching 25),一种经典的信息检索方法

  • BM25 综合考虑了 TF-IDF 和文档长度等信息,计算效率高,实用性强
  • BM25 在信息检索领域使用广泛,是 Elasticsearch 的默认检索方法
  • BM25 的语义理解能力不足,无法有效捕捉词序信息和上下文关系
  • BM25 可以通过调整参数来适用不同的应用场景,但个性化能力有限

TF-IDF

词频 TF(Term Frequency),词语 $t$ 在文档 $d$ 中出现的频率

$$ \text{TF}(t, d) = \frac{\text{词t在文档d中的

Read more