Circuit Tracing:用归因图解释大模型的思维过程

中文标题:电路追踪:揭示语言模型中的计算图

英文标题:Circuit Tracing: Revealing Computational Gr

Read more

RepE:用于增强 AI 模型透明度的表征工程

中文标题:表征工程:一种自上而下

Read more

永禁文物 195_山东山西馆藏

彩绘八角星纹陶豆

  • 1978年出土于山东泰安大汶口遗址,大汶口文化彩陶器
  • 豆为盛食器,也是祭祀用的礼器,口径26厘米,足径14.5厘米,通高28,此豆口沿上用褐、红彩绘对顶三角形与若干线条相间组成的图案,腹部用白彩在深红色陶衣上绘有5个方形八角星状纹饰,象征太阳
  • 纹饰构图对称,色彩对比强烈,堪称我国彩陶艺术珍品;八角星图是山东地区新石器时代典型纹样,体现先民对自然现象的抽象化艺术表达。作为大汶口文化代表性器物,其出土为研究史前制陶工艺、原始信仰及社

Read more

TOPSIS 综合评价

TOPSIS (Technique for Order Preference by Similarity to an Ideal Solution) ,也称优劣解距离法,是一种常用的组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距

针对多标准/多目标决策问题(MCDM/MCDA),决策者需要面对多种决策标准和可行决策方案,TOPSIS 的作用就是帮助决策者综合考虑多个决策标准,在多个可行决策方案之间找到最优解

TOPSIS 示例:评估 5 所研究生院的教育质量

5 所研究生院的评估数据及其权重如下:

院校 人均专著 $x_1$ (本/人)

Read more

20250801 本地论文阅读助手搭建

论文数据获取

arXiv 预印本论文资源

  • arXiv 是一个免费、开放获取的预印本仓储网站,主要收录物理学、数学、计算机科学、生物学、定量金融学、统计学等学科的学术论文预印本
  • 科学家和研究人员可以在正式发表论文之前,先在 arXiv 上分享研究成果;arXiv上的论文对所有人免费开放,任何人都可以访问和下载
  • arXiv 也提供了基本的查询和下载 API,其 Python 代码示例如下:
import urllib, urllib.request
url = 'http://export.arxiv.org/api/query?sea

Read more

基于强化学习在ICU场景中学习脓毒症的最佳治疗策略

Read more

永禁文物 195_河北河南馆藏

厝铁足青铜圆鼎

  • 1970年代出土于河北省平山县三汲乡中山王墓,战国时期中山国青铜器
  • 鼎通高51.5厘米,重60公斤,为九件升鼎中的首鼎,采用铜铁合铸工艺制作,鼎身铜制而鼎足铁制,外壁刻有77行共469字铭文;铭文记载了中山国与齐国联合伐燕的历史事件及治国训诫
  • 目前已知铭文最长的战国青铜器,铭文兼具历史文献与书法艺术双重价值
  • 现藏于河北博物院,2002年列入《首批

Read more

永禁文物 195_江苏安徽馆藏

竹林七贤与荣启期模印砖画

  • 1960年出土于南京西善桥宫山北麓,南朝模印砖画
  • 砖画由648块长方形青砖拼镶而成,分为两幅左右两部分对称安置于墓室两壁。南墓壁描绘的是嵇康、阮籍、山涛、王戎的画像,高78厘米,长242.5厘米;北墓壁描绘的则是向秀、刘伶、阮咸、荣启期的画像,高78厘米,长241.5厘

Read more

时序差分算法 TD

前置知识:强化学习入门蒙特卡洛法马尔可夫决策过程 MDP

时序差分算法

时序差分(temporal difference,TD)

  • 一种用来估计一个策略的价值函数的方法,结合了蒙特卡洛和动态规划算法的思想
  • 时序差分 vs 蒙特卡洛:都可以从样本数据中学习,不需要事先知道环境;但蒙特卡洛法需要完成整个序列后才能计算得到回报 $G_{t}$,而时序差分法只需要当前步结束即可进行计算
  • 时序差分 vs 动态规划:都可以根据贝尔曼方程来更新当前状态的价值估计

回顾 MDP 中状态价值函数的贝尔曼方程: $$ v_{

Read more

马尔可夫模型

马尔可夫过程

马尔可夫过程(Markov process)是一类具有马尔可夫性质的随机过程

  • 由俄国数学家A.A.马尔可夫于 1907 年提出。该过程具有如下特性:在已知目前状态(现在)的条件下,它未来的演变(将来)不依赖于它以往的演变 (过去 )
  • 例如森林中动物头数的变化构成——马尔可夫过程。在现实世界中,有很多过程都是马尔可夫过程,如液体中微粒所作的布朗运动、传染病受感染的人数、车站的候车人数等

马尔可夫性质(Markov property,MP):如果某一个过程未来某个时刻的状态与过去的状态无关,只由现在的状态决定,那么其具

Read more