发表评论
68 views
TOPSIS (Technique for Order Preference by Similarity to an Ideal Solution) ,也称优劣解距离法,是一种常用的组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距
针对多标准/多目标决策问题(MCDM/MCDA),决策者需要面对多种决策标准和可行决策方案,TOPSIS 的作用就是帮助决策者综合考虑多个决策标准,在多个可行决策方案之间找到最优解
TOPSIS 示例:评估 5 所研究生院的教育质量
5 所研究生院的评估数据及其权重如下:
院校 | 人均专著 $x_1$ (本/人) |
---|
arXiv 预印本论文资源
import urllib, urllib.request
url = 'http://export.arxiv.org/api/query?sea
前置知识:强化学习入门、蒙特卡洛法、马尔可夫决策过程 MDP
时序差分(temporal difference,TD)
回顾 MDP 中状态价值函数的贝尔曼方程: $$ v_{
马尔可夫过程(Markov process)是一类具有马尔可夫性质的随机过程
马尔可夫性质(Markov property,MP):如果某一个过程未来某个时刻的状态与过去的状态无关,只由现在的状态决定,那么其具