《零基础数学建模》——TOPSIS+熵权法

前言本文大部分是对于数学建模清风老师的课程学习总结归纳而来，我的理解可能有错误，大家发现错误可以在评论区批评指正，课程地址：《数学建模清风》一、模型定义二、模型思想三、模型步骤与实现四、模型扩展五、模型总结......

文章共37,180字 · 阅读需要大约124分钟

一键AI生成摘要，助你高效阅读

问答

乐正零（Otaku）

19946人浏览 · 2022-05-25 11:52:05

乐正零（Otaku） · 2022-05-25 11:52:05 发布

前言

本文大部分是对于数学建模清风老师的课程学习总结归纳而来，我的理解可能有错误，大家发现错误可以在评论区批评指正，课程地址：《数学建模清风》

一、TOPSIS法（优劣解距离法）

1.模型原理

TOPSIS法（Technique for Order Preference by Similarity to Ideal Solution）可翻译为逼近理想解排序法，国内常简称为优劣解距离法
TOPSIS 法是一种常用的综合评价方法，其能充分利用原始数据的信息，其结果能精确地反映各评价方案之间的差距。
为了对众多方案给出一个排序，在给出所有方案之后，可以根据这些数据，构造出一个所有方案组成的系统中的理想最优解和最劣解。而TOPSIS的想法就是，通过一定的计算，评估方案系统中任何一个方案距离理想最优解和最劣解的综合距离。如果一个方案距离理想最优解越近，距离最劣解越远，我们就有理由认为这个方案更好。那理想最优解和最劣解又是什么呢？很简单，理想最优解就是该理想最优方案的各指标值都取到系统中评价指标的最优值，最劣解就是该理想最劣方案的各指标值都取到系统中评价指标的最劣值。
理想最优解中的数据都是各方案中的数据，而不要选择方案中没有的数据，理想最劣解同理。

2.建模步骤

topsis算法进行建模，总体分为以下四个步骤：

将原始矩阵正向化
将正向化矩阵标准化
计算得分并归一化

接下来，我会通过例题来具体讲解topsos算法原理与用法。

二、模型实现

第一步：将原始矩阵正向化

指标名称	指标特点	例子
极大型（效益性指标）	越大（多）越好	成绩、GDP增速、企业利润
较小型（成本型）指标	越小（少）越好	费用、坏频率、污染程度
中间型指标	越接近某个值越好	水质量评估时的PH值
区间型指标	落在某个区间最好	体温、水中植物性营养物量

在topsis法中，所谓的原始矩阵正向化，就是要将所有指标类型统一转化为极大型指标。

极小型指标——>极大型指标

某各寝室有四个人，已知他们的成绩和与他人的争吵次数，现在要对他们的综合素质进行评价。

姓名	成绩	与他人争吵次数	正向化后的争吵次数
小明	89	2	1
小王	60	0	3
小张	74	1	2
小李	99	3	0
指标类型	极大型	极小型	极大型

将极小型指标转换为极大型指标的公式：

$ma x - x (常用）$
如果所有元素均为正数，那么也可以使用： $1/ x$ （公式不唯一）

中间型指标——>极大型指标
中间型指标： 指标值既不要太大也不要太小，取某特定值最好（如水质量评估 PH 值)
${x_i}$ 是一组中间型指标序列，且最佳的数值为 $x_{best}$ ，那么正向化的公式如下：
$M=max\{|x_i-x_{best}|\},\bar{x_i}=1- \frac{|x_i-x_{best}|}{M}$
$在本题中：x_{best}=7,M=max\{|6-7|,|7-7|,|8-7|,|9-7|\}=2$

PH值（转换前）	PH值（转换后）
6	1/2
7	1
8	1/2
9	0

区间型指标 ——> 极大型指标
**区间型指标:**指标值落在某个区间内最好，例如人的体温在36°～37°这个区间比较好。
${x_i}$ 是一组区间型指标序列，且最佳的区间为[a,b]，那么正向化的公式如下：
$M=max\{a-min\{x_i\},max\{x_i\}-b \},\bar{x_i}=\begin{cases} 1- \frac{a-x_i}{M}& x_i < a \\ 1 & a \leq x_i \leq b\\ 1- \frac{x_i-b}{M} & x_i > b\end{cases}$

体温（转换前	体温（转换后）
35.2	0.4286
35.8	0.8571
36.6	1
37.1	0.9286
37.8	0.4286
38.4	0

在这个例子中， $a = 36, b = 37$ ，所以：
$max\{36-35.2,38.4-37\}=1.4$
然后通过 $\bar{x_i}$ 公式计算得到上表。

第二步：正向化矩阵标准化

在开始前我们需要明确一点：标准化的目的是消除不同指标量纲的影响!
假设有 $n$ 个要评价的对象， $m$ 个评价指标（已经正向化）构成的正向化矩阵如下：
$X=\left[ \begin{matrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots & x_{nm} \\ \end{matrix} \right] \\那么，对其标准化的矩阵记为Z，Z中的每一个元素: \\ \ \\z_{ij}=\frac{x_{ij}}{\sqrt{\sum^{n}_{i = 0}x^2_{ij}}} (\frac{每一个元素}{\sqrt{其所在列的元素的平方和}})$
注意：标准化的方法有很多种，其主要目的就是去除量纲的影响，文章介绍的方法知识较为常用的一种标准化方法。
对第一个例子中的矩阵进行处理：
$\left[ \begin{matrix} 89 &1\\ 60 & 3\\ 74 & 2\\ 99 & 0 \end{matrix} \right] 经过标准化就变成了 \left[ \begin{matrix} 0.5437 &0.2673\\ 0.3665 & 0.8018\\ 0.4520 & 0.5345\\ 0.6048 & 0 \end{matrix} \right]$

第三步：计算得分并归一化

假设有 $n$ 个要评价的对象， $m$ 个评价指标的标准化矩阵：
$\left[ \begin{matrix} z_{11} & z_{12} & \cdots & z_{1m} \\ z_{21} & z_{22} & \cdots & z_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ z_{n1} & z_{n2} & \cdots &z_{nm} \\ \end{matrix} \right]$
定义最大值： $Z^+=(Z^+_1,Z^+_2, \cdots,Z^+_m)$
$=(max\{z_{11},z_{21}, \cdots,z_{n1}\},max\{z_{12},z_{22}, \cdots,z_{n2}\},\cdots,max\{z_{1m},z_{2m}, \cdots,z_{nm}\})$
定义最小值： $Z^-=(Z^-_{1},Z^-_{2},\cdots,Z^-_{m})$
$=(min\{z_{11},z_{21}, \cdots,z_{n1}\},min\{z_{12},z_{22}, \cdots,z_{n2}\},\cdots,min\{z_{1m},z_{2m}, \cdots,z_{nm}\})$
定义第 $i(i=1,2,\cdots,n)$ 个评价对象与最大值的距离 $D^+_i=\sqrt{\sum^m_{j=1}{(Z^+_j-z_{ij})^2}}$
定义第 $i(i=1,2,\cdots,n)$ 个评价对象与最小值的距离 $D^-_i=\sqrt{\sum^m_{j=1}{(Z^-_j-z_{ij})^2}}$
那么，我们可以计算出第 $i(i=1,2,\cdots,n)$ 个评价对象未归一化的得分： $S_i=\frac{D^-_i}{D^+_i+D^-_i}$
很明显 $0\leq S_i\leq 1$ ，且 $\bar S_i = S_i / \sum^n_{i=1}{S_i}。这样的话\sum^{n}_{i=1}{\bar S_i}=1$ （注意：得分归一化不影响排序）

对于例题计算过程这里就不演示了，最终的得分结果如下：

姓名	$D^+$	$D^-$	未归一化得分	归一化后得分	排名
小明	0.5380	0.3206	0.3734	0.1857	3
小王	0.2382	0.8018	0.7709	0.3834	1
小张	0.3078	0.5413	0.6375	0.3170	2
小李	0.8018	0.2382	0.2291	0.1139	4

四、TOPSIS模型的总结与扩展

总结

TOPSIS 法别名优劣解距离法，其主要利用数据的信息，精确的反应评价方案之间的优劣差距。TOPSIS 法多用于解决多指标的决策性问题，其实现原理为通过计算各备选方案与正负理想解之间的相对距离来进行排序并做出选择。其主要步骤如下：

将原始矩阵正向化。（为了统一指标，方便后面计算，因此将指标统一为极大型指标）
将正向话矩阵标准化。（消除量纲的影响）
计算得分并归一化。（统计各指标的最大值，与最小值，并计算得分）
TOPSIS就是求得当前评价对象各指标与正负理想解相对距离，来最终做出评价的。

扩展

在上面给的例题中默认了各项指标的权重相同，但在实际的评价中指标都是有各自的权重，因此应该用权重对公式进行修正，修正后的公式如下（ $\omega$ 代表权重）：
$D^+_i=\sqrt{\sum^m_{j=1} \omega_j(Z^+_j-z_{ij})^2},D^-_i=\sqrt{\sum^m_{j=1} \omega_j(Z^-_j-z_{ij})^2}$
Ps:给指标赋权重，理所当然地我们想到了上一篇文章中的层次分析法，但层次分析法的主观性太强了，更推荐大家使用熵权法来进行客观赋值。
PPs:建模做题的时候建议同学们使用综合主观和客观的权重，因为其更具有说服力！

五、熵权法

定义：熵权法是一种客观赋权的方法（客观 = 数据本身就可以告诉我们权重）
PS:当一个指标都是相同数值时，那么我们可认为这个指标的权值为0，因此我们可以看出熵权法基于数据本身进行计算，它的客观只是相对的。

1.信息熵的定义

假设 $x$ 表示时间 $X$ 可能发生的某种情况， $p (x)$ 表示这种情况发生的概率。
我们可以定义： $I(x)=-\ln(p(x))$ ，因为 $0\leq p(x) \leq 1$ ，所以 $I(x)\geq 0$ 如果时间 $X$ 可能发生的情况分为： $x_1,x_2,\cdots,x_n$
那么我们可以定义时间X的信息熵为：
$H(X)=\sum^n_{i=1}{[p(x_i)I(x_i)]}=-\sum^n_{i=1}{[p(x_i)\ln(p(x_i))]}$
从上面的公式可以看出，信息熵的本质就是对信息量的期望值。
可以证明的是：
$当p(x_1)=p(x_2)=\cdots=p(x_n)=\frac{1}{n}时，H(x)取最大值，此时H(x)=\ln(n)$

2.计算步骤

（1）矩阵的标准化
判断输入的矩阵中是否存在负数，如果有，则要重新标准化到非负区间（后面计算概率时需要保证每一个元素为非负数）
假设有 $n$ 个要评价的对象， $m$ 个评价指标（已正向化）构成的正向化矩阵如下：
$\left[ \begin{matrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ x_{n1} & x_{n2} & \cdots &x_{nm} \\ \end{matrix} \right]$
那么，对其标准化的矩阵记为 $Z$ , $Z$ 中的每一个元素： $z_{ij}=x_{ij}\sqrt{\sum^n_{i=1}{x^2_{ij}}}$
判断 $Z$ 矩阵中是否存在负数，如果存在的话，需要对 $X$ 使用另一种标准化方式，对矩阵 $X$ 进行一次标准化得到 $\bar Z$ 矩阵，其标准化公式为：
$\bar z_{ij}=\frac{x_{ij}-min\{x_{1j},x_{2j},\cdots,x_{nj}\}}{max\{x_{1j},x_{2j},\cdots,x_{nj}\}-min\{x_{1j},x_{2j},\cdots,x_{nj}\}}$

(2)计算指标比重
计算第 j 项指标下第 i 个样本所占的比重，并将其看作相对熵计算中用到的概率。
假设有 n nn 个要评价的对象，m mm 个评价指标，且经过了上一步处理得到的非负矩阵为:
$\bar Z= \left[ \begin{matrix} z_{11} & z_{12} & \cdots & z_{1m} \\ z_{21} & z_{22} & \cdots & z_{2m} \\ \vdots & \vdots & \ddots & \vdots \\ z_{n1} & z_{n2} & \cdots &z_{nm} \\ \end{matrix} \right]$
我们计算概率矩阵 $P$ ，其中 $P$ 中每一个元素 $p_{ij}$ 的计算公式如下：
$p_{ij}=\frac{\bar z_{ij}}{\sum^n_{i=1}\bar z_{ij}}$
容易验证： $\sum^n_{i=1}p_{ij}=1$ ，既保证了每一个指标所对应的概率和为1。

(3)计算得到熵权
计算每个指标的信息熵，并计算信息效用值，并归一化得到每个指标的熵权。
对于第 $j$ 个指标而言，信息熵的计算公式：
$e_j=-\frac{1}{\ln(n)}\sum^n_{i=1}{p_{ij}}{\ln(p_{ij})}(j=1,2,\cdots,m)$
注意：这里 $p_{ij}$ 如果为0，那么需要指定 $\ln(0)$ =0。

这里有两个问题需要确定
（1）为什么这里要除以 $\ln(n)$ 这个常数？
前文提到，当 $p(x_1)=p(x_2)=\cdots=p(x_n)=\frac{1}{n}时，H(x)取最大值，此时H(x)=\ln(n)这里除以\ln(n)能够使得信息熵的始终位于[0,1]区间上面。$
（2） $e j 越大，即第 j 个指标的信息嫡越大，表明第 j 个指标的信息越多还是越少 ?$
答案是越少，当 $p_{1j}=p_{2j}=\cdots=p_{nj}时，e_j=1$ ，此时上面定义的信息熵达到最大，但是，因为 $p_{ij}=\bar z_{ij}/\sum^n_{i=1}{\bar z_{ij}}，所以\bar z_{1j}=\bar z_{2j}=\cdots=\bar z_{nj}$ ，即所有样本的这个指标值都相同。
信息效用值的定义： $d_j=1-e_j$ ，那么信息效用值越大，其对应的信息就越多。
将信息效用值进行归一化，我们就能够得到每个指标的熵权： $\omega_j=d_j/\sum^m_{j=1}d_{j}(j=1,2,\cdots,m)$

六、熵权法模型总结与扩展

总结

熵权法的使用步骤分为三步：

判断输入的矩阵中是否存在负数，如果有则要重新标准化到非负区间（后面计算概率时需要保证每一个元素为非负数）。
计算第 j 项指标下第 i 个样本所占的比重，并将其看作相对熵计算中用到的概率。
计算每个指标的信息熵，并计算信息效用值，并归一化得到每个指标的熵权。

扩展

熵权法可对 TOPSIS 法进行修正（赋权）。
熵权法背后的原理是利用指标的变异程度进行赋权，存在一定程度的客观性，可利用主观赋权法求得的权重向量进行综合。
客观赋权法存在很多，求得客观权重的方法也有很多，其中灰色关联分析法得到的关联程度也可当作权重进行应用。
不同的标准化方法，可能得到的标准化矩阵 $Z$ 存在差异，因此根据实际情况来使用标准化方法，注意前提都是得到的 $Z$ 矩阵中没有负数。

七、参考代码

topsis法：

%% 第一步：把数据复制到工作区，并将这个矩阵命名为X
clear
clc
load data_water_quality.mat;%将name换成mat文件名
%% 第二步：判断是否需要正向化
[n,m]=size(X);
disp(['共有',num2str(n),'个评价对象,',num2str(m),'个评价指标'])
Judge=input(['这',num2str(m),'个指标是否需要经过正向化处理，需要请输入1，不需要输入0: ']);
if Judge == 1
    Position = input('请输入需要正向化处理的指标所在的列，如第2，4，5三列需要处理，那么输入[2,4,5]： ');
    disp('请输入需要处理的这些列的指标类型(1：极小型,2：中间型,3：区间型)')
    Type = input('例如：第2列是极小型，第3列是区间型，第6列是中间型，就输入[1,3,2]：  '); %[2,1,3]
    % 注意，Position和Type是两个同维度的行向量
    for i = 1 : size(Position,2)  %这里需要对这些列分别处理，因此我们需要知道一共要处理的次数，即循环的次数
        X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));
    % Positivization是我们自己定义的函数，其作用是进行正向化，其一共接收三个参数
    % 第一个参数是要正向化处理的那一列向量 X(:,Position(i))   回顾上一讲的知识，X(:,n)表示取第n列的全部元素
    % 第二个参数是对应的这一列的指标类型（1：极小型， 2：中间型， 3：区间型）
    % 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列
    % 该函数有一个返回值，它返回正向化之后的指标，我们可以将其直接赋值给我们原始要处理的那一列向量
    end
    disp('正向化后的矩阵 X =  ')
    disp(X)
end
%% 第三步：对正向化后的矩阵进行标准化
Z=X./repmat(sum(X.*X).^0.5,n,1);
disp('标准化后的矩阵Z=')
disp(Z)
%% 让用户判断是否需要增加权重
disp("请输入是否需要增加权重向量，需要输入1，不需要输入0")
Judge = input('请输入是否需要增加权重： ');
if Judge == 1
    Judge = input('使用熵权法确定权重请输入1，否则输入0： ');
    if Judge == 1
        if sum(sum(Z<0)) >0   % 如果之前标准化后的Z矩阵中存在负数，则重新对X进行标准化
            disp('原来标准化得到的Z矩阵中存在负数，所以需要对X重新标准化')
            for i = 1:n
                for j = 1:m
                    Z(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];
                end
            end
            disp('X重新进行标准化得到的标准化矩阵Z为:  ')
            disp(Z)
        end
        weight = Entropy_weight_method(Z);
        disp('熵权法确定的权重为：')
        disp(weight)
    else
        disp(['如果你有3个指标，你就需要输入3个权重，例如它们分别为0.25,0.25,0.5, 则你需要输入[0.25,0.25,0.5]']);
        weight = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重: ']);
        OK = 0;  % 用来判断用户的输入格式是否正确
        while OK == 0 
            if abs(sum(weight) -1)<0.000001 && size(weight,1) == 1 && size(weight,2) == m  % 注意，Matlab中浮点数的比较要小心
                OK =1;
            else
                weight = input('你输入的有误，请重新输入权重行向量: ');
            end
        end
    end
else
    weight = ones(1,m) ./ m ; %如果不需要加权重就默认权重都相同，即都为1/m
end

%% 第四步：计算与最大值的距离和最小值的距离，并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5;
S = D_N ./ (D_P+D_N);    % 未归一化的得分
disp('最后的得分为：')
stand_S = S / sum(S)
[sorted_S,index] = sort(stand_S ,'descend')

正向化判断：

function [posit_x] = Positivization(x,type,i)
% 输入变量有三个：
% x：需要正向化处理的指标对应的原始列向量
% type： 指标的类型（1：极小型， 2：中间型， 3：区间型）
% i: 正在处理的是原始矩阵中的哪一列
% 输出变量posit_x表示：正向化后的列向量
    if type == 1  %极小型
        disp(['第' num2str(i) '列是极小型，正在正向化'] )
        posit_x = Min2Max(x);  %调用Min2Max函数来正向化
        disp(['第' num2str(i) '列极小型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    elseif type == 2  %中间型
        disp(['第' num2str(i) '列是中间型'] )
        best = input('请输入最佳的那一个值： ');
        posit_x = Mid2Max(x,best);
        disp(['第' num2str(i) '列中间型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    elseif type == 3  %区间型
        disp(['第' num2str(i) '列是区间型'] )
        a = input('请输入区间的下界： ');
        b = input('请输入区间的上界： '); 
        posit_x = Inter2Max(x,a,b);
        disp(['第' num2str(i) '列区间型正向化处理完成'] )
        disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')
    else
        disp('没有这种类型的指标，请检查Type向量中是否有除了1、2、3之外的其他值')
    end
end

极小型正向化：

function [posit_x] = Min2Max(x)
    posit_x = max(x) - x;
     %posit_x = 1 ./ x;    %如果x全部都大于0，也可以这样正向化
end

中值型正向化：

function [posit_x] = Mid2Max(x,best)
    M = max(abs(x-best));
    posit_x = 1 - abs(x-best) / M;
end

区间型正向化：

function [posit_x] = Inter2Max(x,a,b)
    r_x = size(x,1);  % row of x 
    M = max([a-min(x),max(x)-b]);
    posit_x = zeros(r_x,1);   %zeros函数用法: zeros(3)  zeros(3,1)  ones(3)
    % 初始化posit_x全为0  初始化的目的是节省处理时间
    for i = 1: r_x
        if x(i) < a
           posit_x(i) = 1-(a-x(i))/M;
        elseif x(i) > b
           posit_x(i) = 1-(x(i)-b)/M;
        else
           posit_x(i) = 1;
        end
    end
end

熵权法：

function[W] = Entropy_weight_method(Z)
% 计算有n个样本，m个指标的样本所对应的的熵权
% 输入
% Z ： n*m的矩阵（要经过正向化和标准化处理，且元素中不存在负数）
% 输出
% W：熵权，m*1的行向量

%% 计算熵权
    [n,m] = size(Z);
    D = zeros(1,m);  % 初始化保存信息效用值的行向量
    for i = 1:m
        x = Z(:,i);  % 取出第i列的指标
        p = x / sum(x);
        % 注意，p有可能为0，此时计算ln(p)*p时，Matlab会返回NaN，所以这里我们自己定义一个函数
        e = -sum(p .* mylog(p)) / log(n); % 计算信息熵
        D(i) = 1- e; % 计算信息效用值
    end
    W = D ./ sum(D);  % 将信息效用值归一化，得到权重    
end

function [lnp] =  mylog(p)
n = length(p);   % 向量的长度
lnp = zeros(n,1);   % 初始化最后的结果
    for i = 1:n   % 开始循环
        if p(i) == 0   % 如果第i个元素为0
            lnp(i) = 0;  % 那么返回的第i个结果也为0
        else
            lnp(i) = log(p(i));  
        end
    end
end