原理:
用动态规划法解矩阵连乘积的最优计算次序问题。计算Ai…j ,1≤i≤j≤n,所需的最少数乘次数为m[i,j],原问题的最优值为m[1,n]。
当i=j时,Ai…j=Ai为单一矩阵,无需计算,因此m[i,i]=0,i=1,2,…,n ;
当i<j时,可利用最优子结构性质来计算m[i,j]。事实上,若计算Ai…j的最优次序在Ak和Ak+1之间断开,i≤k<j,则:m[i,j]=m[i,k]+m[k+1,j]+ri rk+1rj+1 。
过程和源代码(第3步的代码可行,其余代码没时间去弄):
1.分析最优解的结构
首先,为方便起见,将矩阵连乘积AiAi+1…Aj简记为Ai…j。我们来看计算A1…n的一个最优次序。设这个计算次序在矩阵Ak和Ak+1之间将矩阵链断开,1<=k<n,则完全加括号方式为((A1…Ak)(Ak+1…An))。照此,我们要先计算A1…k和Ak+1…n,然后,将所得的结果相乘才得到A1…n。显然其总计算量为计算A1…k的计算量加上计算Ak+1…n的计算量,再加上A1…k与Ak+1…n相乘的计算量。
这个问题的一个关键特征是:计算A1…n的一个最优次序所包含的计算A1…k的次序也是最优的。事实上,若有一个计算A1…k的次序需要的计算量更少,则用此次序替换原来计算A1…k的次序,得到的计算A1…n的次序需要的计算量将比最优次序所需计算量更少,这是一个矛盾。同理可知,计算A1…n的一个最优次序所包含的计算矩阵子链Ak+1…n的次序也是最优的。根据该问题的指标函数的特征也可以知道该问题满足最优化原理。另外,该问题显然满足无后向性,因为前面的矩阵链的计算方法和后面的矩阵链的计算方法无关。
2.建立递归关系
对于矩阵连乘积的最优计算次序问题,设计算Ai…j ,1≤i≤j≤n,所需的最少数乘次数为m[i,j],原问题的最优值为m[1,n]。
当i=j时,Ai…j=Ai为单一矩阵,无需计算,因此m[i,i]=0,i=1,2,…,n ;
当i<j时,可利用最优子结构性质来计算m[i,j]。事实上,若计算Ai…j的最优次序在Ak和Ak+1之间断开,i≤k<j,则:m[i,j]=m[i,k]+m[k+1,j]+rirk+1rj+1 。
3.计算最优值
下面所给出的计算m[i,j]动态规划算法中,输入是序列P={p0,p1,…,pn},输出除了最优值m[i,j]外,还有使m[i,j] = m[i,k] + m[k+1,j] + pipk+1pj+1达到最优的断开位置s[i,j],1≤i≤j≤n 。
void MATRIX_CHAIN_ORDER() //计算矩阵链连乘的最优断开位置
{
int i,j,k,q;
int m[10][10],r[8],s[10][10];
r[0]=35;r[1]=40;r[2]=20;r[3]=10;r[4]=15; //定义矩阵下标
for(j=0;j<=3;j++) //列
{
for(i=j;i>=0;i--) //行
{
if(i==j)
m[i][j]=0;
else
{
m[i][j]=100000000; // m[i][j]初值定义为无穷大
for(k=i;k<j;k++)
{
q=m[i][k]+m[k+1][j]+r[i]*r[k+1]*r[j+1];
if(q<m[i][j])
{
m[i][j]=q;
s[i][j]=k+1;
}
}
cout<<"m["<<i+1<<"]"<<"["<<j+1<<"](最小乘积)="<<m[i][j]<<" "<<endl;
cout<<"s["<<i+1<<"]"<<"["<<j+1<<"](标记以便回溯)="<<"m[1]["<<s[i][j]<<"]"<<endl<<endl;
}
}
}
}
该算法按照
m[1,1]
m[2,2] m[1,2]
m[3,3] m[2,3] m[1,3]
... ... ...
m[n,n] m[n-1,n] ... .... ... m[1,n]
的顺序根据公式m[i,j] = m[i,k] + m[k+1,j] + pipk+1pj+1计算m[i,j]。
该算法的计算时间上界为O(n3)。算法所占用的空间显然为O(n2)。
4.构造最优解
算法MATRIX_CHAIN_ ORDER只是计算出了最优值,并未给出最优解。也就是说,通过MATRIX_CHAIN_ORDER的计算,我们只知道计算给定的矩阵连乘积所需的最少数乘次数,还不知道具体应按什么次序来做矩阵乘法才能达到数乘次数最少。
然而,MATRIX_CHAIN_ORDER己记录了构造一个最优解所需要的全部信息。事实上,s[i,j]中的数k告诉我们计算矩阵链Ai…j的最佳方式应在矩阵Ak和Ak+1之间断开,即最优的加括号方式应为(A1...k)(Ak+1…n)。因此,从s[i,j]记录的信息可知计算A1…n的最优加括号方式为 (A1…s[1,n])(As[1,n]+1…n)。而计算A1…s[1,n]的最优加括号方式为(A1…s[1,s[1,n]])(As[1,s[1,n]]+1…s[1,n])。同理可以确定计算As[1,n]+1…n的最优加括号方式在s[s[1,n]+1,n]处断开。…照此递推下去,最终可以确定As[1,n]+1…n的最优完全加括号方式,即构造出问题的一个最优解。
下面的算法MATRIX_CHAIN_MULTIPLY(A,**s,i,j)是按s指示的加括号方式计算矩阵链A={A1,A2,…,An}的子链Ai…j的连乘积的算法。
Int MATRIX_CHAIN_MULTIPLY(A,**s,i,j)
{
If(j>i)
{
X=MATRIX_CHAIN_MULTIPLY(A,s,i,s[i,j]);
Y=MATRIX_CHAIN_MULTIPLY(A,s,s[i,j]+1,j);
return(MATRIX_MULTIPLY(X,Y)); //计算并返回矩阵X*Y的值
}
else return(Ai);
}
其中MATRIX_MULTIPLY(X,Y)是两个矩阵乘积算法,在此就不给出源代码了。
最后在主函数main中按一定方法调用这些函数,使其以最优计算次序计算给定的多个矩阵相乘。
本人只是做了最优顺序的那一部分,完整代码如下:
// MATRIX_CHAIN_MULTIPLY.cpp : Defines the entry point for the console application.
//
#include "stdafx.h"
#include <iostream.h>
void MATRIX_CHAIN_ORDER()
{
int i,j,k,q;
int m[10][10],r[8],s[10][10];
r[0]=35;r[1]=40;
r[2]=20;
r[3]=10;
r[4]=15;
// cout<<"请输入矩阵个数:";
// cin>>n;
for(j=0;j<=3;j++)
{
for(i=j;i>=0;i--)
{
if(i==j)
m[i][j]=0;
else
{
m[i][j]=100000000;
for(k=i;k<j;k++)
{
q=m[i][k]+m[k+1][j]+r[i]*r[k+1]*r[j+1];
if(q<m[i][j])
{
m[i][j]=q;
s[i][j]=k+1;
}
}
cout<<"m["<<i+1<<"]"<<"["<<j+1<<"](最小乘积)="<<m[i][j]<<" "<<endl;
cout<<"s["<<i+1<<"]"<<"["<<j+1<<"](标记以便回溯)="<<"m[1]["<<s[i][j]<<"]"<<endl<<endl;
}
}
}
}
int main(int argc, char* argv[])
{
MATRIX_CHAIN_ORDER();
return 0;
}