最近由于要在linux下进行一些并行计算的实验,所以决定在fedora下安装mpich,现在mpich的版本已经发展到mpich2了,但是由于实验的内容要求用mpich所以就决定安装mpich。
第一步,到相关网站上下载mpich的安装包:
我采用的是1.2.7版本的mpich:
$ tar xzvf mpich-1.2.7.tar.gz
$ cd mpich-1.2.7
$ ./configure --prefix=/usr/local/mpich -rsh=ssh(注意这个地方)
$ make
$ make install
第二步,设置环境变量
vim /etc/profile
修改path,增加mpich的bin文件夹目录/usr/local/mpich/bin
source /etc/profile
第三步,修改配置文件
1.权限设置
为了能够在多个不同的机器上运行MPI程序,首先需要其它机器对启动MPI程序的机器放权,即允许启动MPI程序的机器访问其它机器。权限的设置主要有两种方法,一种是在其它所有机器的/etc/hosts.equiv文件中加入启动MPI程序的机器名。例如要在pc01这台机器上启动MPI进程,而计算过程中要用到pc02和pc03两台计算机,则需要在pc02和pc03机器的/etc/hosts.equiv文件中加入如下一行:
pc01
单机内此账户登陆无需授权,如果/etc/hosts.equiv文件不存在,则需要先创建该文件。
2.主机设置
要使MPI程序启动后能够在多个主机上并行执行,还必须对可用的主机进行设置,相应的配置文件为/usr/local/share/machines.LINUX。编辑该文件,在每一行写上可用的机器名。例如,只要在该文件中添加以下几行:
pc01
pc02
pc03
如果是单节点的话,不同的行可以写相同的节点。
第四步:书写并行程序
#include
#include “mpi.h”
int main(int argc, char **argv)
{
int myrank, nprocs, namelen;
char processor_name[MPI_MAX_PROCESSOR_NAME];
MPI_Init(&argc, &argv);
MPI_Comm_size(MPI_COMM_WORLD, &nprocs);
MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
MPI_Get_processor_name(processor_name, &namelen);
printf(“Hello World! I’m rank %d of %d on %s\n”, myrank,
nprocs, processor_name);
MPI_Finalize();
return 0;
}
第五步:编译运行
[xcz@localhost document]$mpicc -o hello hello.c
[xcz@localhost document]$ mpirun -np 4 hello
xcz@localhost.localdomain's password:
xcz@localhost.localdomain's password:
xcz@localhost.localdomain's password:
Hello World! I’m rank 0 of 4 on localhost.localdomain
Hello World! I’m rank 2 of 4 on localhost.localdomain
Hello World! I’m rank 3 of 4 on localhost.localdomain
Hello World! I’m rank 1 of 4 on localhost.localdomain
由于我在并行计算的时候,使用的是ssh,而我并没有配置ssh,进行无密码登陆,所以运行程序的时候需要输入用户密码。用户可以根据自己的系统环境,如果有rsh的可以直接在编译的时候不用加上-rsh=ssh选项。
出现的问题:
看问题之前,首先让我们来了解一下关于ssh和rsh的知识:
SSH(Secure Shell)是一安全的网络连接程序,它可以让你通过网络连接至其他电脑,在其他电脑上执行程序,在电脑之间拷贝文件,它甚至可以提供给你更安全的X连接,而以上的这些连接,都是在编码的保护下完成的。也就是说安装了SSH后就可以将不安全的Telnet和FTP给关掉了。
上面所说的各项功能,早期BSD所提供的r指令(rsh,rlogin,rcp)几乎都能完成,那为什么要用SSH呢?理由就在于r指令所提供的连接并没有经过编码加密,有心人只要使用合适的工具就能够截下你所输入的每一个字,包括密码。如果你利用X protocol在远端机器执行X程序,也可以截下你传输的资料,当然也包括密码。而SSH就针对了这些弱点做了弥补,对所传输的资料加以编码。
rsh(Remote Shell Protocol),远程shell协议(rsh)是允许一个用户在一个远程系统上执行命令而不需要登录这个系统的协议。例如,rsh能够用于远程检查许多接入服务器的状态而不需要连接到每个通信服务器,执行这个命令,然后从这个通信服务器断开。 Rsh起源作为BSD Unix操作系统的一部分作为在1983年在 4.2BSD远程登录命令包中的一部分。Rsh从那开始已经开始支持其它操作系统。Rsh基本上被安全Shell协议在现今的环境中取代。
了解了上面的知识以后,我们来看看我的问题。mpich运行环境既可以采用rsh也可以采用ssh登陆远程节点,MPICH默认采用rsh连接,若要使用安全性更高的ssh连接,安装MPICH时configure需加-rsh=ssh选项,而到了mpich2就默认的是采用ssh,而不用rsh了。
由于当时我不知道这一点,在configure的时候采用的是默认安装,所以选用的是rsh,可是我的系统fc8没有rsh,它支持的是ssh,所以当我安装完后,根本无法运行程序,经过查看后台服务,我发现机器上没有装rsh的任何服务,而是安装了ssh的服务sshd,所以我就试着安装mpich2,安装完成后,运行成功,说明就是rsh的祸,然后我又查找了一些资料,知道了解决的方法,那就是在configure的时候加上-rsh=ssh选项。