并行计算机体系结构技术与分析
分類: 图书,计算机/网络,计算机理论,
作者: 杨晓东,陆松,牟胜梅著
出 版 社: 科学出版社
出版时间: 2009-1-1字数: 306000版次: 1页数: 243印刷时间: 2009/01/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787030218162包装: 平装内容简介
本书以研制高性能计算机系统为线索,对计算机系统结构的演变和并行计算机的发展作了论述,对设计、构建高性能并行计算机涉及的关键技术作了系统、深入的分析,以深刻的观点讲述了并行计算机系统性能的度量和评测方法、流水和向量处理技术、各类存储系统的结构、同步机制、互连网络的原理和设计、I/O系统以及系统可靠性和稳定性等。一些创新成果和学术思想,对研制稳定可靠、简洁高效的高产出率并行计算机系统有重要指导意义和应用价值。设计的多个无死锁自适应路由算法,可有效支持高产出率并行计算机系统的构成。
本书可作为高等院校相关领域的教师和研究生的教学参考书,也可供相关科研人员阅读。
目录
丛书序
前言
第1章 计算机系统结构的演变
1.1 计算机体系结构的分类
1.2 几个经验定律
1.3 微处理器
1.3.1 提高微处理器性能的方法
1.3.2 微处理器的发展
1.3.3 巨型机用微处理器
第2章 并行计算机系统的性能度量
2.1 计算机的速度
2.1.1 MIPS、Flops和PDR
2.1.2 SPEC和TPS
2.2 并行计算机的速度计算
2.2.1 算术平均速度(arithmetic mean performance)
2.2.2 调和平均速度(harmonlc mean performance)
2.2.3 几何平均速度(geometric mean performance)
2.3 并行计算机的加速比和效率
2.3.1 程序的并行性
2.3.2 加速比通式
2.3.3 固定负载加速比
2.3.4 固定时间加速比
2.3.5 固定存储加速比
2.3.6 粒度匹配加速比模型
2.3.7 并行系统的效率和可扩展性
2.3.8 并行系统的并行质量
2.3.9 并行系统的性能评测
第3章 流水和向量处理
3.1 提高计算机速度的措施
3.1.1 提高频率
3.1.2 空间并行
3.1.3 时间并行
3.2 线性流水线
3.2.1 流水线工作原理
3.2.2 加速比、效率和吞吐率
3.2.3 流水线的设计原理
3.2.4 指令流水部件
3.2.5 向量处理
3.2.6 无冲突向量访存
3.3 非线性流水线
3.3.1 预约表和最小平均延迟时间
3.3.2 无冲突输入控制和设计
3.3.3 多功能流水线的效率和吞吐率
3.4 超标量和超流水技术
3.4.1 超标量技术
3.4.2 超流水技术
第4章 典型并行计算机系统
4.1 并行计算机系统结构分类
4.1.1 SM与DSM多处理机系统
4.1.2 分布式主存DM
4.2 典型并行计算机系统
4.2.1 阵列机
4.2.2 向量机
4.2.3 对称多处理机SMP
4.2.4 大规模并行处理系统MPP
4.2.5 C1uster集群
4.2.6 高性能可重配置计算机HPRC
4.3 从Top500看高性能计算机系统结构发展趋势
4.4 典型高性能计算机系统
4.4.1 Cray X1
4.4.2 地球模拟器(NEC Earth simulator)
4.4.3 蓝色基因/L(IBM BlueGene/L)
4.4.4 Intel 64 Linux Cluster Abe
4.5 小结
第5章 并行存储系统和同步机制
5.1 存储器的地址映射
5.2 层次存储系统
5.2.1 程序访存的局部性原理
5.2.2 存储系统层次
5.2.3 层次存储系统特点及性能分析
5.2.4 层次存储系统存储器间块的映射
5.2.5 “主存辅存”层次地址变换
5.2.6 “高速缓存主存”层次
5.3 访存事件次序和cache一致性
5.3.1 存储一致性模型
5.3.2 高速缓存一致性协议
5.3.3 CC NUMA的Cache一致性
5.4 同步
5.4.1 Test-land-Set/Reset
5.4.2 Barrier/Eureka
5.4.3 Compare-Swap
5.4.4 Fetch-and-Add
第6章 互连网络
6.1 互连网络的互连函数
6.2 互连网络类型和基本结构参数
6.2.1 互连网络类型
6.2.2 互连网络的基本特性和结构参数
6.3 动态互连网络
6.3.1 总线
6.3.2 交叉开关
6.3.3 多级网络
6.4 静态互连网络
6.4.1 线性阵列和环
6.4.2 树和星形网
6.4.3 k-ary n—cube网络
6.5 MPP系统的互连技术
6.5.1 互连网络拓扑结构
6.5.2 互连网络切换技术
6.5.3 互连网络流控策略
6.5.4 路由算法
6.5.5 经典路由算法分类
6.6 互连网络的死锁问题
6.6.1 死锁的解决
6.6.2 无死锁理论研究
6.7 自适应路由算法的虚网叠加原理
6.7.1 虚网的构造
6.7.2 几个完全自适应路由算法
第7章 I/O系统
7.1 从共享并行总线到高速串行总线
7.1.1 典型共享总线
7.1.2 提升性能的技术手段
7.2 HyperTrartsport
7.2.1 HyperTransport总线拓扑结构
7.2.2 HyperTransport信号组
7.2.3 Hypm‘Transport通信
7.2.4 HyperTransport包路由
7.2.5 HyperTransport路由规则
7.2.6 HyperTransport 3.0的新特性
7.3 PCI Express
7.3.1 PCI Express信号组
7.3.2 PCI Express拓扑结构
7.3.3 PCI Express的体系结构
7.3.4 PCI Express通信
7.4 InfiniBand
7.4.1 InfiniBand体系结构
7.4.2 InfiniBand交换机结构模块
7.4.3 IBA层次体系
7.4.4 包的管理与通信机制
7.4.5 InfiniBand与其他网络互连方式的比较
第8章 系统的可靠性和稳定性
8.1 器件的散热
8.2 逻辑信号传输
8.2.1 传输线
8.2.2 阻抗匹配
8.3 系统可靠性
8.3.1 可靠性特征参数
8.3.2 不维修系统可靠性计算
8.3.3 可维修系统可靠性计算
参考文献
书摘插图
第1章 计算机系统结构的演变
随着电子器件、工艺和体系结构等技术的发展,计算机已经历了五代的发展历程。其性能每代都比前代有了数量级的提高。发展时代的划分基于器件并体现在体系结构上,说明体系结构的实现离不开器件和工艺的支持,决定因素还是器件。体系结构不外乎是合理利用现有器件性能的支持,采用新的概念、技术和方法构造新的体系结构,实现性能更高的计算机系统。一个时期的器件和体系结构决定了该时期计算机的性能和性价比。虽增大投入可获得更高的性能,但这是有条件的,当原理上可行而实际上不可行时,投入便失去了意义。这时便需要新技术的支持。如原理上SMt,系统可通过增加处理器的数量来提高系统的性能,但由于存在访存瓶颈,可增加的处理器数量是有限的。MPP系统可以避免SMP系统可扩展性差的问题,但也是在微处理器出现后才真正得以实现。当然,互联网络的性能又可能成为限制MPP规模扩展的瓶颈。微处理器的出现不仅为构造计算机系统,特别是可扩展并行计算机系统提供了高性价比的构件支持,也改变了传统计算机系统的设计思想和方法。
计算机发展时代可以这样划分:
1946年第一台计算机问世到1956年划为第一代。该代的特点是电子管用作逻辑元件,继电器或延迟线用作存储元件,绝缘导线互连。CPU是单地址指令集串行或串并行结构。用机器/汇编语言编程。代表机型有ENIAC和IBM701等。
1956~1967年划为第二代。该代的特点是晶体管用作逻辑元件,磁心作存储元件,印刷电路板互连。CPU是多位并行结构,引入了变址寄存器、浮点部件、交叉存储和通道技术。用高级语言Algol和Fortran编程,有了批处理操作系统。代表机型有IBM7030和CDCl604等。
……