1 Fundamentals of Computer Design (Cont.)
影响成本的主要因素:时间(学习曲线)、产量、商品化程度(竞争等)。
经验公式:cost of die = f(die area ^ 4)。(andy:数据比较早,取alpha=3.0,第三版中alpha=4.0,好像是2001年的数据)
只有真实程序的执行时间才是对机器性能一致和可靠的测量指标。
测量时要注意流逝时间和CPU时间的差别,一般测量总是在操作系统上进行的。(andy:可以参考《深入理解计算机系统》中关于时间测量的章节)
评测程序的分类:
real program
kernels
toy benchmarks
synthetic benchmarks
性能报告的指导原则:可重现性
性能评测与比较要关注的方面:
程序选择
实验环境
测量指标(如何定义快慢)
数据合计方法
对执行时间进行规格化(normalize)后,应当用几何均值进行合计,这样将不受参考者选择不同的影响。
几何均值的问题:不直接反映执行时间
用几何均值计算的评测得分,可以通过改善最易优化的程序的性能来提高得分。如以下两种优化对得分的改善是相同的:
程序1,执行时间从2秒降低为1秒;
程序2,执行时间从10000秒降低为5000秒。
理想的方案:测量实际工作负载,给各个程序分配反映实际执行频率的权重。
如果无法得到权重,那么进行规格化,对各个程序一视同仁;
如果要进行规格化,那么最好先按照权重进行合计,再规格化。
(andy:成也权重,败也权重!没有适当的权重分配,会导致错误的结果!)
计算机设计量化方法的准则:Make the Common Case Fast / Amdahl's Law。
Speedup = Original execution time / Enhanced execution time
Speedup = 1 / (1 - Enhanced fraction + Enhanced fraction / Enhanced speedup) < 1 / (1 - Enhanced fraction)
CPU time = IC * CPI * cycle time
评估CPU时间各个影响因子:
clock time:难以估计,尤其在设计的前期。一般先设定目标频率,再评估关键路径的影响。很需要经验。
IC:编译器很关键。对于新ISA的设计,尽早开发编译器非常重要。获得数据的方法:
模拟器:速度是一个问题。影响速度的因素有:程序质量,目标机和宿主机的结构差异(andy:why?)。
execution-based monitoring:典型的instrument,执行时间为1.1-1.2倍。(andy:以前没有注意过,了解一下吧)
CPI:和organization相关。CPI = Pipeline CPI + Memory system CPI。
局部性:大约10%的指令占总执行时间的90%。