缓存
推土机的每个核心都有64KB一级数据缓存、64KB一级指令缓存、32-entry全关联数据页表缓存(DATA TLB)、完整乱序载入/保存单元,后者可以在每个时钟周期内载入两个128位或载入一个128位指令。
每个模块配备2MB 16路关联二级缓存、124-entry二级页表缓存,可同时处理指令和数据请求。推土机支持最多23个二级缓存不命中,用于保持内存系统一致性。
最后,一颗推土机处理器的所有模块与核心共享8MB 64路关联三级缓存。
【新一代Turbo Core智能超频技术】
智能超频(动态加速)这种技术最早是Intel在45nm Lynnfield上搞出来的,叫做Turbo Boost(中文名睿频),Sandy Bridge上进化为第二代,可根据应用负载升降不同核心的频率,从而兼顾对频率、线程明暗度不同的应用与整体性能、功耗。AMD Phenom II X6六核心首次引入自己的智能超频技术Turbo Core,但还不是很完善。Llano APU也部分加入了这种技术,并且支持CPU、GPU两个核心的加速。现在,推土机迎来了真正的第二代。
推土机大大改进了电源管理技术,在核心级别上支持CC6电源状态,在模块级别上可通过CC6支持二级缓存的电源门控(Power Gating)。有了电源门控,空闲核心就可以几乎完全断电,从而给其它核心留出更大的加速空间。
推土机有三种运行模式:原始预设的基准频率、全部核心开启的加速频率、半数核心开启的加速频率。
全部核心加速:如果多余的热设计功耗(TDP)空间允许,推土机可以对所有的核心进行加速,适合那些需要尽可能高频率的线程密集型应用,最高能超500MHz。
AMD宣称,Turbo Core技术在这种情况下可以带来4-7%的性能提升。
半数核心加速:这种情况下半数核心完全关闭,另外一半核心则更大幅度地加速,适合那些对多线程不太敏感、但需要高频率的应用。相比第一代,现在的加速幅度明显更高了,理论上最高可达1GHz。
AMD宣称,Turbo Core技术在这种情况下可以带来5-12%的性能提升。