ATI的R600研发进度显然受到了双A合并协调内耗时期的拖累,即使按照2月底上市的最乐观估计,也比NVIDIA G80晚了一个季度还多。正因为如此,R600也被赋予了更高的期望和使命,毕竟后来者居上是所有人的思维惯例,不计成本的实现超越G80甚至是G80改进版G81应该是R600研发团队的唯一目标。
全球范围内目前只有极少的媒体拿到了R600显卡的未完成样板,从现在的成绩看,它能在大多数应用环境超越G80 10% ,这还算是个不错的结果。实现目前成绩的R600拥有如下硬件规格:

样品阶段的ATI R600芯片
80nm工艺核心,64路统一架构器管线,128个着色执行单元,SIMD 4D向量设计,32个纹理单元,16个ROP
512bit内存控制器,1800MHz GDDR3内存,支持最高1024MB本地容量
硬件支持GPU集群——任意2×X数量互联,甚至高于4卡以上
完全兼容DX10以及DX10.1草案
32FP内部处理进程
230W TDP PCI-SIG兼容
与之对应的G80(Geforce 8800 GTX为例)则是使用90nm工艺代工生产,晶体管数量为6.8亿,核心和纹理单元运行频率575MHz、流处理器运行频率1350MHz,提供384bit位宽内存接口(分为6组),内置128个流处理器,24个ROP。内存部分为768MB 1800MHz GDDR3。
G80与R600设计侧重点之间的区别在于G80是完全标量化处理的GPU,面向长度不一的GPU指令更加灵活,资源利用的效率更高,NVIDIA通过增加运算单元的数量、提高它们的频率(1.35GHz异步于核心频率)来增加运算整体运算能力。这些理论化高效能力的实现很大程度上还要依靠NVIDIA的Multi-Threading来实现优化的并发处理,G80具有极为庞大的register资源,能维持4096个平行线程,标量处理单元在这个基础上高效运行。相比较而言,R600的着色器仍旧是SIMD 4D向量设计,只要用一个指令端口,就能单周期完成4倍的运算量,这种传统架构在目前的游戏中表现更好,整体执行效率(不是资源利用率)更高,由于不需浩大的Multi-Threading机构,实现眼前相同运行能力前提下所需的晶体管数目也少得多。