织梦CMS - 轻松建站从此开始!

技术无忧网 - 技术从此无忧 -- 一站式中文IT技术网站 - www.tech51.net

全面深入了解微软的XBOX主机(3)

时间:2010-01-27 17:30来源:未知 作者:admin 点击:
七、带宽篇 XGPU相当北桥芯片,其性能因素有四点:内存带宽;整体和内存延迟时间;图形处理系统带 宽;与MCPX芯片之间的带宽。由于加入第二个顶点描

七、带宽篇
XGPU相当北桥芯片,其性能因素有四点:内存带宽;整体和内存延迟时间;图形处理系统带 宽;与MCPX芯片之间的带宽。由于加入第二个顶点描影器的同时,把XGPU内核频率提高了33MHz,你可以想像XGPU比现有的PC显卡都快。可惜的 是,XGPU却没有GeForce 3显存般的高带宽,主机的DDR内存仅有200MHz(PC3200),远低于GeForce 3的230MHz。XGPU的内存控制器有128位内存宽度,利用交错控制,提高了内存的带宽利用率。高宽度内存在提升内存带宽的同时,也把系统延迟减为 一半。尽管有如此出色的内存控制器,使XBox的总带宽达到PC6400,但Xbox还使用共享内存架构 ,CPU和显示芯片要互相抢占带宽。
在大多数3D游戏中,都有2-4倍的像素透支现象,Quake 3为3倍,Unreal甚至达到6倍。X-Box未必能达到100%像素隐藏,6倍透支时,4渲染管道的效率大约是60%。一个好的隐藏像素算法仅需要4 个像素管道,再加上T&L和HSR,达到1800M像素/秒是完全有可能的,不过,这仅是理论而己,XGPU所能达到的有效像素填充率才值得我们 关心。
Xbox的总带宽为6.4GB,GeForce 3 + 奔腾3 + PC133 SDRAM的组合约为8.5GB/秒,GeForce 3 + Athlon + nForce 420D + PC2100 DDR的组合为11.6GB/秒,PS2的RDRAM和2560位嵌入式DRAM更高达51.2GB/秒。从数据上分析,XBox已经明显输了别人一大 截,按照上述情况,奔腾3 + PC133 SDRAM不是强大得可怕吗?我们分配1.1GB/秒给主系统,5.3GB/秒给其余设备,明显是不够用的,微软怎样解决这个难题呢?
计算一个场景的实际带宽需要很不容易,因为我们难以了解缓存的工作效率,或顶点描影器究竟需要多少带宽。幸好,我们还可以按照常规的3D构图,来大致推断出带宽的使用情况。

Xbox主要的输出对象是NTSC电视机,并非显示器或HDTV(high definition television,高清晰度电视),大多数游戏仍然停留在648 * 480。同时,Xbox的刷新率限制在60Hz,这两个因素都大大减轻了带宽的负担。那么,在游戏加上32位色、32位Z缓冲、每像素4纹理、三线性过滤 后,假设游戏复杂场景导致4倍透支,并且Z缓冲操作使用1.2倍率器。
 
 
帧缓存需求:
640 * 480 *60 * (8字节每像素)*4 * 1.2 = 707.8MB/秒
 
RAMDAC显示60Hz,需要增加:
640 * 480 *60 * 4字节每像素 = 73.7MB/秒
 
在每像素4纹理,三线性过滤(8纹理像素)和31%缓存效率的情况下:
640 * 480 * 60 4字节每像素 * 4倍境深复杂度 * 4纹理 * 8纹理像素 * 31% = 2.9GB/秒
 
707.8MB/ 秒 + 73.7MB/秒 + 2.9GB/秒约等于3.7GB/秒,结果还不太坏,甚至加上16采样各向异性过滤(20%缓存效率)也不过4.55GB/秒。如果你想添加HRAA特 效,必须在总带宽的基础上再乘以4,当然,这时要达到60帧/秒是没可能的,还是30帧/秒比较合适,在每像素2纹理的情况下,带宽需求约为5.5GB /秒。
以上计算还没有包括早期Z检查和无损Z缓冲压缩等降低带宽占用的特性。早期Z检查是一种具有远见的技术,可以减少透支的出现,从4倍降至2或3倍。透支为2时,使用HRAA + 每像素2纹理就可以达到60帧/秒。无损Z缓冲压缩可以减少Z缓冲占用的空间。
通常,Xbox无法与高分辨率的GeForce 3竞争,但不要忘了,Xbox是支持HDTV的,1280*720需要的带宽比HRAA 640 * 480还少,游戏发展商最终可能会放弃HRAA,仅用双线性来代替它,进一步减轻带宽的负担。
七、预测预处理器篇
曾经有错误的报道说Xbox使用PC1600 DDR,后来微软公布的实际规格却是128位 200MHz DDR,相当于PC6400 DDR,利用单独的内存控制器能提供6.4GB/秒的带宽。单个内存控制器同时只能支持一个内存段的数据存取,PC上的双重独立内存控制器却可以同时支持 两个内存段的数据存取。从总体来说,Xbox拥有的内存交叉存取,仍然比不上nForce的TwinBank架构。
XGPU的北桥部分合并了 DASP(Dynamic Adaptive Speculative Pre-Processor,动态适应预测预处理器),作为一个新增的缓存,固化在芯片内部,数据通道为40线,容量是64KB,主要存放CPU下一步将 会用到的数据。借助优化算法,可以监测CPU的内存请求,并找出存取样式,以便进行预测。当它识别到这些样式时,会预测CPU将要用到的数据,并利用未使 用的内存带宽,预先把数据载入的内部缓存。这个预获取动作,让CPU的反应时间提升了40 - 60%。顺便提一句,Athlon XP和奔腾四都加入了此项技术,只是改了个名字罢了。
 
在nForce的测试中,配合Athlon处理器(128KB一级缓存和 256KB二级缓存),DASP可以让StreamD Copy32的分值增加31%,而Adobe Premiere 5.1真实基准测试分值增加了8.82%。Xbox使用的奔腾3仅有32KB一级缓存和256KB二级缓存,分值的增幅可能要小一些。

八、媒体/通讯处理器篇
MCPX(Media and Communications Processor X,媒体/通讯处理器X)主要负责音频和网络工作,它是首个支持DirectSound 8.0的声音处理器,拥有同时处理192个2D音频流或64个3D音频流的能力,还能进行实时杜比数字5.1解码,功能上已经超过了创新的 SoundBlaset Audigy。除此之外,它还包括10/100兆以太网控制器、IDE控制器、USB控制器,通过800MB/秒的 AMD HyperTransport和XGPU交换数据,属于同步数据传输系统。
 
APU是一个集成到MCPX处理单元,主要分为四部分: 第一是设置引擎,控制其它三个DSP(Digital Signal Processing,数字信号处理)的所有资料和参数;第二是声音处理器,负责音效运算;第三是可编程DSP,控制整个声音输出环境;第四是杜比交互式 内容编码器,处理AC 3六声道信号。APU计算完的数据需要输出到主内存,当然,输出到AC97芯片或USB音箱也是没有问题的。
如此复杂的音 频硬件,能够集成到MCPX片中,以前简直是不可想像的。除了Hyper Transport之外,SSAL(single-step arbitration logic,单步仲裁逻辑)技术也功不可抹。APU和系统内存之前的数据交换是DMA(Direct Memory Access,直接内存存取)模式,实时操作由SSAL来控制,提供高优先权处理方式,再配合高带宽达到目的。因此,APU的CPU占用率才有可能达到 SB Live 5.1的十几分之一,在Audigy出现之前,SB Live 5.1是市面上最强的家用型声卡,所以说APU已经站到声卡市场的顶峰也不为过。
尽管PC在很早已经有3D定位音效,但游戏机使用实时3D还 是第一次,更何况MCPX拥有AC3解码,这是一个非常重要的特性。当前PC声卡的5.1回放,使用了6个模拟线路,但大多数杜比数字接收器没有6通道模 拟输入,只有较为发烧的用户会使用6通道模拟输入来作多通道SACD(Super Audio CD,超级音乐CD)或DVD音频。
模拟输入 意味着DVD影碟的杜比数字解码由PC来完成,而不是高品质接收器。虽然软件DTS解码也是可行的方案,但没有一个软件DVD播放器可以支持DTS-ES 离散之类的高级技术。换言之,当今的声卡只允许我们用模拟或数字方式来进行游戏,要听到真正的DVD音频还需要借助分离的S/PDIF(Sony /Phillips Digital Interface,索尼/飞利普数字接口)电缆。XBox比PC更厉害,用一根电缆可以同时支持DVD回放和3D游戏定位,完全是硬件AC-3解码的功 劳。
直到不久前,PS2还仅仅有杜比数字和DTS,严重缺乏交互式游戏音效。最近,EA宣布SSX Tricky和NHL2002两款游戏会使用PS2的实时DTS解码,主要借助Emotion Engine引擎来进行软件处理,由于新算法没有使用到声卡芯片和嵌入式PS1芯片,所以不太清楚软件模拟是否对性能有影响,也不知道究竟有多少个3D DTS音频流。然而,我可以肯定一点,XBox MCPX的硬件处理比PS2软件模拟更为出色,而且很快会有大量游戏支持这个新特性。
XBOX的 音频芯片很强大,其超强的声音处理能力,甚至能透过硬件直接进行游戏配乐变调处理,让原本交响乐变成摇滚乐,制作一首全新的游戏主题曲,增添不同的游戏乐 趣。nVidia计划在PC上发售采用X-APU的声卡,有传言说,Creative看到这颗芯片,才决定推出早己准备好的Audigy声卡,再次证明了 有竞争才有进步的不变真理。
视频/音频处理和网络数据传输需要大量的实时数据流,虽然DMA可以实现这个要求,但传统的仲裁设计有一定缺陷, 带宽不足和反应不及时,常常在数据流超量时发生画面/声音停顿的现象。为此,nVidia引入了StreamThru同步数据传输技术。在MCPX内 部,10/100M存取控制器可以越过快速总线,直接和HyperTransport控制器同步交换数据。资料进一步传输到IGP HyperTransport控制器后,再以同步或非同步的形式传到智能仲裁器。智能仲裁器能分析数据读取和写入的路径,动态分配不同的内存等待时间和带 宽给实时数据流,提升它们工作效率。所以,你会发现网络数据流测试时,nForce可以同时保持高带宽和低CPU占用率。
StreamThru确保了带宽被正确地分配到各个子系统,数据包能够得到系统的优先权,保证及时到达目的地,所以Xbox的板载网络控制器,真实吞吐能力可以比得上3Com或英特尔的100Base-TX NIC。
对于一个独立的网络客户机来说,StreamThru是个很有用的特性,可以让大量的数据文件快速通过网络,可是,现实环境的情形又有所不同。首先,家 庭宽带连接仅仅使用10兆以太网,大多数学校也不过100Mbps,使用PC来联网的人比用游戏机联网的人更多,XBox的优势无从发挥。其次,如果玩局 域网游戏的话,PS2拥有400Mbps IEEE1394链路,速度比Xbox快四倍,又怎能说Xbox是高速呢?也许,它剩下的唯一优点就是可以使用以太网集线器,无须购买昂贵的IEEE- 1394集线器。

九、CPU篇
微软曾经考虑过AMD处理器,后来因为价格问题,才转向英特尔阵营。英特尔有本钱做亏本买卖,AMD却没法做到。反过来想,若是AMD肯大幅降低CPU价 格,怎知Xbox的推广不会对增加市场份额有帮助?按照微软的说法,Xbox CPU是基于奔腾3内核,好像赛扬2也是用奔腾3内核的,不过二级缓存降为128KB,幸好,Xbox的最终规格明确地指出Xbox使用奔腾3处理器。

 

《Air Force Delta II》(空中力量2)等Xbox的游戏效果不错吧,还使用了抗锯齿技术呢。

3D几何计算主要由XGPU来完成,奔腾3 FPU的压力减少了许多,但CPU还要负责游戏逻辑、物理、虚拟人工智能、管理内存等重要工作,即使加上T&L硬件后,更快的CPU还是可以带来 更高的帧速率。特别是对于640 * 480这样的低分辨率来说,高速CPU的意义更加明显,1GHz奔腾3玩Quake 3 Arena就比733MHz奔腾3快15%。如果CPU采用赛扬的话,简直就是个不能容忍的技术缺陷,Duron能够轻易打败赛扬,更不要提它的本家奔腾 3了。

(责任编辑:admin)

织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片