2010年8月31日 星期二

2011 新一代 CPU及伺服器發展趨勢 (3)

http://www.ithome.com.tw/itadm/article.php?c=63039&s=3

直接溝通架構(Direct Connect Architecture)
在AMD的Istanbul架構中,多路伺服器之間的連結,是採用AMD的直接溝通架構1.0,可讓處理器之間直接溝通,且可以降低記憶體與處理器的 I/O延遲,並加速這些元件之間的傳輸速度。不過以4路處理器來看,採用1.0的直接溝通架構時,每顆處理器都只能與相連的另外2個處理器做溝通。因此, 今年AMD更新的直接溝通架構2.0,讓所有處理器之間都可做溝通,也就是說,4路伺服器內部的每顆處理器,都可與另外3個處理器直接做溝通。而 且,1.0的直接溝通架構最多僅能支援6核心處理器,而2.0則可支援到16核心。

而且,新一代的直接溝通架構還加強了處理器之間的傳輸速度,從原本的,4.8GT/s增進到6.4GT/s;在記憶體方面,每顆處理器可支援的記憶體插槽 數量,從1.0的8 DIMM增加到12 DIMM,並且首度支援了DDR3記憶體,同時支援UDIMM與RDIMM,在記憶體搭配的選擇上更豐富。

在多路伺服器的架構上,Intel的7500系列處理器擴展性也有改善,從可以2顆處理器串接,共用32組記憶體插槽,組成一個2路模組,並且可持續擴展處理器數量到最多256顆7500系列處理器。這樣的擴充模式可透過多顆處理器來分擔運算負荷,加速整體運算效能。


新增指令集
指令集,就是將原本需要透過多行軟體指令解碼的動作,改由硬體解碼。而AMD的Interlagos所採用的Bulldozer架構,將會相容於目前 Intel處理器已經支援的指令集,例如SSE4.1、SSE4.2、AES與CLMUL等,而且也把SSE5的指令集內建在其中,不過他們將這個指令集 拆為XOP、FMA4與CVT16等3個指令集,並且相容於Intel的AVX指令集。

在Intel方面,Xeon系列全部處理器都支援MMX、SSE、SSE2等指令集,以及Intel進階加密標準新指令(AES-NI),這個指令集之中 包含7種新的指令,加速資料的加密與解密,讓資料在存入時就以加密的形式儲存,確保資料的安全性。另外,在下一代的Sandy Bridge系列中,還會新增針對密集浮點運算所制定的指令集:先進向量擴充指令集(AVX)。

由以上這些功能,我們可以看出,結合超執行緒與Turbo Boost超頻的技術,讓Intel處理器在面對不同的運算資料時,都可切換適當的模式,加速這些序列運算,或是平行運算等不同運算模式。另外,在加上越 來越多的指令集內建在其中,讓許多常見的運算功能都能夠透過指令集運算,讓處理器核心不用花費太多時間在瑣碎的運算中。



越來越聰明,與計算能力越來越強的處理器

將來的處理器,勢必在效能上會越來越強,問題在於,AMD與Intel要如何達到這樣的目標?

目前,我們可以看出AMD持續的朝實體核心的數目發展,因為他們認為實體核心的運算效能,比虛擬化的執行緒更佳,因此在處理器的發展上,持續增加實體核心 數量,並且加強多路伺服器處理器之間的溝通,讓處理器在各自擁有多核心的同時,還可共享資源,讓多處理器架構的系統在運作效能上,就像是一個擁有數十個核 心的處理器一般。

另外,在個人端的處理器,他們也開始結合繪圖晶片驚人的平行運算效能,將平行運算的內容傳送給繪圖晶片(GPU),並透過可程式控制GPU內部的多個平行 運算核心及記憶體,用來處理非圖形的平行運算,所組成的新組態:通用型GPU(General Purpose GPU,GPGPU),讓原本針對圖形運算的繪圖晶片開始分擔處理器的運算,甚至更進一步的把繪圖晶片整合在處理器內部,變成Accelerated Processing Unit(APU),也就是說,將來的APU內部,將包含一個運算核心、一個可程式化向量運算引擎、記憶體控制器、I/O控制器、視訊解碼器以及匯流排介 面等多種功能與控制器。

雖然,目前這樣的處理器僅出現在個人端,不過我們可以預見伺服器的處理器也將會整合這樣的設計,針對不同的運算內容,使用針對純量的運算核心,或是使用向量的繪圖核心作不同的運算,藉此提高整體的運算效能。

而Intel方面,將持續發展超執行緒與Turbo Boost,兩種針對平行運算與序列運算的技術。

雖然兩家處理器廠商的目的都是相同的,那就是提供更高的運算速度與效能,但是Intel發展的方向與AMD卻不大一樣,因為他們的方式,是讓處理器能自動選擇與切換運算模式。

以當前Intel的Xeon處理器而言,內建了針對序列運算而提升時脈速度的Turbo Boost,以及平行運算的超執行緒技術,讓Intel的處理器在面對各種資料類型時,都能切換運算模式,加速各種運算的速度,讓系統的效能提升。另外, 日益增進的製程技術加上省電技術,讓處理器可減少耗電量,或是在相同耗電量提供更佳的運算效能。

就像今年Intel推出的32奈米Xeon Westmere 5600系列處理器,除了部分產品核心增加為6核心之外,其他同系列處理器雖然核心與執行緒的數量,與前一代的Xeon 5500系列一樣,維持在4核心8執行緒,但是時脈速度略微提高,讓處理器在相同的耗電量之下,擁有更高的運算速度。