2010年8月31日 星期二

2011 新一代 CPU及伺服器發展趨勢 (2)

http://www.ithome.com.tw/itadm/article.php?c=63039&s=2

2011 x64處理器技術發展趨勢
處理器技術的進展已成為當代個人電腦與伺服器發展的重大關鍵,隨著x64架構、多核心處理器的普及,以及製程的持續改良,以伺服器平臺的選擇來說,不論從效能、省電、價格等觀點來採購時,都比過去有更多的選擇。

提升製程技術,選擇更多
2009年時,AMD在單路、2路與4路伺服器市場上,發布了代號為的Suzuka與Istanbul Opteron處理器。其中,Suzuka是針對1路,而Istanbul則是針對2路與4路伺服器。

Istanbul是從上一代的Shanghai改進而來,最主要差異在於從4核心增加為6核心;處理器型號從2路的2300改為2400,4路的8300 改為8400。在其他方面,它們都同樣採用45奈米製程,平均處理器功耗(ACP)同樣使用Socket F(1207腳位)插槽,L3快取記憶一樣是每個核心6MB,並且延續了處理器直接連結架構(Direct Connect Architecture)。

而針對單路伺服器,型號為1300的Suzuka處理器,與Istanbul同樣是45奈米製程、內建6MB的L3快取記憶體與75瓦ACP,不過核心數只有4核心,且使用Socket AM2+的處理器插槽。

而目前AMD最新的伺服器處理器,將原本Suzuka與Istanbul改為Lisbon的4100系列,以及Magny-Cours的6100系列處理器。

Lisbon是針對1路與2路伺服器所推出的處理器,與前一代的Suzuka及Istanbul一樣,都是45奈米製程,不過核心數可分為4核心與6核心 兩種,每核心內建6MB L3快取記憶體,支援雙通道的UDIMM與RDIMM DDR3記憶體,Socket改為新的C32處理器插槽。而Magny-Cours則是內建8核或12核心,針對2路與4路伺服器的處理器,除了擁有大量 的核心數目之外,這系列處理器還支援目前最多的記憶體4通道,並改用G34處理器插槽。

在2011年,AMD將推出下一代新處理器,代號分別是12核與16核的Interlagos,以及6核與8核心的Valencia。這兩個系列都採用 AMD新的Bulldozer架構,透過執行緒的增加,強化處理器運算速度,且L3快取記憶體增加為12MB,且Interlagos將延續使用與 Magny-Cours相同的主機板平臺:Maranello;而Valencia則與Lisbon同樣採用San Marino的主機板平臺。

從Istanbul到Magny-Cours的變化,我們可以看出處理器的核心數目增加之外,製程技術也不斷加強,從45奈米提升到32奈米,而且在下一代的處理器中,還採用新的Bulldozer架構,在AMD的處理器中,首次加入了多執行緒強化處理器運算速度。

而Intel在今年初發布了採用32奈米製程,名為Westmere系列的處理器,同樣承襲Nehalem的主要架構。

由於製程技術的提升,讓相同大小的晶片內可置入更多的處理器核心,因此Westmere系列中,就有6核心的處理器,例如Xeon W3680、E5650與X5680等。而且這系列處理器內建的快取記憶體,比前一代Nehalem內建的8MB L3還多,增加到12MB的L3快取記憶體,並且全面支援DDR3記憶體,最高可支援的記憶體總數,則是比前一代多出一倍,高達288GB記憶體。

受到製程技術提升的影響,我們還可看到另一個關鍵的改進,那就是耗電量。我們以Intel 45奈米製程的5500系列,與32奈米製程的5600系列的規格相比,就可看出新一代的製程技術帶來的節電效果。

去年製作伺服器採購特輯時,所測試的Xeon E5520處理器,與今年新一代的E5620相比,雖然兩個處理器的熱設計功耗(TDP)都是80瓦,且核心與執行緒數量如出一轍,但是E5620的時脈 比E5520高出一些,而且如前面所說加強的技術,以及新增的功能,都讓相同熱功耗設計的處理器,呈現完全不同的效能。因此新的製程技術,讓處理器在相同 的耗電量下,可達到更高的效能。

不過AMD今年仍使用45奈米製程,預計明年的Interlagos與Valencia將會使用32奈米製程。




以多核心及執行緒提升運算效能
觀察近來AMD處理器的發展,我們可以發現AMD與Intel的處理器,多工的處理方式不盡相同。例如,Intel發展的多執行緒架構(Hyper- Threading),在一顆處理器內擁有4核、或是最新的Xeon 5600系列的6核心,其中每個核心都有2個執行緒,也就是每顆處理器都有8個或12個執行緒;而AMD的Opteron則是朝實體核心數量發展,例如目 前研發代號為Magny-Cours的6100系列處理器,就內建實體6核心,而針對1路伺服器的4100系列處理器,則內建有4個實體核心。而且,在下 一代的Valencia與Magny-Cours,則讓核心數增加到6至8核心,以及8至12核心。

AMD不斷的在處理器內增加更多的核心,原因是它們認為實體核心的運算效能,會比使用虛擬的執行緒的運算效能更佳。

不過他們在2011年即將發表的Bulldozer架構處理器,在增加核心數的同時,還結合了2個實體核心,讓平行運算的過程中,可使用兩個實體核心共同運算,而且它們的L2與L3快取記憶體也是共享,讓平行運算架構可用兩個核心運算。

依照Intel的標準來看,包含2個核心的Bulldozer只能算是擁有雙執行緒的單核心處理器,例如內建16核心的Interlagos處理器,對Intel來說,就是8核心、16執行緒的處理器。

每個Bulldozer除了擁有2個核心所組成,可共同運算的雙執行緒模組之外,還因為每個核心都擁有由4條管線(Pipeline)所組成的整數運算單 元,因此Bulldozer中,都有2個由4條管線所組成的整數運算單元,另外還有2個128位元,可合併為256位元的浮點運算單元。再加上共用的L2 快取記憶體,因此Bulldozer之中的每個整數運算單元會被當作一個物理核心,就如同Intel的超執行緒一般。

在Intel方面,雖然使用了超執行緒的技術,但是在實體核心數目的發展也沒有停下腳步,在去年推出新一代的Nehalem架構處理器,採用45奈米製程,並且依照單路、2路與4路伺服器等不同市場,分別推出3500、5500與7500系列處理器。

而在今年初,Intel又進一步推出新一代的3600與5600系列,採用32奈米的製程技術,將原本5500系列內建的核心數目,增加到6核心,執行緒也增加為24執行緒。

並且延續或增進上一代Nehalem系列中的多種規格與技術,例如5500系列支援記憶體總數為144GB,而Westmere的5600系列則增加一 倍,達到288GB;另外還加大了L3快取記憶體,從8MB提升到12MB。而之前每個處理器中內建的Intel超執行緒(Hyper- Threading)與Turbo Boost超頻技術等,也是一樣都不少。

超執行緒技術,只要應用程式有支援,就可讓單一處理器核心使用類似虛擬化的方式,讓處理器同時執行多個平行運算工作。

另一個超頻技術Turbo Boost與超執行緒的平行運算不一樣的地方,在於Turbo Boost是針對無法同時運算的序列運算。它的加速運算方法,是降低4核心處理器之中的兩個核心時脈,也就是降低它們的電壓,將另外兩個核心電壓與時脈加 高,藉由時脈速度的提高,加速序列運算的速度。而且在增加時脈的時候,Intel的處理器還會主動偵測目前電壓與時脈速度,並且評估是否可以讓時脈速度再 往上提升,或是應減慢時脈以保護處理器。
藉由這種自動切換運算需求的超執行緒與Turbo Boost技術,Intel的目的就是讓處理器,變的更加聰明,會因應需求而切換功能。