中和: 2011 新一代 CPU及伺服器發展趨勢 (2)

2010年8月31日星期二

2011 新一代 CPU及伺服器發展趨勢 (2)

http://www.ithome.com.tw/itadm/article.php?c=63039&s=2

2011 x64處理器技術發展趨勢
處理器技術的進展已成為當代個人電腦與伺服器發展的重大關鍵，隨著x64架構、多核心處理器的普及，以及製程的持續改良，以伺服器平臺的選擇來說，不論從效能、省電、價格等觀點來採購時，都比過去有更多的選擇。

提升製程技術，選擇更多
2009年時，AMD在單路、2路與4路伺服器市場上，發布了代號為的Suzuka與Istanbul Opteron處理器。其中，Suzuka是針對1路，而Istanbul則是針對2路與4路伺服器。

Istanbul是從上一代的Shanghai改進而來，最主要差異在於從4核心增加為6核心；處理器型號從2路的2300改為2400，4路的8300 改為8400。在其他方面，它們都同樣採用45奈米製程，平均處理器功耗（ACP）同樣使用Socket F（1207腳位）插槽，L3快取記憶一樣是每個核心6MB，並且延續了處理器直接連結架構（Direct Connect Architecture）。

而針對單路伺服器，型號為1300的Suzuka處理器，與Istanbul同樣是45奈米製程、內建6MB的L3快取記憶體與75瓦ACP，不過核心數只有4核心，且使用Socket AM2+的處理器插槽。

而目前AMD最新的伺服器處理器，將原本Suzuka與Istanbul改為Lisbon的4100系列，以及Magny-Cours的6100系列處理器。

Lisbon是針對1路與2路伺服器所推出的處理器，與前一代的Suzuka及Istanbul一樣，都是45奈米製程，不過核心數可分為4核心與6核心兩種，每核心內建6MB L3快取記憶體，支援雙通道的UDIMM與RDIMM DDR3記憶體，Socket改為新的C32處理器插槽。而Magny-Cours則是內建8核或12核心，針對2路與4路伺服器的處理器，除了擁有大量的核心數目之外，這系列處理器還支援目前最多的記憶體4通道，並改用G34處理器插槽。

在2011年，AMD將推出下一代新處理器，代號分別是12核與16核的Interlagos，以及6核與8核心的Valencia。這兩個系列都採用 AMD新的Bulldozer架構，透過執行緒的增加，強化處理器運算速度，且L3快取記憶體增加為12MB，且Interlagos將延續使用與 Magny-Cours相同的主機板平臺：Maranello；而Valencia則與Lisbon同樣採用San Marino的主機板平臺。

從Istanbul到Magny-Cours的變化，我們可以看出處理器的核心數目增加之外，製程技術也不斷加強，從45奈米提升到32奈米，而且在下一代的處理器中，還採用新的Bulldozer架構，在AMD的處理器中，首次加入了多執行緒強化處理器運算速度。

而Intel在今年初發布了採用32奈米製程，名為Westmere系列的處理器，同樣承襲Nehalem的主要架構。

由於製程技術的提升，讓相同大小的晶片內可置入更多的處理器核心，因此Westmere系列中，就有6核心的處理器，例如Xeon W3680、E5650與X5680等。而且這系列處理器內建的快取記憶體，比前一代Nehalem內建的8MB L3還多，增加到12MB的L3快取記憶體，並且全面支援DDR3記憶體，最高可支援的記憶體總數，則是比前一代多出一倍，高達288GB記憶體。

受到製程技術提升的影響，我們還可看到另一個關鍵的改進，那就是耗電量。我們以Intel 45奈米製程的5500系列，與32奈米製程的5600系列的規格相比，就可看出新一代的製程技術帶來的節電效果。

去年製作伺服器採購特輯時，所測試的Xeon E5520處理器，與今年新一代的E5620相比，雖然兩個處理器的熱設計功耗（TDP）都是80瓦，且核心與執行緒數量如出一轍，但是E5620的時脈比E5520高出一些，而且如前面所說加強的技術，以及新增的功能，都讓相同熱功耗設計的處理器，呈現完全不同的效能。因此新的製程技術，讓處理器在相同的耗電量下，可達到更高的效能。

不過AMD今年仍使用45奈米製程，預計明年的Interlagos與Valencia將會使用32奈米製程。

以多核心及執行緒提升運算效能
觀察近來AMD處理器的發展，我們可以發現AMD與Intel的處理器，多工的處理方式不盡相同。例如，Intel發展的多執行緒架構（Hyper- Threading），在一顆處理器內擁有4核、或是最新的Xeon 5600系列的6核心，其中每個核心都有2個執行緒，也就是每顆處理器都有8個或12個執行緒；而AMD的Opteron則是朝實體核心數量發展，例如目前研發代號為Magny-Cours的6100系列處理器，就內建實體6核心，而針對1路伺服器的4100系列處理器，則內建有4個實體核心。而且，在下一代的Valencia與Magny-Cours，則讓核心數增加到6至8核心，以及8至12核心。

AMD不斷的在處理器內增加更多的核心，原因是它們認為實體核心的運算效能，會比使用虛擬的執行緒的運算效能更佳。

不過他們在2011年即將發表的Bulldozer架構處理器，在增加核心數的同時，還結合了2個實體核心，讓平行運算的過程中，可使用兩個實體核心共同運算，而且它們的L2與L3快取記憶體也是共享，讓平行運算架構可用兩個核心運算。

依照Intel的標準來看，包含2個核心的Bulldozer只能算是擁有雙執行緒的單核心處理器，例如內建16核心的Interlagos處理器，對Intel來說，就是8核心、16執行緒的處理器。

每個Bulldozer除了擁有2個核心所組成，可共同運算的雙執行緒模組之外，還因為每個核心都擁有由4條管線（Pipeline）所組成的整數運算單元，因此Bulldozer中，都有2個由4條管線所組成的整數運算單元，另外還有2個128位元，可合併為256位元的浮點運算單元。再加上共用的L2 快取記憶體，因此Bulldozer之中的每個整數運算單元會被當作一個物理核心，就如同Intel的超執行緒一般。

在Intel方面，雖然使用了超執行緒的技術，但是在實體核心數目的發展也沒有停下腳步，在去年推出新一代的Nehalem架構處理器，採用45奈米製程，並且依照單路、2路與4路伺服器等不同市場，分別推出3500、5500與7500系列處理器。

而在今年初，Intel又進一步推出新一代的3600與5600系列，採用32奈米的製程技術，將原本5500系列內建的核心數目，增加到6核心，執行緒也增加為24執行緒。

並且延續或增進上一代Nehalem系列中的多種規格與技術，例如5500系列支援記憶體總數為144GB，而Westmere的5600系列則增加一倍，達到288GB；另外還加大了L3快取記憶體，從8MB提升到12MB。而之前每個處理器中內建的Intel超執行緒（Hyper- Threading）與Turbo Boost超頻技術等，也是一樣都不少。

超執行緒技術，只要應用程式有支援，就可讓單一處理器核心使用類似虛擬化的方式，讓處理器同時執行多個平行運算工作。

另一個超頻技術Turbo Boost與超執行緒的平行運算不一樣的地方，在於Turbo Boost是針對無法同時運算的序列運算。它的加速運算方法，是降低4核心處理器之中的兩個核心時脈，也就是降低它們的電壓，將另外兩個核心電壓與時脈加高，藉由時脈速度的提高，加速序列運算的速度。而且在增加時脈的時候，Intel的處理器還會主動偵測目前電壓與時脈速度，並且評估是否可以讓時脈速度再往上提升，或是應減慢時脈以保護處理器。
藉由這種自動切換運算需求的超執行緒與Turbo Boost技術，Intel的目的就是讓處理器，變的更加聰明，會因應需求而切換功能。

2010年8月31日 星期二

2011 新一代 CPU及伺服器發展趨勢 (2)

2010年8月31日星期二