2010年8月31日 星期二

psad:建構埠掃描的即時監測系統

http://www.netadmin.com.tw/article_content.asp?sn=1008040015
文.吳惠麟

相信每個網管人員在例行的Log資訊檢查中,經常會發現有些不速之客不斷地試著要登入系統(暴力攻 擊法),或者利用埠掃描(Port Scan)的工具掃描系統。埠掃描不但使網管人員不勝其擾,而且埠掃描往往是駭客想要入侵的前兆,因此建構一套能夠即時偵測埠掃描並以電子郵件通知管理者 的偵測系統,對網管人員來說將有莫大的助益。
本文將結合開源碼的相關資源,實作出一套「埠掃描偵測系統」,所需的相關套件如下表所示。

作業系統掃描原理

在駭客決定攻擊目標後,第一個步驟往往是先行探測目標主機的作業系統。由於每一家作業系統對封包的處理方式均不同,探測軟體即可利用此種特性來辨識出不同的作業系統。

由於此種方式就像人類的指紋一樣,所以又稱為「作業系統指紋(OS Fingerprint)」辨識,作業系統探測方式可分為主動式及被動式,如下所述:

主動式
探測軟體透過傳送特別打造的TCP、UPD或ICMP封包至被探測主機端,再根據被探測主機回傳的封包特徵,來辨識出該主機的作業系統。此種工具以Nmap為代表,其官方網址為「http://nmap.org/」。

被動式
探測軟體並不主動傳送封包至被探測主機上,而是被動地監看往來封包,藉由往來封包的特徵來辨識出作業系統,此種探測軟體以P0f為代表。官方網址為 「http://lcamtuf.coredump.cx/p0f.shtml」。囿於篇幅,本文不多加探討此種探測技術,有興趣的讀者自行參閱相關說 明。

接下來,說明主動式作業系統的辨識原理。

FIN封包探測或XMAS封包探測
掃描軟體送出一個FIN封包(或任何未設置ACK或SYN標記位元的資料包)至欲被探測的主機上,在正常的TCP/IP規範(RFC793)中,對於此類 封包不予理會,但在某些作業系統(如Windows系統、Cisco等)上,將會回應一個Reset(RST)封包。掃描軟體即可利用此種特徵來辨識出作 業系統。由於此種封包在封包表頭上的長相就像一顆聖誕樹一樣,所以又稱為XMAS(聖誕節)的封包探測。

Bogus(偽造)封包探測
掃描軟體在SYN封包的表頭上(Header)設置一個未定義的tcp旗標(Flag)值,正常的TCP/IP規範規定對於此類封包是不予理會的,但在某 些作業系統中當遇到此類封包(SYN+ Bogus)時,將會回應Reset封包來重置連線。掃描軟體即可利用此種特徵來辨識出作業系統。

以TCP Initial Windows探測
TCP Initial Windows(TCP初始化訊窗)是一種控制網路流量的機制。在傳送的過程中,如果已傳送了訊窗大小的封包,即表示須接收到對方的ack回應後,才能繼 續傳送,但在某些作業軟體上,訊窗的長度是固定的,所以掃描軟體可利用此種特徵來辨識出作業系統。

ICMP TOS(Type Of Service)判別
ICMP全名為Internet Control Message Protocol,中文叫「網際網路訊息控制協定」。ICMP基本上是一個錯誤偵測與回報的機制,通常是用來檢驗網路的連線狀態與連線的正確性。常用的ICMP類型說明如右上表所示。

ICMP封包除了可用來確認主機的狀態外,也可利用探測作業系統的種類,探測程式可利用ping程式送出一個icmp echo的請求至要探測的主機上,再由對方主機回應的echo reply封包中的TTL(Time To Live)的欄位值。不同作業系統對於TTL欄位值的設定都不一樣,用來初步判斷主機的作業系統。有興趣的讀者可利用ping指令來觀察Linux系統及 Windows系統回傳封包的TTL欄位:

執行指令「ping <受測主機>」來測試其回應值,即可發現兩種作業系統所回應封包中的TTL值明顯不同。掃描軟體即可利用此種特徵來初步區分作業系統的種類。下圖所示為Linux與Windows作業系統的測試畫面。

▲Windows系統測試畫面。

▲Linux系統測試畫面。

從圖中可以明顯看出不同的作業系統會設定不同的TTL值,探測軟體即可利用此種特性來初步判別作業系統的種類。

另外一種探測方式是利用管理者不當的設定系統組態而造成的作業系統資訊外洩。利用指令「telnet 」即可能獲知作業系統的資訊,如下圖即可得知該主機的作業系統。

另外,也可利用現成的工具來探測主機的作業系統,例如使用「nmap -O 」來偵測主機的作業系統,如下圖所示。

(更多精采文章詳見網管人第55期)

2011 新一代 CPU及伺服器發展趨勢 (5)

http://www.ithome.com.tw/itadm/article.php?c=63039&s=5

加強伺服器應用的硬體設計 伺服器的發展,從各種不同應用與需求環境來看,都已經越來越成熟,而現在大家也開始將伺服器的選擇考量,從原本只注意的效能、穩定度與安全性,到現在也開始注意耗電量,是否符合使用需求,以及硬體是否完整發揮效益等各種不同考量。

記憶體
記憶體的容量,也是隨著處理器的發展而進展,例如去年Intel Xeon 5500系列系列最大可支援18 DIMM記憶體插槽,而最大記憶體為144GB,也就是單條DDR3記憶體最大為8GB,而今年發佈的5600系列處理器,最高記憶體可支援288GB, 單條記憶體為16GB,可看出記憶體的發展與處理器是相輔相成的。

網路卡
一般伺服器都內建有GbE等級網路埠,並且搭配整合式網路晶片。不過在資料中心,以及虛擬化等環境,便需要支援更高速的網路介面,以應付大量的資料傳輸。

目前內建的網路介面卡,一般都是10/100 Ethernet,另外還可選擇10 GbE的網路介面卡,加強網路的傳輸速度。加上目前處理器都支援的虛擬化直接存取技術,更讓10 GbE網路卡的傳輸優勢更能發揮。

一般會搭配10GbE的網路卡,都是儲存設備、資料中心或是虛擬化環境等。

資料備份與保護
伺服器的硬碟,依照大小區分,可分為2.5吋與3.5吋兩種,依介面來分則可分為SAS與SATA兩種。一般而言,單顆硬碟相比,3.5吋硬碟容量會比 2.5吋硬碟還要大,但是在相同的機身面板上,可安裝較臺2.5吋硬碟,因此有較多的磁碟陣列方式可選。一般伺服器都有內建可做到RAID 0與RAID 1,適合沒有太多硬碟配置需求的環境使用,另外有許多可選購的磁碟陣列卡,可達到RAID 0/1/5/6/10/50與60等磁碟陣列模式,另外還有些可做到非磁碟陣列模式,也就是每臺硬碟都是獨立的,這是磁碟容量最高的配置,但是卻是資料保 護性最低的。

資料的保護,除了使用磁碟陣列保護既存的資料之外,未存入硬碟的資料也非常重要,因此有些伺服器另外在磁碟陣列卡上加裝記憶體,加大暫存空間的容量,而 且,還加裝一顆電池,提供這張記憶體暫存資料時所需的電力。這樣的組合在伺服器產生問題,例如斷電,或是突然的當機時,可提供磁碟陣列卡記憶體內部的暫存 資料,直到系統回復運作時,可再將這些資料寫入硬碟內。

在傳輸的速度上,SAS會比SATA快,但是近幾年,有一種新型態的儲存裝置可以提供更高速的吞吐能力:固態硬碟(Solid State Drive,SSD)。這種新型態的磁碟,沒有以往傳統硬碟的物理機件,也就是沒有馬達,或是讀寫頭等構造,因此在資料的讀取速度上比傳統硬碟快許多。

固態硬碟對於大量資料讀寫需求的資料庫,可以提供比以往硬碟更高的效率,因此很適合證券或銀行等,有大量卻瑣碎的資料讀寫頻繁的環境。

1+1備援電源供應器新中黑標題
伺服器的運作,一般都是處於長時間運作的狀態,也就是機箱內所有元件都必須能禁得起長期運作的標準,而伺服器內部,運作時溫度最高的除了處理器、硬碟與記憶等元件之外,電源供應器也是必須注意散熱的元件之一。

電源供應器肩負著電壓轉換與穩定電壓的工作,在電力轉換的過程便會產生熱能,因此一般伺服器內的電源供應器,都有獨立的散熱風扇強制冷卻。不過電源供應器 也會有發生故障的狀況,因此便有可1+1備援的電源供應器。這種電源供應器最大的特色,就是可在不停機的狀態下,直接抽出2臺電源供應器之中的其中一臺, 而未卸除的那臺將會持續供應伺服器用電。因此許多機架式伺服器都採用這類設計,確保伺服器可以持續的運作,不過直立式伺服器或工作站,由於機箱的設計與個 人電腦相當,因此一般都還是採用固定式的電源供應器。

熱抽換風扇新中黑標題
要讓長時間運作的伺服器不因溫度太高而產生當機的狀態,就需要風扇來冷卻,不過風扇也有可能在長時間的運作下而故障,因此支援熱抽換的風扇設計也出現在伺服器內部。

雖然僅是強制伺服器機箱內部空氣流動的風扇,但其實這些風扇還連接著許多感應器,可隨溫度調整風扇轉速,或是當機箱開啟時,便會強制高速運轉。

另外,當其中一個風扇故障,停止運轉時,有些伺服器在前方的資訊面板上就會顯示警示燈號,且其他風扇也會提高轉速彌補停止運作的部分。不過,與熱抽換的電源供應器一樣,這類型設計目前僅出現在機架式伺服器上,直立式伺服器或工作站並沒有這類型設計。

CIO 強化伺服器效能與穩定性的配件

記憶體 記憶體的插槽數量,雖然受限於處理器的支援程度,但是在另一方面,也會因為主機板大小,或是機箱空間不同,而有所限制。


磁碟陣列卡記憶體 許多廠商在磁碟陣列卡上,都可加裝記憶體與記憶體專用的電池,在系統發生狀況時,可將未寫入硬碟的資料暫存在記憶體中,並由電池提供電力保存資料。一般這類記憶體大小為256MB與512MB。


1+1備援電源供應器 可以1+1備援的電源供應器,主要的目的就是確保伺服器可以長時間運作,不會因為電源供應器故障而發生強迫關機的情況,不過目前僅見於機架式伺服器,一般直立式伺服器或工作站並沒有這種設計。


熱抽換風扇 許多機架式伺服器內部的風扇,都是可熱抽換的,而且還與許多感應器連結,可在不同狀態下調整風扇轉速。不過,直立式伺服器並沒有這樣的設計。

2011 新一代 CPU及伺服器發展趨勢 (4)

http://www.ithome.com.tw/itadm/article.php?c=63039&s=4

新一代主流伺服器類型與技術一覽 伺服器的發展,除了因為各種不同應用與使用環境,而發展出各種不同硬體規格之外,也會因為處理器的變革而隨之改變,例如,Dell與HP的伺服器產品型號,就會隨著每一個新世代的處理器面市,而有所改變。

新一代主流伺服器
伺服器廠商隨著Intel Nehalem Westmere與AMD Opteron Magny-Cours推出,也隨之發表新款伺服器。例如Dell的PowerEdge系列在去年Nehalem 5500系列處理器推出時,Intel平臺的產品就進入10G(第10代)系列。而今年初,他們也因應Nehalem Westmere的更新,而推出了11G的產品。而HP在AMD平臺的產品,也隨著Magny-Cours的6100系列處理器,推出了G7(第七代)的 產品,因此可以看出處理器的更新,也促使伺服器的推陳出新。


採用Nehalem 5500系列的伺服器,最多可支援18組記憶體插槽,容量達144GB,適合用於虛擬化環境。

目前,Intel平臺的伺服器在銷售上,可說是遙遙領先AMD平臺的伺服器數量。若從伺服器廠商的產品線來看,也能看出兩家處理器廠商在市場上的銷售情況。

大多數的廠商都有AMD平臺的伺服器產品,但是從產品數量來看,即可知道AMD平臺少於Intel平臺的產品數量。例如,HP採用 AMD平臺的機架式伺服器系列,目前僅有DL 165、DL 385與DL 585等3個系列產品,而且隨著AMD平臺的更新,這3個系列還分別有G5、G6與最新的G7等3種規格,與Intel平臺伺服器的數量相比,明顯較少。 而且在直立式伺服器產品線,不論是Dell或是HP,都是使用Intel平臺的處理器。

這樣的現象,在我們與廠商聯繫以及產品借測的過程中即可得到證實。以往我們在產品借測的過程,或是製作採購特輯的,Intel平臺伺服器的數量就比AMD平臺伺服器多,甚至指定借測AMD平臺的產品時,伺服器廠商也時常無法提供測試設備。

依應用而發展出不同取向的伺服器
伺服器的規格,隨著各種不同需求而有不同的設計取向,例如近來受到重視的虛擬化伺服器,因為在單一實體伺服器內安裝多臺虛擬伺服器,因此需要大量的記憶 體,所以一般以虛擬化為目的的伺服器,主機板上記憶體插槽數量,也都會以處理器可支援的最多插槽數為主,而且有些廠商為了加裝虛擬化管理系統,在主機板上 還會設計記憶卡或USB插槽。因此這類伺服器在主機板規格的設計上,便與一般伺服器規格有所差異。

工作站與網站建置
依照Intel處理器產品線的分類,Xeon 3000系列(3400/3500)系列處理器鎖定的伺服器種類,是僅能安裝一顆處理器的1路伺服器,而AMD的Lisbon 4100系列處理器,也是針對1路與2路伺服器所設計的處理器。


使用Xeon 3400系列處理器的單路伺服器,適合網站建置,直立式伺服器還可加裝繪圖卡當工作站使用。

在市面上使用1路架構的的伺服器,一般常見於1U機架式與直立式伺服器。

1路機架式伺服器很適合用於網站建置,因為網站應用程式一般都沒有太高的運算需求,而且網路流量如果增加,因為1U的體積較小,需要增加應用服務,或是擴充時,都可將伺服器堆疊起來,快速架設、部署。

而直立式伺服器,通常都習慣稱為工作站。這類伺服器與一般網站、資料庫或是虛擬化等伺服器應用不同的地方,在於它所提供的是高速的繪圖運算,而不是處理器 的高效能運算。因此可加裝繪圖卡便是這類伺服器的首要考量。因此這類型設備的機身大小一般都無法壓縮至1U或2U的高度,至少都有4U或5U的高度,也因 此這類型設備許多都改用直立式設計,看起來與一般個人電腦主機差不多。

另一方面,由於繪圖卡(GPU)的運算能力,尤其是浮點運算的速度越來越快,除了可以高速繪圖運算之外,也可提供系統額外的運算效能。使用繪圖卡加強運算 的應用,目前已經有所謂的通用運算型GPU(General Purpose Graphics Processing Unit,GPGPU)架構出現,這類型應用就是將一般運算工作,轉換為GPU的計算方式,藉由繪圖晶片內大量的運算核心協助計算,借此提高整體的運算效 能。

而且目前市面上,許多繪圖卡也都可串接,藉由兩張繪圖卡協同運算提高系統的繪圖能力,這樣的應用同樣可套用在GPGPU的架構之中,因此加裝1張或是多張 繪圖卡的系統,只要軟體支援,他們的運算效能便會提升許多。繪圖卡的擴充方式都是透過PCI-E介面加裝,只要空間許可,便可加裝更多的繪圖卡。

資料庫與虛擬化
資料庫伺服器在使用上,由於需要高速的運算,並且會使用大量的暫存資訊,因此處理器的快取記憶體便十分受到重視,而每顆處理器內建的快取記憶體又十分有 限,因此採用多路伺服器的架構,就會是資料庫伺服器的絕佳選擇。例如Intel Xeon 2路的5600系列與4路的7500系列處理器,或是AMD的同時支援2路與4路的Opteron 6100系列,都很適合這類伺服器的應用。

另外,由於儲存重要資料的資料庫需要備份,以防硬碟損壞,或是資料的遺失,因此磁碟陣列也是這類型伺服器的基本配備。

因此針對資料庫應用的伺服器在外觀上,與其他伺服器最大的差別,在於硬碟的數量明顯多於其他種類伺服器。一般而言,1U尺寸的伺服器,最多可安裝4臺 3.5吋SATA或是SAS硬碟,若搭配的是2.5吋硬碟,最多可安裝8臺硬碟。隨著機身尺寸增加,可安裝的硬碟數量也隨之增加,有的甚至將光碟機的空間 取消,以便多放一臺硬碟。

由於這類型伺服器的硬碟數量非常多,而且目的是資料的備份與保護,因此這類型伺服器一般都會內建磁碟陣列卡,或是另外加裝可以提供較多磁碟陣列模式的磁碟陣列卡。

在虛擬化伺服器環境需求上,主要考量就是需要大量記憶體,提供多臺虛擬環境使用,因此這類處理器可支援的記憶體容量非常驚人。例如Intel Xeon 5500系列處理器,就支援一臺2路伺服器最高144GB的記憶體,而5600系列則將記憶體總數提升一倍,達到288GB。而AMD Opteron所支援的記憶體,每顆處理器可支援最多12 DIMM,而2路即可裝24 DIMM,記憶體的擴充性非常明顯。

而且,以往虛擬機器在存取實體環境如網路資訊時,須透過很多層的傳輸,例如虛擬環境的驅動程式、VMM(Virtual Machine Manager),以及虛擬設備模擬器(Virtual Device Emulation)等,才能讓虛擬環境可讀取,或傳送到實體環境的設備中,這對於大量資料傳輸的伺服器來說,都會耗費不少效能在這過程,因此透過處理器 對虛擬環境的直接存取支援便能節省不少效能。

新一代的伺服器處理器,都有支援虛擬環境直接存取實體環境裝置的設計,例如Intel的VT與AMD的AMD-V技術,都是為了讓虛擬環境可以直接存取實體設備,減少效能的耗費,加強虛擬化的整體效能。

高密度運算
以往的高密度運算環境,大家最熟悉的可能就是刀鋒伺服器,不過刀鋒伺服器售價不僅不便宜,而且許多情況並不一定需要如此多的伺服器架構,因此近年也有許多廠商在1U機身內容納2臺,或是在2U機身內置入4臺伺服器,在單一機箱中容納更多實體伺服器。

一般高密度運算的伺服器都使用1路或2路架構,而且還有個很重要的目的,就是降低耗電量並且節省空間。

這類伺服器有一些共同特色,例如共用的電源供應器與散熱風扇,而且記憶體插槽數量與容量都不多。由於這類型伺服器的特色,就是在原本單一伺服器的機箱內容 納更多臺實體伺服器,因此每臺伺服器可用的機身空間有限,可安裝的記憶體與擴充介面等都有限,因此這類伺服器的PCI-E與USB等擴充介面都很少。

另外,這類伺服器也很適合用於虛擬化環境,由於這種密集的機箱設計,雖然擴充機能受限,但是記憶體插槽卻可使用更緊湊的排列,而無損最高記憶體容量,而且 共用的電源供應器與散熱模組,對強調節能,且集中管理的大量伺服器環境來說,除了虛擬化之外,使用高密度設備也是節省耗電量與空間的方法之一。

目前在市面上,還有另一種高密度伺服器的設計,在空間的使用率上更為緊湊,例如Dell XS11-VX8專用伺服器,它與一般高密度伺服器不一樣的地方,在於2U的機箱內可容納12臺伺服器模組,每個模組都擁有1臺硬碟、一個記憶體插槽與一 顆處理器,另外還有2個網路埠,因此功能也是相當完整。由於這類型伺服器的運算效能不是很高,因此是針對網站應用環境所設計,而如此高密度,且大量的伺服 器,主要是給主機代管業者所使用。

由此,我們可以看出高密度伺服器的應用範圍十分廣泛,不論是虛擬化環境或是網站架設等,都可使用高密度伺服器建置。

CIO 3種高密度伺服器機箱
隨著虛擬化應用越來越普及,伺服器透過這種方式整併,已是大勢所趨。另外還有一種可將多臺伺服器整合在同一個機箱內的做法,就是利用高密度伺服器,這類型 設備較早出現的便是刀鋒伺服器,近年還有多主機板與今年Dell推出的機房專用伺服器。高密度與虛擬化的目的相似,企圖節省多臺實體伺服器所占用的空間, 同時還可降低耗電量。


特製型多主機板伺服器 Dell XS11-VX8


一般型多主機板伺服器 Dell PowerEdge C6100


刀鋒伺服器 Dell PowerEdge M1100(機箱)+M710(刀鋒伺服器)

2011 新一代 CPU及伺服器發展趨勢 (3)

http://www.ithome.com.tw/itadm/article.php?c=63039&s=3

直接溝通架構(Direct Connect Architecture)
在AMD的Istanbul架構中,多路伺服器之間的連結,是採用AMD的直接溝通架構1.0,可讓處理器之間直接溝通,且可以降低記憶體與處理器的 I/O延遲,並加速這些元件之間的傳輸速度。不過以4路處理器來看,採用1.0的直接溝通架構時,每顆處理器都只能與相連的另外2個處理器做溝通。因此, 今年AMD更新的直接溝通架構2.0,讓所有處理器之間都可做溝通,也就是說,4路伺服器內部的每顆處理器,都可與另外3個處理器直接做溝通。而 且,1.0的直接溝通架構最多僅能支援6核心處理器,而2.0則可支援到16核心。

而且,新一代的直接溝通架構還加強了處理器之間的傳輸速度,從原本的,4.8GT/s增進到6.4GT/s;在記憶體方面,每顆處理器可支援的記憶體插槽 數量,從1.0的8 DIMM增加到12 DIMM,並且首度支援了DDR3記憶體,同時支援UDIMM與RDIMM,在記憶體搭配的選擇上更豐富。

在多路伺服器的架構上,Intel的7500系列處理器擴展性也有改善,從可以2顆處理器串接,共用32組記憶體插槽,組成一個2路模組,並且可持續擴展處理器數量到最多256顆7500系列處理器。這樣的擴充模式可透過多顆處理器來分擔運算負荷,加速整體運算效能。


新增指令集
指令集,就是將原本需要透過多行軟體指令解碼的動作,改由硬體解碼。而AMD的Interlagos所採用的Bulldozer架構,將會相容於目前 Intel處理器已經支援的指令集,例如SSE4.1、SSE4.2、AES與CLMUL等,而且也把SSE5的指令集內建在其中,不過他們將這個指令集 拆為XOP、FMA4與CVT16等3個指令集,並且相容於Intel的AVX指令集。

在Intel方面,Xeon系列全部處理器都支援MMX、SSE、SSE2等指令集,以及Intel進階加密標準新指令(AES-NI),這個指令集之中 包含7種新的指令,加速資料的加密與解密,讓資料在存入時就以加密的形式儲存,確保資料的安全性。另外,在下一代的Sandy Bridge系列中,還會新增針對密集浮點運算所制定的指令集:先進向量擴充指令集(AVX)。

由以上這些功能,我們可以看出,結合超執行緒與Turbo Boost超頻的技術,讓Intel處理器在面對不同的運算資料時,都可切換適當的模式,加速這些序列運算,或是平行運算等不同運算模式。另外,在加上越 來越多的指令集內建在其中,讓許多常見的運算功能都能夠透過指令集運算,讓處理器核心不用花費太多時間在瑣碎的運算中。



越來越聰明,與計算能力越來越強的處理器

將來的處理器,勢必在效能上會越來越強,問題在於,AMD與Intel要如何達到這樣的目標?

目前,我們可以看出AMD持續的朝實體核心的數目發展,因為他們認為實體核心的運算效能,比虛擬化的執行緒更佳,因此在處理器的發展上,持續增加實體核心 數量,並且加強多路伺服器處理器之間的溝通,讓處理器在各自擁有多核心的同時,還可共享資源,讓多處理器架構的系統在運作效能上,就像是一個擁有數十個核 心的處理器一般。

另外,在個人端的處理器,他們也開始結合繪圖晶片驚人的平行運算效能,將平行運算的內容傳送給繪圖晶片(GPU),並透過可程式控制GPU內部的多個平行 運算核心及記憶體,用來處理非圖形的平行運算,所組成的新組態:通用型GPU(General Purpose GPU,GPGPU),讓原本針對圖形運算的繪圖晶片開始分擔處理器的運算,甚至更進一步的把繪圖晶片整合在處理器內部,變成Accelerated Processing Unit(APU),也就是說,將來的APU內部,將包含一個運算核心、一個可程式化向量運算引擎、記憶體控制器、I/O控制器、視訊解碼器以及匯流排介 面等多種功能與控制器。

雖然,目前這樣的處理器僅出現在個人端,不過我們可以預見伺服器的處理器也將會整合這樣的設計,針對不同的運算內容,使用針對純量的運算核心,或是使用向量的繪圖核心作不同的運算,藉此提高整體的運算效能。

而Intel方面,將持續發展超執行緒與Turbo Boost,兩種針對平行運算與序列運算的技術。

雖然兩家處理器廠商的目的都是相同的,那就是提供更高的運算速度與效能,但是Intel發展的方向與AMD卻不大一樣,因為他們的方式,是讓處理器能自動選擇與切換運算模式。

以當前Intel的Xeon處理器而言,內建了針對序列運算而提升時脈速度的Turbo Boost,以及平行運算的超執行緒技術,讓Intel的處理器在面對各種資料類型時,都能切換運算模式,加速各種運算的速度,讓系統的效能提升。另外, 日益增進的製程技術加上省電技術,讓處理器可減少耗電量,或是在相同耗電量提供更佳的運算效能。

就像今年Intel推出的32奈米Xeon Westmere 5600系列處理器,除了部分產品核心增加為6核心之外,其他同系列處理器雖然核心與執行緒的數量,與前一代的Xeon 5500系列一樣,維持在4核心8執行緒,但是時脈速度略微提高,讓處理器在相同的耗電量之下,擁有更高的運算速度。

2011 新一代 CPU及伺服器發展趨勢 (2)

http://www.ithome.com.tw/itadm/article.php?c=63039&s=2

2011 x64處理器技術發展趨勢
處理器技術的進展已成為當代個人電腦與伺服器發展的重大關鍵,隨著x64架構、多核心處理器的普及,以及製程的持續改良,以伺服器平臺的選擇來說,不論從效能、省電、價格等觀點來採購時,都比過去有更多的選擇。

提升製程技術,選擇更多
2009年時,AMD在單路、2路與4路伺服器市場上,發布了代號為的Suzuka與Istanbul Opteron處理器。其中,Suzuka是針對1路,而Istanbul則是針對2路與4路伺服器。

Istanbul是從上一代的Shanghai改進而來,最主要差異在於從4核心增加為6核心;處理器型號從2路的2300改為2400,4路的8300 改為8400。在其他方面,它們都同樣採用45奈米製程,平均處理器功耗(ACP)同樣使用Socket F(1207腳位)插槽,L3快取記憶一樣是每個核心6MB,並且延續了處理器直接連結架構(Direct Connect Architecture)。

而針對單路伺服器,型號為1300的Suzuka處理器,與Istanbul同樣是45奈米製程、內建6MB的L3快取記憶體與75瓦ACP,不過核心數只有4核心,且使用Socket AM2+的處理器插槽。

而目前AMD最新的伺服器處理器,將原本Suzuka與Istanbul改為Lisbon的4100系列,以及Magny-Cours的6100系列處理器。

Lisbon是針對1路與2路伺服器所推出的處理器,與前一代的Suzuka及Istanbul一樣,都是45奈米製程,不過核心數可分為4核心與6核心 兩種,每核心內建6MB L3快取記憶體,支援雙通道的UDIMM與RDIMM DDR3記憶體,Socket改為新的C32處理器插槽。而Magny-Cours則是內建8核或12核心,針對2路與4路伺服器的處理器,除了擁有大量 的核心數目之外,這系列處理器還支援目前最多的記憶體4通道,並改用G34處理器插槽。

在2011年,AMD將推出下一代新處理器,代號分別是12核與16核的Interlagos,以及6核與8核心的Valencia。這兩個系列都採用 AMD新的Bulldozer架構,透過執行緒的增加,強化處理器運算速度,且L3快取記憶體增加為12MB,且Interlagos將延續使用與 Magny-Cours相同的主機板平臺:Maranello;而Valencia則與Lisbon同樣採用San Marino的主機板平臺。

從Istanbul到Magny-Cours的變化,我們可以看出處理器的核心數目增加之外,製程技術也不斷加強,從45奈米提升到32奈米,而且在下一代的處理器中,還採用新的Bulldozer架構,在AMD的處理器中,首次加入了多執行緒強化處理器運算速度。

而Intel在今年初發布了採用32奈米製程,名為Westmere系列的處理器,同樣承襲Nehalem的主要架構。

由於製程技術的提升,讓相同大小的晶片內可置入更多的處理器核心,因此Westmere系列中,就有6核心的處理器,例如Xeon W3680、E5650與X5680等。而且這系列處理器內建的快取記憶體,比前一代Nehalem內建的8MB L3還多,增加到12MB的L3快取記憶體,並且全面支援DDR3記憶體,最高可支援的記憶體總數,則是比前一代多出一倍,高達288GB記憶體。

受到製程技術提升的影響,我們還可看到另一個關鍵的改進,那就是耗電量。我們以Intel 45奈米製程的5500系列,與32奈米製程的5600系列的規格相比,就可看出新一代的製程技術帶來的節電效果。

去年製作伺服器採購特輯時,所測試的Xeon E5520處理器,與今年新一代的E5620相比,雖然兩個處理器的熱設計功耗(TDP)都是80瓦,且核心與執行緒數量如出一轍,但是E5620的時脈 比E5520高出一些,而且如前面所說加強的技術,以及新增的功能,都讓相同熱功耗設計的處理器,呈現完全不同的效能。因此新的製程技術,讓處理器在相同 的耗電量下,可達到更高的效能。

不過AMD今年仍使用45奈米製程,預計明年的Interlagos與Valencia將會使用32奈米製程。




以多核心及執行緒提升運算效能
觀察近來AMD處理器的發展,我們可以發現AMD與Intel的處理器,多工的處理方式不盡相同。例如,Intel發展的多執行緒架構(Hyper- Threading),在一顆處理器內擁有4核、或是最新的Xeon 5600系列的6核心,其中每個核心都有2個執行緒,也就是每顆處理器都有8個或12個執行緒;而AMD的Opteron則是朝實體核心數量發展,例如目 前研發代號為Magny-Cours的6100系列處理器,就內建實體6核心,而針對1路伺服器的4100系列處理器,則內建有4個實體核心。而且,在下 一代的Valencia與Magny-Cours,則讓核心數增加到6至8核心,以及8至12核心。

AMD不斷的在處理器內增加更多的核心,原因是它們認為實體核心的運算效能,會比使用虛擬的執行緒的運算效能更佳。

不過他們在2011年即將發表的Bulldozer架構處理器,在增加核心數的同時,還結合了2個實體核心,讓平行運算的過程中,可使用兩個實體核心共同運算,而且它們的L2與L3快取記憶體也是共享,讓平行運算架構可用兩個核心運算。

依照Intel的標準來看,包含2個核心的Bulldozer只能算是擁有雙執行緒的單核心處理器,例如內建16核心的Interlagos處理器,對Intel來說,就是8核心、16執行緒的處理器。

每個Bulldozer除了擁有2個核心所組成,可共同運算的雙執行緒模組之外,還因為每個核心都擁有由4條管線(Pipeline)所組成的整數運算單 元,因此Bulldozer中,都有2個由4條管線所組成的整數運算單元,另外還有2個128位元,可合併為256位元的浮點運算單元。再加上共用的L2 快取記憶體,因此Bulldozer之中的每個整數運算單元會被當作一個物理核心,就如同Intel的超執行緒一般。

在Intel方面,雖然使用了超執行緒的技術,但是在實體核心數目的發展也沒有停下腳步,在去年推出新一代的Nehalem架構處理器,採用45奈米製程,並且依照單路、2路與4路伺服器等不同市場,分別推出3500、5500與7500系列處理器。

而在今年初,Intel又進一步推出新一代的3600與5600系列,採用32奈米的製程技術,將原本5500系列內建的核心數目,增加到6核心,執行緒也增加為24執行緒。

並且延續或增進上一代Nehalem系列中的多種規格與技術,例如5500系列支援記憶體總數為144GB,而Westmere的5600系列則增加一 倍,達到288GB;另外還加大了L3快取記憶體,從8MB提升到12MB。而之前每個處理器中內建的Intel超執行緒(Hyper- Threading)與Turbo Boost超頻技術等,也是一樣都不少。

超執行緒技術,只要應用程式有支援,就可讓單一處理器核心使用類似虛擬化的方式,讓處理器同時執行多個平行運算工作。

另一個超頻技術Turbo Boost與超執行緒的平行運算不一樣的地方,在於Turbo Boost是針對無法同時運算的序列運算。它的加速運算方法,是降低4核心處理器之中的兩個核心時脈,也就是降低它們的電壓,將另外兩個核心電壓與時脈加 高,藉由時脈速度的提高,加速序列運算的速度。而且在增加時脈的時候,Intel的處理器還會主動偵測目前電壓與時脈速度,並且評估是否可以讓時脈速度再 往上提升,或是應減慢時脈以保護處理器。
藉由這種自動切換運算需求的超執行緒與Turbo Boost技術,Intel的目的就是讓處理器,變的更加聰明,會因應需求而切換功能。

2011 新一代 CPU及伺服器發展趨勢 (1)

http://www.ithome.com.tw/itadm/article.php?c=63039
文/林柏凱 2010-08-30

我們將回顧2009年以來,Intel和AMD兩家處理器廠商的技術發展,以及預告2011年新世代處理器部分規格,讓你了解處理器對伺服器發展的影響

Intel在今年第一季推出32奈米製程的Westmere系列Xeon處理器,而AMD也即將在明年推出32奈米製程的Interlagos與Valencia系列Opteron處理器。他們在改善製程的同時,除了增加核心數,也加入眾多改善處理器效能的規格。

我們將回顧2009年以來,兩家處理器廠商的技術發展,以及預告2011年新世代處理器部分規格,讓你了解處理器對伺服器發展的影響。


2011 x64處理器技術發展趨勢 (1)
x64架構處理器隨著製程技術,以及核心架構的改進,讓伺服器的整體效能也明顯提升,並針對不同的運算模式與應用環境,提供更多最佳化的運算與使用效能模式

2011 x64處理器技術發展趨勢(2)
指令集,就是將原本需要透過多行軟體指令解碼的動作,改由硬體解碼。而AMD的Interlagos所採用的Bulldozer架構,將會相容於目前Intel處理器已經支援的指令集

新一代主流伺服器類型與技術一覽
伺服器的發展隨著處理器演進而逐代改良,而處理器也針對不同的應用趨勢加強設計,例如支援更多的記憶體,或是讓虛擬環境直接存取實體設備等,讓各種類型伺服器越來越符合使用需求

加強伺服器應用的硬體設計
伺服器會隨著處理器發展而有所改進之外,也會因應各種使用環境,讓機構或是元件設計,因為特定的應用而有特殊的發展

Turbo Boost

http://www.ithome.com.tw/itadm/article.php?c=63039&s=2

Intel超頻技術Turbo Boost與超執行緒的平行運算不一樣的地方,在於Turbo Boost是針對無法同時運算的序列運算。它的加速運算方法,是降低4核心處理器之中的兩個核心時脈,也就是降低它們的電壓,將另外兩個核心電壓與時脈加 高,藉由時脈速度的提高,加速序列運算的速度。而且在增加時脈的時候,Intel的處理器還會主動偵測目前電壓與時脈速度,並且評估是否可以讓時脈速度再 往上提升,或是應減慢時脈以保護處理器。

藉由這種自動切換運算需求的超執行緒與Turbo Boost技術,Intel的目的就是讓處理器,變的更加聰明,會因應需求而切換功能。