SOGO論壇
  登入   註冊   找回密碼
查看: 2680|回覆: 5
列印 上一主題 下一主題

[好料分享] Intel Core核心微架構介紹 [複製連結]

論壇顧問

Q^心靈導師^Q

Rank: 14Rank: 14Rank: 14Rank: 14

顧問勳章 原創及親傳圖影片高手勳章 布布達人勳章

狀態︰ 離線
跳轉到指定樓層
1
發表於 2007-1-9 13:48:07 |只看該作者 |倒序瀏覽

Intel Core Microarchitecture(Intel核心微架構,以下簡稱ICM或Intel Core2架構),是延續過去英特爾以色列海法小組所設計的Pentium Pro(P6)、PentiumⅡ/Ⅲ以及Pentium M(Banias/Dothan)、Intel CoreDuo(Yonah)筆記型處理器的過去核心為基礎,全心開發出來的新一代核心架構。

Matt特別強調,很多人認為Intel Core2是拿過去Pentium Pro/PentiumⅡ/PentiumⅢ的P6舊核心所修改出來的,這是完全不正確的說法。Intel Core2(ICM)是全心設計的新一代核心架構,跟以往的P6核心截然不同。不光只是新興多媒體指令SSE2、SSE3(以及還沒完全揭露的SSE4/MNI)指令,像接下來要介紹的Wide Dynamic Execution(寬動態執行)、Intelligent Power Capability(智慧節源控制)以及Advanced Smart Cache(先進智慧型快取)、Advanced Memory Access(先進記憶體存取以及Advanced Digital Media Boost(先進數位媒體效能爆發)五大特性,就是以往P6核心甚至P4 NetBurst架構完全沒有的特點。

■Wide Dynamic Execution(寬動態執行引擎)

先從第一大特點:Wide Dynamic Execution談起。Intel Core2是雙核心(Dual Core)、每個CPU核心採14個管線階(14 stages pipeline)以及四線路解碼(4Way x86 decode)設計,採65nm製程雙核心整合設計。每個單一CPU核心電路內建四組x86指令解碼器,每週期可以擷取、解碼四道x86指令碼,並且進入指令暫存區等待分發到五組執行單元去執行與寫回。比起以往PentiumⅡ/Ⅲ、Pentium M(Banias/Dothan)、Core Duo(Yonah)的三線路x86解碼,每個週期解碼執行效能至少快上33%(4 vs 3)。

另外,Intel Core2 Duo也導入了微指令聚合(Micro-Fusion)以及巨指令聚合(Macro-Fusion)的功能。目前x86程式碼中,據分析大約有15%是條件判斷的分歧跳越指令碼。而Macro-Fusion具備將數值比較(Compare)、位元測試(Test)與分歧跳越指令合併成單一性質的"比較後跳越"的指令,因此Intel Core2雖然僅內建四組x86解碼器,但是在遇到有相鄰比較後跳越的指令碼時,可以多解碼一組指令,形成多出25%的解碼執行效率。

據Intel人員表示,以相同時脈的Core Duo(Yonah)以及Core2 Duo(Conroe/Merom)相比較,Wide Dynamic Execution以及Macro-fusion等功能,可以在SPECint_rate2000整數效能評估分數增加10%,SPECfp_rate2000浮點效能評估分數增加16%。


■Wide Dynamic Execution(寬動態執行引擎)

第二項特點:Intelligent Power Capability(智慧節能管理)

Intel Core2架構具備的Intel Intelligent Power Capability(智慧節能管理),由外到內,從製程、線路大體、線路細節,以致於最細微的電晶體四個項目都有所強化。首先在製程上,導入65nm奈米製程、Strained Silicon應變矽、Low K Dielectric低K介電質,並採用八道連接金屬層。

在線路大體上,採取較進步的時脈閘控制、增強型英特爾節能技術(Enhanced Intel SpeedStep Technology,EIST)。至於線路細節上,採取多組低電壓陣列電路設計(Low Vcc Array),以及各功能區塊電路以sleep transistor依需要動態開啟、關閉電源。到更細微的電晶體設計細節上,則採用低漏電設計的電晶體,輔以大量導入Sleep Transistor等設計。

Intel Core/Core2微架構的EIST(Enhanced Intel Speedstep Technology)增強型節電管理技術,增加了可將L2快取記憶體回存的Deeper Sleep Mode 的節電模式,同時可以依據每個核心的負載不同,各自做動態性的降頻、降工作電壓的方式來節省不必要的電能消耗。

Intel Core2同時將內部的128位元寬度匯流排採取兩段64bit分離式設計,當只居要擷取短指令時,可以只啟動一半(64bit)寬度的指令匯流排,並且只動用相關的解碼、執行單元,沒有動用到的則自動關閉,對外的外頻(FSB)以及終端電阻也是可以視需要來動態開啟與關閉,這種動態的半開半關已經到了出神入化的境界。

ICM也針對每個核心,設計了數位溫度感測器(Digital Thermal Sensor,DTS)、(Power StatusIndicator 2,PSI-2)以及平台環境控制介面(Platform Environment Control Interface,PECI),可以更精準的掌握每個核心的工作溫度,並回報給平台上的溫控電路,做必要散熱風扇的轉速調整、開啟或關閉。

Intel Core2架構具備的Intel Intelligent Power Capability(智慧節能管理),由外到內,從製程、線路大體、線路細節,以致於最細微的電晶體四個項目都有所強化。首先在製程上,導入65nm奈米製程、Strained Silicon應變矽、Low K Dielectric低K介電質,並採用八道連接金屬層。

在線路大體上,採取較進步的時脈閘控制、增強型英特爾節能技術(Enhanced Intel SpeedStep Technology,EIST)。至於線路細節上,採取多組低電壓陣列電路設計(Low Vcc Array),以及各功能區塊電路以sleep transistor依需要動態開啟、關閉電源。到更細微的電晶體設計細節上,則採用低漏電設計的電晶體,輔以大量導入Sleep Transistor等設計。

Intel Core/Core2微架構的EIST(Enhanced Intel Speedstep Technology)增強型節電管理技術,增加了可將L2快取記憶體回存的Deeper Sleep Mode 的節電模式,同時可以依據每個核心的負載不同,各自做動態性的降頻、降工作電壓的方式來節省不必要的電能消耗。

Intel Core2同時將內部的128位元寬度匯流排採取兩段64bit分離式設計,當只居要擷取短指令時,可以只啟動一半(64bit)寬度的指令匯流排,並且只動用相關的解碼、執行單元,沒有動用到的則自動關閉,對外的外頻(FSB)以及終端電阻也是可以視需要來動態開啟與關閉,這種動態的半開半關已經到了出神入化的境界。

ICM也針對每個核心,設計了數位溫度感測器(Digital Thermal Sensor,DTS)、(Power StatusIndicator 2,PSI-2)以及平台環境控制介面(Platform Environment Control Interface,PECI),可以更精準的掌握每個核心的工作溫度,並回報給平台上的溫控電路,做必要散熱風扇的轉速調整、開啟或關閉。

Intel Core2 Duo架構採取跟上一代Intel Core Duo(Yonah)相同的雙核心共享第二階快取記憶體的電路機制。Core2 Duo採取兩個CPU核心共享的超大型4MB Shared L2 Cache的設計(部份系列為2MB Shared L2),比Yonah增加一倍。兩個核心共享一組L2 Cache,某個CPU核心的資料另一組CPU核心要調用時,直接從L2快取記憶體調用,增加快取運用的效率並減少不必要的記憶體匯流排讀寫週期,提升記憶體頻寬。

Matt還特別強調一點,要降低記憶體的存取延遲,內建記憶體控制器(暗指敵手AMD的K8架構)並非唯一的解決之道。事實上較大且共享的L2快取記憶體設計,減少的記憶體延遲效果遠比內建記憶體控制器的CPU效果還要好。當然這是英特爾他們官方的說法,實際如何,當然得要等到拿到實品來測試,才能見真章。

據Intel人員表示,以相同時脈的Core Duo(Yonah)以及Core2 Duo(Conroe/Merom)相比較,Advanced Smart Cache的設計,可以在SPECint_rate2000整數效能評估分數增加約7%,SPECfp_rate2000浮點效能評估分數增加9%。

■Smart Memory Access(智慧記憶體存取)

第四個特點:Smart Memory Access(智慧記憶體存取)。由建構更多資料預擷取器,以及新導入的Memory Disambiguation(記憶體相依性消除機制)所組成。

Intel Core2 Duo/Extreme Edition處理器內,一共有八組資料預擷取器(Data prefetcher)的設計,每個核心分別有四組(內建一組指令擷取、一組共享L2快取擷取以及兩組記憶體擷取)。每個CPU核心可以在從記憶體載入L1/L2快取的行為模式中,累積並學習,逐漸的縮短甚至到最佳化的低延遲時序,形成最短路徑�最佳化低延遲的的相鄰記憶體區域性資料的擷取特性,盡量減少無謂資料反覆從記憶體載入快取記憶體的時間以及更新上的延遲。

而另一項稱之為Memory Disambiguation(記憶體相依性消除機制) 、則是Intel Core2首度導入的新功能。過去記憶體匯流排設計上,目前執行的記憶體載入指令,必須先等待、確認前面記憶體運算完成、數值寫回之後才能接著執行,這樣避免使用到相同的記憶體位置、維持記憶體資料一致性所設計,非常沒有效率。

Memory Disambiguation記憶體相依性消除化機制,可判斷記憶體回存資料時,先預測後繼的載入指令是否採用相同的記憶體位址;如果不是就可立即執行載入動作,毋需等待該指令執行完畢回存後才動作,這種相依性消除�優化機制可以縮短記憶體存取的延遲,提升超序執行CPU核心的執行效率。

據Intel人員表示,以相同時脈的Core Duo(Yonah)以及Core2 Duo(Conroe/Merom)相比較,Smart Memory Access功能可以在SPECint_rate2000整數效能評估分數增加約4%,SPECfp_rate2000浮點效能評估分數增加5%。

事實上,英特爾正以Memory Disambiguation機制為基礎,逐漸朝建構下一代多核心、多線續處理器所需要的交易式記憶體架構(Transactional Memory)方向邁進。交易式記憶體架構概念上,以對記憶體的一個記憶位置的存取視作一個區間的交易動作,記憶體將實作自我檢查相依性讀寫檢查電路,自動在各個線緒存取相依性記憶體變數時,直接就在硬體層次做同步的動作。在多核心�多線緒軟體設計上,可以大幅簡化每個線緒必須預先挑出可能會有衝突的變數、區域鎖定與解鎖的額外工作,程式的撰寫以及除錯將會向單線緒一樣容易。

■Advanced Digital Media Boost(數位多媒體效能強化)

第五項特點:Advanced Digital Media Boost(數位多媒體效能強化)

在許多效能測試中,我們發現過去Pentium M(Banias/Dothan)與雙核心Yonah處理器的CPU核心,整數效能超越同時脈Pentium4(Netburst)架構甚多,但是卻在運算SSE/SSE2/SSE3等指令運算效能上輸給高時脈的Pentium4(NetBurst),使得一般人誤以為高時脈�高管線化架構是比較利於多媒體以及影像運算,也因此在多媒體影音解碼為主的工作需求上,依然推薦較高時脈的Pentium4或Pentium D/Extreme Edition。
  
事實上,這是因為起初PentiumⅢ以致於Pentium M(Banias/Dothan)、Core Duo(Yonah)核心都只設計一組64位元SSE運算電路,因此要進行一道標準128bit SIMD的SSE/SSE2/SSE3指令運算時,事實上需要兩個機器週期時間。而Intel Core2 Duo/Extreme Edition開始,每個單一CPU核心首度實作128位元寬度的SSE運算電路,因此在執行SSE/SSE2/SSE3多媒體指令時,僅須一個機器週期即可執行完畢,效能可以倍增。

據Intel表示,以相同時脈的Core Duo(Yonah)以及Core2 Duo(Conroe/Merom)相比較,Advanced Digital Media Boost功能可在SPECint_rate2000整數效能評估分數增加約1%,SPECfp_rate2000浮點效能評估分數增加2%。此處效能提升較不明顯,在針對SSE2/SSE3指令集最佳化的顯示卡驅動程式、遊戲軟體以及影像處理軟體上,表現的會比較明顯。

■四核心Kentsfield工程原形機整裝待命
 
在效能介紹與QA問答第一場快結束時,主講人員告知一部放在會場的電腦機台,裡面是採用四核心Kentsfield處理器。Kentsfield是由兩顆雙核心Conroe(Core2 Duo)晶片,以MCM封裝成一個四核心的實體晶片,同時他也在持續開機的情況下打開電腦機殼,讓在場的媒體去碰觸其散熱片,來感受一下四核心Kentsfield處理器究竟熱不熱情。

我們碰觸的情況覺得溫溫的,並不會太熱,個人的經驗甚至比目前Pentium D、Pentium ExtremeEdition 9xx系列還要涼一點。如果以單顆Conroe的設計功率(TDP)僅65W來看,兩顆Conroe晶粒MCM封裝起來的四核心Kentsfield,了不起設計功率僅130W;如果再搭配一些動態關閉非負載核心的電路,也許可以壓低到115W甚至100W也不無可能。

實際上,早在今年三月7日美國IDF舉辦時,主題演講現場就有展示一部四核心Kentsfield處理器的初期工程機器,這部四核心的高效能遊戲平台,在執行遊戲的畫面場景切換十分順暢,而Intel今天展示四核心的Kentsfield處理器�電腦平台,正代表著英特爾下一章四核心也王牌在手,隨時準備伺機而動,最快將在2007年第一季登場。

■Performance/Watt的新概念

在接下耗能的研討會中,其實講的不外乎是英特爾強調效能�瓦(Performance/Watt)的概念。往後處理器設計將以單位功率下的效能為趨勢。

如果單以效能提升來說,新的Intel Core2微架構,以桌上型Conroe處理器,比以往同樣65nm製程的Pentium D(Presler)處理器提升約40%,設計功率也下降40%;65nm伺服器XEON 5100系列(Woodcrest)處理器,則是比2.8GHz Xeon 處理器快80%,功耗降低35%;而在筆記型的Merom核心上,在維持相接近的設計功率、相同的電池供電時間下,效能比雙核心Intel Core Duo(Yonah)快20%。
  
如果以效能�瓦能計算,每一瓦提升的效能更是可觀!新的Intel Core2微架構,在桌上型Conroe處理器以及伺服器Woodcrest處理器方面,效能�瓦是過去處理器的三倍以上;而65nm製程的筆記型Merom處理器,也比過去130nm製程的Pentium M 1.6GHz處理器,在效能�瓦比例上提升了2.5倍,不過在筆記型處理器方面,英特爾向來在設計功率上就控制的很好,因此拿65nm雙核心的Merom,來跟前兩代製程還只有單核心的Pentium M 1.6GHz比效能�瓦,像這種這種奇怪的比較法,實在也不足為奇。因為若是同樣拿65奈米製程雙核心的Yonah(Core Duo T2x00系列)跟Merom(Core2 Duo T7x00系列)相比,效能�瓦僅提升20%而已。

■照表操課的效能實測

接下來在另一間會議室,裡面有七八部機器,其中有七部是搭配Intel Core2 Duo(Conroe) E6700(2.66GHz) 處理器、1GB DDRⅡ-800記憶體、975X晶片組主機板以及雙ATI RadeonX1900顯示卡的機台;另一部是對照(挨打組)電腦,除了顯示卡、硬碟以及記憶體容量跟Intel平台配置一樣之外,處理器是採用Socket939架構的雙核心AMD Athlon64 FX-60(2.6GHz、1MB L2 x 2)、搭1GB DDR400記憶體。
  
每個機台裝了一些像DivX、QuickTime、DVD Shrink、iTunes、Adobe Photoshop、Adobe Primiere 2.0,3Dmark05、3Dmark06,以及一些像是Unreal Tournament 2004、Quake4、FEAR、Half life以及Far Cry等遊戲,開放讓在場媒體親自去測試,時間大約是兩小時。
  
前面提到過,由於英特爾人員嚴格禁止拍照、攝影、擷圖,也不能自行帶測試軟體來安裝,連安插USB行動碟都不允許,加上挨打組的電腦蠻多媒體搶著測試,有限的時間內,根本無法做我們專業憑測媒體認為最公平、客觀的一對一平台測試。我們先就英特爾所提供的效能數據,以抽測檢查的方式補測試驗證,並且列舉如後。
  
大致上,Intel Core2 Duo(Conroe)的效能,確實令我們感到驚艷!很多數據都領先2.8GHz Athlon64 FX-60處理器的表現,特別是在一些遊戲的表現上,動輒一百多張甚至兩三百張的畫面產生速率,很明顯的已經有把遊戲王者的寶座,從勁敵AMD超微Athlon64 FX奪回的實力!
  
至於在筆記型電腦方面,英特爾在另一個會議室,實際展示了三部大小、體積、配備相當的IBM/LenovoT系列筆記型電腦,分別是搭配2.26GHz Pentium M 780(Dothan)處理器的IBM T43、搭配2.33GHz CoreDuo T2700(Yonah)處理器的IBM T60,以及同樣外殼是T60(正式名稱應該不是T60),但改用2.33GHz Core2 Duo T7600(Merom)處理器。Intel表示由於Dothan部份並沒有2.33GHz這種時脈版本,因此以最接近的2.26Ghz時脈版本來作測試基準。
  
三部機器分別在媒體見證下,以碼表計時的方式,測試英特爾自行開發的Intel Multi-threads Tools工具軟體,以多線緒多工的方式,陸續執行DivX、iTunes以及Movie Maker等軟體進行轉檔壓縮、解碼的運算。實際測試出來的結果,除了有項Dothan的數據現場測試當掉了而沒有重新測試之外,65nm製程的2.33GHz Merom(Core2 Duo T7600),執行效能是單核心2.26GHz Dothan的2.435倍到3.362倍不等;而雙核心的2.26GHz Core Duo T2700(Yonah),執行效能也是單核心2.26GHz Dothan的1.875倍到2.824倍不等。
  
拿同樣是雙核心、65nm製程的Core2 Duo(Merom) vs Core Duo(Yonah)相比,Merom執行效能在DivX部份比Yonah快了29.89,iTunes部份Merom比Yonah快了14.31%,Movie Maker部份Merom比Yonah快了19.02%,平均說來快上20%是個相當合理的數據。

■英特爾的處理器時程表

原定去年上市的雙核心Montecito,在取消Foxton技術以及667MHz FSB外頻之後,將在今年年中正式推出,而2007年將推出修訂版Montvale,2008年將會搭配新的45nm製程技術,打造Itanium家族第一顆四核心的Itanium(Tukwila),以及低功耗的雙核心Dimona處理器。
  
四顆以上多處理器x86伺服器平台Truland─採用支援雙前端匯流排(Dual Independ Bus,DIB)的E8500晶片組,並且搭配90奈米的Paxville-MP核心的XEON MP處理器,下半年將採用進化到65奈米製程的雙核心Tulsa處理器(正式名稱為XEON 7000系列),XEON 7000具備超大型16MB L3快取記憶體,可以提供內部兩個CPU核心共享,以及更先進的節電管理技術,這也將是Netburst架構的最後代表作。
  
2007年將導入新的Caneland平台,它將搭配由兩顆65nm奈米製程雙核心Woodcrest處理器,以MCM封裝出來的四核心Tigeron處理器,以應付AMD同一時間推出的四核心Opteron(Deerbound)處理器;隨後在2008年,會有真正四顆CPU核心內建同一矽晶片的Dunnington處理器推出。
  
雙顆處理器的x86伺服器平台方面,在2006年上半將由以90nm製程Smithfield核心打造的Dempsey處理器,將以XEON 5000系列為名稱,而採用65nm製程、分離式MCM雙核心的presler處理器取消;另外還有一顆以Yonah相同的(sossaman) XEON LV 2.0處理器,主打低功耗的刀鋒伺服器。
  
隨後下半年,大約七八月份開始,導入ICM架構,以65nm製程Intel Core2架構的Woodcrest處理器為主,並命名為XEON 5100系列。兩者均搭配Bensley/Glidewill平台,由高階的Blackford─Intel 5000X晶片組、中階的Blackford P─Intel 5000P以及Blackford VS─Intel 5000V晶片組作為平台上的搭配。以上均為支援Fully Buffered DIMM(FB-DIMM)全緩衝記憶體模組的設計,並且導入I/O AT加速技術。隨後2007年則會有以兩顆Woodcrest矽晶片MCM兜成的四核心Clovertown處理器出現,2008年之後的四核心XEON MP處理器平台,目前還沒有揭露。

單處理器工作站、玩家高效能平台部份,由Core架構延伸到頂級效能玩家型電腦核心的Core2 ExtremeEdition(Conroe XE)處理器,跟兩顆Conroe XE矽晶粒MCM封裝的四核心Kentsfield處理器,將同步預計於2007年第一季登場。KentsField處理器的正式名稱目前還不明朗(Core4 Extreme Edition?)。兩者要推出的核心時脈以及外頻時脈規格未定,雙核心的Conroe XE核心時脈預估至少大於Core2Duo E6700(2.67GHz),不排除到3∼3.33GHz時脈,而外頻時脈則可能推展到1333MHz FSB。
  
一般桌上型主流處理器部份,2005年底到2006年上半,依舊由65nm製程的Pentium D 955/960系列(Presler)擔綱,2006年下半全面導入ICM的桌上型Core2 Duo(Conroe),從最入門800MHz外頻版本的E4200(1.6GHz、2MB L2、不支援VT)開始,接下來往上從E6400系列(1.86GHz),開始到E6700等四個系列,全數都是高效能1066MHz外頻版本、4MB L2快取記憶體以及支援VT(Intel VirtualizationTechnology虛擬化技術) 的版本,最高等級則是E6700(2.66GHz、1066MHz FSB、4MB L2)。
  
目前時程表2007年底都還維持雙核心的設計,四核心主流桌上型處理器代號以及相關規格,目前還沒揭露。

筆記型Core2 Duo(Merom)處理器,將延續目前Core Duo的T/L/U雙核心、雙核心低電壓以及超低電壓三個系列的命名模式。雙核心Core2 Duo處理器將會有2MB快取的T5500(1.66GHz)、T5600(1.83GHz) 系列,以及4MB快取版本的T7200(2GHz)、T7400(2.13GHz)與7600(2.33GHz),預定在今年八月正式推出,初期搭配目前的Napa筆記型平台(Intel 945PM/945GM/945GMS),隨後在2007年第一季,搭配採用crestline(965PM/965GM?)的Santa Rosa筆記型平台。而後會不會有四核心筆記型處理器的推出,目前時程表上並沒有規劃。
喜歡嗎?分享這篇文章給親朋好友︰
               感謝作者     

johns 該用戶已被刪除
狀態︰ 離線
2
發表於 2007-1-9 14:37:52 |只看該作者
提示: 作者被禁止發言或禁止訪問或刪除帳號,本文內容已被系統自動屏蔽。

Rank: 2

狀態︰ 離線
3
發表於 2007-9-18 04:04:59 |只看該作者
為甚ㄇ4核心的q6600 2.4g跟比雙核心Core2 Duo e6850 3g.價錢差不多.
我在光華商場網站看到的.都8850左右.4核心的應不是比雙核心較強嗎?且制程技術較高嗎/ /?
sorry我的問題不知會不會很幼稚.

Rank: 5Rank: 5

狀態︰ 離線
4
發表於 2007-9-20 01:43:16 |只看該作者
太先進的文章了
看都看不懂   真多的版本阿

Rank: 3Rank: 3

狀態︰ 離線
5
發表於 2008-7-17 20:47:00 |只看該作者
感謝作者的分享  看完這篇文章 讓我對Intel Core2 有更深入的了解 感謝噢

Rank: 3Rank: 3

狀態︰ 離線
6
發表於 2008-7-28 19:02:29 |只看該作者
看完之後有頭昏眼花的現象   

不知道是不是在敘述天書   太高深了
請注意︰利用多帳號發表自問自答的業配文置入性行銷廣告者,將直接禁訪或刪除帳號及全部文章!
您需要登錄後才可以回覆 登入 | 註冊


本論壇為非營利自由討論平台,所有個人言論不代表本站立場。文章內容如有涉及侵權,請通知管理人員,將立即刪除相關文章資料。侵權申訴或移除要求:abuse@oursogo.com

GMT+8, 2024-12-28 15:56

© 2004-2024 SOGO論壇 OURSOGO.COM
回頂部