稱呼由來
“真雙核”與“假雙核”的說法是由AMD提出來的,Intel将兩顆Pentium4核心封裝在一個基闆上,組成了PentiumD,AMD認為這種架構是假雙核,而網友則更具想象力,将這種雙核稱為“膠水”雙核。“真四核”與“假四核”也是同樣的道理,Intel将兩顆Core2Duo粘合成為一顆Core2Quad,而AMD則重新設計了Phenom原生四核CPU,“原生”與“膠水”的論戰再起波瀾。
所謂“膠水”處理器并不是粘在一起,而是使用特殊方法将兩個或更多芯片封裝在一起制造的處理器。由于這種特殊方法像是将兩個或更多核心用膠水粘在一起,由此而得名。
縱觀處理器發展的一路走來,膠水處理器的作用還是不可磨滅的,它讓處理器的性能再次提升,當AMD指責Intel的産品是假内核,而Intel則辯稱用戶隻重視CPU性能而并不在乎CPU内部架構。雖然AMD在“真假雙核”之争中獲利更多一些,但人們在經曆了“真假雙核”的狂轟爛炸之後,選購CPU的時候更冷靜和理智了。因為在實際各種評測之中,AMD的“真四核”性能卻往往不如英特爾的“膠水黏合”。因此,我們在比較CPU的時候,應該更關注其實際性能,不要盲目聽商家搬弄概念。
發展狀況
回顧一下處理器的發展史上有哪些産品屬于“膠水”處理器的行列:
1.最古老的“膠水”處理器
發布于1995年的PentiumPro是首款支持超過4GB内存的處理器,它利用36位物理地址擴展(PAE)技術最大可支持64GB内存。這款CPU也是第一款P6架構(酷睿2核心也源自于此)處理器,也是首次在CPU内部集成L2緩存。
PentiumPro最大特色在于首先采用了雙核封裝。由于那時CPU的制造工藝還停留在350nm-500nm階段,高速二級緩存單元還不能像現在這樣直接與運算核心加工在同甘共苦晶圓顆粒上面,必須要用兩顆晶圓顆粒分别加工,即一顆晶圓加工運算核心,另一顆晶圓加工緩存,然後再将它們“膠合”在一起。其實,這在當時已經是一種非常先進的制造方法了。别忘了,在這之前,運算核心隻能和主闆上的系統内存交換數據。當二級緩存和運算核心被一起封存裝進CPU後,二級緩存就可以與運算核心以相同的頻率運行,不必像以前那樣和速度較慢的系統内存通信,為數據通信提供了捷徑,直接提升了性能。
2.引發口水大戰的“膠水”處理器:Intel奔騰D雙核
其實這還是要從AMDX2系列說起:當時在AMD推出X2以後,IntelP4依然無法擺脫高熱量、高能耗、低性能,導緻Intel瞬間敗北。之後Intel為了應急推出了PD雙核産品,這款把兩個單核處理器粘在一起的産品,顯然沒有達到預期的效果,面對着AMDX2的“真雙核”有備而來,Intel首款膠水雙核也是為多核之路充當了回小白鼠,也正是這樣才讓Intel開始發展自己的“真雙核”,不過“膠水”CPU也從那以後成為Intel的最愛。“真假雙核”的說法從那時開始應運而生,對立雙方各執一詞。
3.“膠水”處理器再次升級:Intel酷睿2四核
2006年對AMD和英特爾來說,雙核鬥法成了貫穿全年的唯一主題。起初,AMD憑借Athlon64X2和Athlon64FX處理器的良好表現橫掃千軍,在市場中威風八面。不曾想,英特爾靠PD假雙核卧薪嘗膽之後,鑄劍Core2大獲成功,重奪“性能”王座,從此,攻守易幟。2007年年初的時候,Intel發布了全新的Core2QuadQ6600四核處理器。作為世界上第一款四核處理器,這款處理器再度被牽涉進了“真假”問題的紛争當中。衆所周知,Intel的PentiumD雙核處理器,就是将兩個Prescott核心集成在一起而成為了第一代雙核心的Smithfield處理器。之後Intel的酷睿雙核回歸到了“真雙核”行列裡,而到了從雙核到四核架構過渡之時,Intel再次故技重施,将兩顆Conroe核心集成到一起,成為了Intel第一款四核心Kentsfield處理器。這樣的設計雖然簡單,并且2+2模式的也可以縮短産品研發周期。不過由于先進的架構和設計的關系,這款“膠水”的性能不錯,可能是由于Intel“膠水”配方好,和“膠水”工藝提高了,使得酷睿2四核産品性能十分優秀。
4.“膠水”玩上瘾:功耗最低的雙核AtomN330
伴随着“膠水”CPU一路走來的Intel,雖然在全新架構i7中,重登真四核領域,但是“膠水”的理念卻已根深蒂固,這不就在低功耗領域明目張膽的又重操舊業玩起了“膠水”雙核。圖中就是Intel發布的雙核Atom低功耗處理器,型号為Atom330,該處理器擁有1.6GHz的主頻,采用45nm工藝,擁有2個核心,TDP僅有8W,擁有533MHz的FSB,1MB二級緩存,售價達到了43美元。
客觀評價
可以感受到,一些國際大廠為何要在最王牌尖端的芯片産品上使用我們俗稱的MCM“膠水”技術,其實有時候膠水技術也未必是落後的象征,隻是針對的實現目的方法而已:
1.實現更高的芯片間傳輸性能-例如IntelPentiumPRO是為了性能而嵌入L2Cache,或如Microsoft/ATIXenos也是為求取性能而内嵌eDRAM,此外IBM大型主機用處理器,以及POWER4/4+/5/5+等,也都是為了性能而使用MCM“膠水”技術,求性能為首要,整合度更提升則為次要。
2.更高整合、多核競賽-Intel為求在雙核、多核的推出進度上能夠加快,因此三步并兩步來加緊追趕,如此不僅使用裸晶層面的多核整合技術,同時也使用封裝層面的多核整合技術。
3.為求彈性、快速發展-Xenos之所以實行嵌入式eDRAM的原因還有一個,那就是彈性發展、加速發展。由于eDRAM技術并非是ATI的專長,而是NEC的強項,雖然ATI與NEC可以更密切合作,在裸晶層面就将eDRAM與C1一同設計,進而量産,但如此做也有部份問題要顧慮。例如,ATI與NEC必須花費更多的協同合作心力,特别是在實體電路的設計層面,且在更換實體電路制程時,雙方就必須再次對實體電路的設計進行再協同溝通與再設計。再者,除了設計協同與電路改版等溝通心力外,也會羁絆雙方在原先自有領域的發展進度,使原有自己擅長的本務進步動力減緩,反而使其他同業有機會追趕。
所以,還是以各自分開設計與分開發展為宜,最後再運用MCM封裝方式來加速互連,以獲得比PCB電路闆層次更高的性能,但又有Die裸晶層次所不具備的發展、設計彈性。如此很明顯的:MCM将是整合度、互連性能高于闆卡層,但電路發展與設計彈性又高于裸晶層的一種技術,相信未來此種技術的應用将愈來愈廣泛。
真假之争
2005年中,Intel和AMD相繼發布雙核心處理器PentiumD和Athlon64X2,雙方的産品是各有特色:AMD繼續保持單核Athlon64系列高效能低功耗的優勢,而Intel繼續保持Pentium4系列高頻率高功耗的特色。
當然最大的不同還是在核心架構方面,Athlon64X2是經過重新設計的單一芯片原生雙核方案,而PentiumD則是兩把兩顆Pentium4核心封裝在一起而已。Intel的高頻低能與膠水雙核的确是一大軟肋,于是AMD最先發難,挑起了真假雙核之争,下面我們就來簡單回顧下:
2005年5月,AMD宣稱,其用于服務器和台式機的雙核處理器産品為“真雙核”架構,以與Intel的PentiumD産品進行區分。
2005年6月7日,AMD大中華區市場總監王妩蓉表示:我們非常尊重我們的競争對手,無意對它進行抵毀,我們隻是想說明在雙核處理器方面AMD的架構與英特爾的架構并不相同,AMD的産品在架構上的優勢更為明顯,性能更強。
2005年12月上旬,Intel總裁來華公關,稱AMD轉讓給中國的處理器技術過時。
2005年12月中旬,AMD發起“我為雙核狂AMD真雙核體驗風暴活動”,再抛“真假雙核論”的王牌,認為自己是一個芯片上的兩個核,是真正的雙核,而Intel是一個處理器上的兩個芯片,是假雙核,并從網上招募電腦愛好者進行線上體驗雙核應用。同時在北京舉行的小型媒體交流會,展示AMD雙核處理器性能優勢的大量測試數據。
Intel中國公司新聞發言人劉捷對于AMD發起挑戰的問題回答很簡單:“沒必要”。其表示,Intel作為首先提出雙核概念并且實現大範圍市場化的領先企業,對于自己的産品十分有信心。沒有必要通過這種評測來證明。
2006年02月27日,Intel中國北方區總經理曾明指出AMD在雙核上制造了一個“謊言”。這是Intel半年來第一次針對AMD雙核挑戰表明立場。同時,曾明還拿出一家第三方最新的評測數據,稱AMD雙核産品在執行多任務時的低性能。
2006年2月28日,AMD公司就Intel的系列指責做出回應,表示“此測試結果的出現純屬軟件原因,AMD無意攻擊競争對手。Intel公司引用的數據是斷章取義。”并表示從未對Intel的處理器稱假雙核,更沒有對Intel進行過抨擊,所謂“假雙核”的說法屬于空穴來風。
自從雙核處理器問世以來,AMD曾在美國、新加坡等地邀請英特爾“決戰雙核”,對此Intel一直不予理會,Intel唯一一次公開回應,使得延續一年多的“真假雙核處理器”之争愈演愈烈。
資深的玩家應該知道,AMD在當年的确占有性能和功耗方面的雙重優勢,所以AMD理直氣壯、咄咄逼人的态勢讓Intel無言以對。但當年Athlon64X2的價格可是高得離譜,最便宜的型号都要2000左右,而Intel則非常親民,PentiumD805還不足千元,處于劣勢的Intel擔任了雙核普及使者。
手機雙核
參賽選手亮相
首先,讓我們來看看市面上有哪些雙核心手機處理器。德州OMAP4430,三星Exynos 4210,英偉達Tegra 2,高通MSM8x60。
好,這些就是即将上陣的選手了。下面我們會依次考量它們在諸多方面的表現,看看究竟哪個雙核名副其實,哪個雙核浪得虛名。
較量項目一:處理器核心架構
我們知道,計算機程序,都是由一條一條的指令組成的。這些指令有很多種功能,有的是把數據從一個地方複制到另一個地方,有的是做數學運算,有的負責判斷某一個條件,有的負責從一處跳轉到另一處。編譯器會把所程序員寫出的程序編譯成一條一條順序的指令,就像電器的使用指南一樣,讓處理器遵照它去做。為了方便理解,我們假設一個程序的内容是做一份考試卷,執行的過程是先做完選擇題,再做完問答題;做選擇題的條件是要有鉛筆去塗答題卡,而做問答題的條件則是要有鋼筆去寫答題紙。
如果你忘了帶鉛筆,那麼為了完成考卷,就必須要等到鄰座的做完了選擇題,你找他借來鉛筆,才能繼續自己的考卷,這樣就耽誤了時間。對于一顆标準處理器而言,很多時候都會遇到這類“沒有帶鉛筆”的情況,比如需要訪問的數據在内存裡,這就需要處理器通知内存管理器,讓内存管理器去把數據調入處理器,才能繼續執行這一條指令。由于處理器内部的時鐘延遲是納秒級别,而内存的運行頻率則有數十納秒的延遲,兩者之間差了許多倍,因此處理器一般需要消耗很長的等待時間,才能繼續開始工作,最終的結果就是性能下降。
最後,我們給這些處理器的核心架構作個評分(考慮到默認頻率):
Tegra2★★★
OMAP4430★★★★★
MSM8x60★★
Exynos 4210★★★★★
較量項目二:處理器核心的協同作戰能力
可能多處理器架構這個詞對于不少讀者而言都是很陌生的,很多人可能從來都沒注意到過這方面的東西。所謂多處理器架構,就是說多顆處理器以何種模式共同運行,以怎樣的方式合作執行程序。在PC領域,這個概念并不重要,因為大家看到的多處理器(多核心處理器也可以看作制作在一個芯片上的多處理器),在邏輯架構上都是一樣的,那就是同步多處理器,英文為Synchronous Multi-Processors,縮寫為SMP(不是對稱多處理器的那個SMP)。但是在多處理器體系剛剛出現的階段,曾經也有過很多不同的邏輯架構,而在目前的手機市場上就恰恰存在着不采用SMP架構的多處理器,那就是高通的MSM8x60。
與SMP不同,高通所采用的架構名為ASMP,即異步多處理器架構。所謂同步和異步,差距并不是簡單的兩個字,在具體實現上的區别非常大。但是在此我們并不需要了解它們之間學術上的區别,我們隻從最粗略的角度來看
所謂同步多處理器,顧名思義就是同步的,即多枚處理器運行在同樣的時鐘頻率,共享同樣的緩存數據,協同工作。簡單來說,同步多處理器系統在工作的時候,每當一個任務完成後,空閑的處理器會立刻尋找下一個新的任務,對于外部而言,這兩顆處理器是一個整體,共同完成同一個工作。
而異步多處理器則更接近于若幹個獨立工作的處理器,它們之間可以運行在不同的頻率下,每個處理器維護自己私有的緩存數據,最重要的是,它們之間會利用一種仲裁機制,以輪流工作的方式執行任務。它們更像是一些互不幹擾的獨立處理器,各自完成各自的事情,輪流執行不同的工作。
看到這兒,相信大家也看出來了,同步和異步最大的區别就在于輪流工作這四個字。具體而言,就是在同一時間,隻有一顆處理器可以接受任務,另一顆不論是否繁忙,都不能接受新任務。可能光靠文字說明還不是那麼生動,下面我們就來看幾張圖,了解一下相對于同步多處理器“誰空閑誰接單“的工作模式而言,這種輪流工作到底是怎樣進行的,又會導緻怎樣的結果。
圖中每一橫行代表一個時鐘周期,我們用紅色的方塊代表正在讀取任務,綠色的方塊代表正在執行任務,方塊中的數字代表不同的任務,而空白代表着空閑狀态。在第一張圖裡,我們假設任何任務隻需要一個周期就可以執行完畢。一下這兩種架構的工作方式。
同樣,讓我們也來針對多處理器架構,給四款雙核一個評分:
Tegra2★★★
OMAP4430★★★★★
MSM8x60★★★
Exynos4210★★★★★
較量項目三:通訊總線
關于總線的研究就到此為止了,依然按照慣例,最後給一個分數:
Tegra2★
OMAP4430★★★★★
MSM8x60★★
Exynos4210★★★★★
較量項目四:多媒體
何謂多媒體擴展指令集?由于原理複雜堅澀,小編就簡單的打個比方:廠商們分析平時處理器幹哪些事情最慢、又最經常用到,然後把這些最消耗時間的事情固化成電路,做成一個額外的部分,和處理器集成到一起。使用的時候,隻通過一條指令,就能夠訪問和計算多組數據,把最消耗時間的事情盡快做完。在計算機詞彙裡,這種指令集叫做SIMD(Single Instruction Multiple Data,單指令多數據)指令集。在視頻解碼方面,Tegra 2也會因為不具備NEON協處理器而受到很大的影響。因為我們知道,Tegra 2雖然号稱可以支持諸多格式的1080p全高清解碼,但是它對視頻的編碼格式有着非常嚴格的要求,例如Tegra 2的視頻解碼核心隻能硬件解碼Main Profile的H.264視頻,而對于其它的就隻能靠處理器來進行軟件解壓。這時沒有NEON協處理器的幫助,視頻解壓就很難高效的進行,最終導緻Tegra 2的多媒體特性縮水。
也許nVIDIA是認為NEON協處理器的授權價格過于昂貴,或者可能因為規模太大而提升制造成本,而最終選擇了放棄,但作為消費者而言,不具備NEON指令集的Tegra 2無疑會在多媒體方面的競争中被對手遠遠甩開。好了,關于多媒體的比拼也要告一段落了,最後我們照例為每個處理器給出評分。
Tegra2★
OMAP4430★★★★★
MSM8x60★★★★★
Exynos4210★★★★★
較量項目五:3D加速
而作為曾經參與桌面競争、當下專注嵌入式GPU的Imagination公司,自然不願意讓出嵌入式獨立GPU市場的性能領導地位。在OMAP4430上,我們看到的就是這家公司設計的PowerVR SGX540。這是一顆大家很熟悉的GPU,因為早在單核Cortex A8時代,三星就在代号蜂鳥的處理器中采用了這顆GPU,它強大的性能也讓采用蜂鳥處理器的機型在單核時代傲視群雄。與GeForce ULP不同的是,PowerVR SGX540内并沒有單獨的頂點處理器或者像素處理器,而是包含了四組通用處理器。這種類似于桌面顯示核心統一渲染器的設計結構可以讓PowerVR GPU用最少的硬件獲取最大的性能,從而節約成本和功耗。值得一提的是,也正是由于通用處理器的設計,PowerVR SGX540成為了當前唯一一顆支持OpenCL通用運算标準的GPU
可以看到,在規格指标方面,Exynos 4210是遙遙領先的,而Tegra 2緊随其後。至于具體的性能表現,我們在後面的測試中将簡單介紹。值得注意的是,上表中的參數未必是最終的實際性能,理論參數一般都會受到實際應用環境的強烈影響。
不過不管怎樣,我們還是要打個分的,暫時按照物理參數吧。
Tegra2★★★★
OMAP4430★★★
MSM8x60★★
Exynos4210★★★★★
誰是純爺們,四款雙核大混戰
上述評測,也許很多人會覺得,為什麼Tegra 2如此之差。nVIDIA果然還是這方面的菜鳥啊!如果這樣想你就錯了,因為在這些芯片的背後,還有一些重要的參數和取舍,之前的文章裡我們并沒有提到,那就是成本上述炫目的技術分析,相信大家都累了。下面就讓我們從一些性能測試中一窺這幾顆處理器在實際産品中的表現吧。首先介紹一下采用了這四顆芯片的實際産品。
Exynos 4210與Apple A5則走在了性能的極端,實際上可以說忽略了成本與功耗的表現。而最悲劇的依然是Tegra 2,nVIDIA片面追求低成本,導緻性能方面慘不忍睹,這可能是nVIDIA在Tegra 2上需要學到的最大的教訓。



















