NVIDIA TEGRA 3:英偉達公司研發系統芯片系列-中文百科頻道

簡介

NVIDIA Tegra 3（代号：Project Kal-El)，是NVIDIA在2011MWC上展示的全世界第一款移動四核處理器（4個Cortex-A9核心）。

NVIDIA Tegra 3集成12個執行單元的GeForce GPU圖形核心，支持3D立體，并支持2048x1536的超高清分辨率，CPU處理能力比上代Tegra 2提升了兩倍，而GPU圖形性能方面，圖睿2理論性能是圖睿3四分之三。基于40納米工藝，功耗與Tegra 2相比略有降低。

Tegra 3改為采用四核心A9，并将頻率提升到1.5GHz，圖形處理器流處理器規模擴大一半，性能提升三倍，并且補齊Tegra 2不支持Neon的短闆，支持256bit的Neon指令集，有回放High Profile的1080P視頻的能力。使得其性能相對競争對手現有産品全面占優。

當然Tegra 3可怕的不僅僅是性能，NVIDIA還在Tegra 2/3中使用了x86領域常見的小核心策略，Tegra 3雖然集成四核心和更為強大的GPU單元，但其芯片面積僅79mm2,遠遠小于現在Apple A5 雙核的110mm2，更小的核心對于移動平台而言，意味着的不僅僅隻是更低的成本和更高的産能，并且往往還意味着更好的功耗控制。在移動平台進行産品設計不能像在x86領域單純的堆砌核心數和流處理器數，而需要更為仔細的精打細算，這時NVIDIA強大的設計能力帶來的更佳的性能/核心面積比就顯得十分重要了。

而競争對手德州儀器和三星，在2012年底A15架構之前則沒有全新産品，而是僅僅提升現有産品的頻率，NVIDIA的快速産品更新策略和小核心策略則可以使得其可以占有更多戰略上的主動權。

技術應用

SMP架構

NVIDIA® Tegra® 3 處理器采用可變對稱多重處理 (vSMP) 這一正在申請專利的新型技術。vSMP 包含第五個 CPU “協核心”，該核心專為性能要求較低的任務而設計。四個主核心專為性能要求高的任務而設計，而且它們的功耗通常低于雙核處理器。

NVIDIA Tegra3的研發代号為Kal-EL，所以下面大量圖表會以這個名字出現。在第一代Tegra中，我們就知道NVIDIA使用了一顆ARM7處理器作為低負載核心搭配Cortex-a8核心進行工作，而在包括待機、音樂播放等低負載工作中，各家處理器也有不同的方式。而Tegra3的vSMP讓這個設計思路更進一步，“協核心”的出現是Tegra3的精髓所在。為了更好的控制能效，協核心同樣采用Cortex-A9架構，但工藝設計上專門為低功耗低主頻優化，它最高工作頻率500MHz。

而其他四個主核心架構與協核心一緻，這四個核心單核心工作最高主頻為1.4GHz、多核心工作時主頻最高為1.3GHz。協核心與一個或多個主核心不能同時工作，處理器通過高效的管理辦法可完成多核心間高速切換，官方給出數據是切換時間小于2毫秒。這麼設計達到的目标是，在低負荷時隻有協核心最高500MHz主頻工作，能效比會明顯高于主核心工作狀态下的數值。如果需要更高的性能，此時四個主核心才會按需進行切換工作。

為了保證Tegra3的高效率以及一個或多個主核心工作狀态與協核心工作狀态間無縫切換，在緩存、Android系統優化方面Tegra3也有特别之處。正如上文所說，低功耗的協核心與一個或多個主核心是不可以共同工作的。在一般使用時，例如打開視頻或打開遊戲時，Tegra3一定會切換到主核心工作狀态，此時協核心是完全停止工作的。但要實現無縫銜接切換，在緩存設計上，主核心和協核心共享1MB的二級緩存，緩存間返回數據速度在納秒級别。

在Android系統下，雖然系統可以允許多個核心在不同頻率下運行，但系統假設每個核心的運算能力是完全一緻的，它會依次來分配計劃任務，而此時顯然多核心工作是不夠高效的。而NVIDIA表示，vSMP将一直保持被激活的核心工作在同步系統頻率上，以此方式為Android系統優化，從而達到更高的效率，NVIDIA還專門有關于負載平衡功能的視頻演示，大家可以在國内視頻網站搜索Tegra3關鍵字看到相關視頻。

性能與功耗

NVIDIA官方還展示了多套數據來說明Tegra3在功耗和性能方面的優勢，兩個處理器同樣是來自台積電TSMC的40nm工藝制造。我們看到多個項目中，Tegra3功耗優勢明顯。

對比的處理器包括Tegra3四核心工作在480MHz、TI的OMAP4系列處理器工作在1GHz、QC8660即Snapdragon MSM8660/8260工作在1.2GHz以及Tegra3工作于1GHz時的功耗和性能。我們看到，Tegra3四核心工作于較低頻率時性能與目前TI和高通主流雙核處理器相當，但功耗卻隻有它們的35%左右。

而Tegra3的四核心工作于1GHz時，功耗仍要比TI OMAP4和MSM8660/8260低20%左右，性能卻領先一倍。随後的多張圖表，NVIDIA是想向大家表明很簡單的道理。達到目前主流性能，Tegra3隻需要付出一半的功耗，而如果需要更高的性能，Tegra3可以提升近一倍，而功耗卻比現在雙核心主流産品低20%。

由于NVIDIA詳細的功耗對比主要以這一款Benchmark軟件為主，而且并沒有告知該軟件的測試方法、測試項目，但如果不出意外，它仍具有很高的參考性，Tegra3即便不考慮協核心的存在，它在多核心的優化上也明顯優于目前的主流雙核心ARM處理器。當然，這個測試中可能不包括3D圖形單元部分的運算。

此次Tegra3的發布在圖形性能方面同樣有不少的相關展示，但對GeForce部分的加強則不是重點，在Tegra2處理器中8個核心單元(4個Vertex Shader和4個Pixel Shader)被增加至12個，在功能上圖形輸出支持HDMI 1.4a規範，支持3D視頻播放和輸出，支持通過Tegra3 2D轉3D功能。同時，NVIDIA官方資料更多描述表示，目前的移動平台3D引擎可以很好的支持多核心處理器的工作，因此Tegra3的多核心會有相應的表現。

從展示内容來看，我們看到更好的實時光影效果、動态模糊效果、以及物理引擎運算效果。但這些效果應該并不隻是GeForce或者Tegra3獨有。