計算機體系結構:是指那些對程序員可見的系統屬性-中文百科頻道

基本概念

計算機體系結構就是指适當地組織在一起的一系列系統元素的集合，這些系統元素互相配合、相互協作，通過對信息的處理而完成預先定義的目标。通常包含的系統元素有：計算機軟件、計算機硬件、人員、數據庫、文檔和過程。其中，軟件是程序、數據庫和相關文檔的集合，用于實現所需要的邏輯方法、過程或控制；硬件是提供計算能力的電子設備和提供外部世界功能的電子機械設備(例如傳感器、馬達、水泵等)；人員是硬件和軟件的用戶和操作者；數據庫是通過軟件訪問的大型的、有組織的信息集合；文檔是描述系統使用方法的手冊、表格、圖形及其他描述性信息；過程是一系列步驟，它們定義了每個系統元素的特定使用方法或系統駐留的過程性語境。

種屬性

1·機内數據表示：硬件能直接辨識和操作的數據類型和格式

2·尋址方式：最小可尋址單位、尋址方式的種類、地址運算

3·寄存器組織：操作寄存器、變址寄存器、控制寄存器及專用寄存器的定義、數量和使用規則

4·指令系統：機器指令的操作類型、格式、指令間排序和控制機構

5·存儲系統：最小編址單位、編址方式、主存容量、最大可編址空間

6·中斷機構：中斷類型、中斷級别，以及中斷響應方式等

7·輸入輸出結構：輸入輸出的連接方式、處理機/存儲器與輸入輸出設備間的數據交換方式、數據交換過程的控制

8·信息保護：信息保護方式、硬件信息保護機制。

發展曆程

計算機系統已經經曆了四個不同的發展階段。

第一階段

60年代中期以前，是計算機系統發展的早期時代。在這個時期通用硬件已經相當普遍，軟件卻是為每個具體應用而專門編寫的，大多數人認為軟件開發是無需預先計劃的事情。這時的軟件實際上就是規模較小的程序，程序的編寫者和使用者往往是同一個(或同一組)人。由于規模小，程序編寫起來相當容易，也沒有什麼系統化的方法，對軟件開發工作更沒有進行任何管理。這種個體化的軟件環境，使得軟件設計往往隻是在人們頭腦中隐含進行的一個模糊過程，除了程序清單之外，根本沒有其他文檔資料保存下來。

第二階段

從60年代中期到70年代中期，是計算機系統發展的第二代。在這10年中計算機技術有了很大進步。多道程序、多用戶系統引入了人機交互的新概念，開創了計算機應用的新境界，使硬件和軟件的配合上了一個新的層次。實時系統能夠從多個信息源收集、分析和轉換數據，從而使得進程控制能以毫秒而不是分鐘來進行。在線存儲技術的進步導緻了第一代數據庫管理系統的出現。計算機系統發展的第二代的一個重要特征是出現了“軟件作坊”，廣泛使用産品軟件。但是，“軟件作坊”基本上仍然沿用早期形成的個體化軟件開發方法。随着計算機應用的日益普及，軟件數量急劇膨脹。在程序運行時發現的錯誤必須設法改正；用戶有了新的需求時必須相應地修改程序；硬件或操作系統更新時，通常需要修改程序以适應新的環境。上述種種軟件維護工作，以令人吃驚的比例耗費資源。更嚴重的是，許多程序的個體化特性使得它們最終成為不可維護的。“軟件危機”就這樣開始出現了。1968年北大西洋公約組織的計算機科學家在聯邦德國召開國際會議，讨論軟件危機課題，在這次會議上正式提出并使用了“軟件工程”這個名詞，一門新興的工程學科就此誕生了。

第三階段

計算機系統發展的第三代從20世紀70年代中期開始，并且跨越了整整10年。在這10年中計算機技術又有了很大進步。分布式系統極大地增加亍計算機系統的複雜性，局域網、廣域網、寬帶數字通信以及對“即時”數據訪問需求的增加，都對軟件開發者提出了更高的要求。但是，在這個時期軟件仍然主要在工業界和學術界應用，個人應用還很少。這個時期的主要特點是出現了微處理器，而且微處理器獲得了廣泛應用。以微處理器為核心的“智能”産品随處可見，當然，最重要的智能産品是個人計算機。在不到10年的時間裡，個人計算機已經成為大衆化的商品。

在計算機系統發展的第四代已經不再看重單台計算機和程序，人們感受到的是硬件和軟件的綜合效果。由複雜操作系統控制的強大的桌面機及局域網和廣域網，與先進的應用軟件相配合，已經成為當前的主流。計算機體系結構已迅速地從集中的主機環境轉變成分布的客戶機/服務器(或浏覽器/服務器)環境。世界範圍的信息網為人們進行廣泛交流和資源的充分共享提供了條件。軟件産業在世界經濟中已經占有舉足輕重的地位。随着時代的前進，新的技術也不斷地湧現出來。面向對象技術已經在許多領域迅速地取代了傳統的軟件開發方法。

總結

軟件開發的“第四代技術”改變了軟件界開發計算機程序的方式。專家系統和人工智能軟件終于從實驗室中走出來進入了實際應用，解決了大量實際問題。應用模糊邏輯的人工神經網絡軟件，展現了模式識别與拟人信息處理的美好前景。虛拟現實技術與多媒體系統，使得與用戶的通信可以采用和以前完全不同的方法。遺傳算法使我們有可能開發出駐留在大型并行生物計算機上的軟件。

基本原理

計算機體系結構解決的是計算機系統在總體上、功能上需要解決的問題，它和計算機組成、計算機實現是不同的概念。一種體系結構可能有多種組成，一種組成也可能有多種物理實現。

計算機系統結構的邏輯實現，包括機器内部數據流和控制流的組成以及邏輯設計等。其目标是合理地把各種部件、設備組成計算機，以實現特定的系統結構，同時滿足所希望達到的性能價格比。一般而言，計算機組成研究的範圍包括：确定數據通路的寬度、确定各種操作對功能部件的共享程度、确定專用的功能部件、确定功能部件的并行度、設計緩沖和排隊策略、設計控制機構和确定采用何種可靠技術等。計算機組成的物理實現。包括處理機、主存等部件的物理結構，器件的集成度和速度，器件、模塊、插件、底闆的劃分與連接，專用器件的設計，信号傳輸技術，電源、冷卻及裝配等技術以及相關的制造工藝和技術。

分類

Flynn分類法

1966年，Michael.J.Flynn提出根據指令流、數據流的多倍性（multiplicity）特征對計算機系統進行分類，定義如下。

·指令流：機器執行的指令序列

·數據流：由指令流調用的數據序列，包括輸入數據和中間結果

·多倍性：在系統性能瓶頸部件上同時處于同一執行階段的指令或數據的最大可能個數。

Flynn根據不同的指令流-數據流組織方式把計算機系統分為4類。

1·單指令流單數據流（SingleInstructionStreamSingleDataStream，SISD）

SISD其實就是傳統的順序執行的單處理器計算機，其指令部件每次隻對一條指令進行譯碼，并隻對一個操作部件分配數據。

2·單指令流多數據流（SingleInstructionStreamMultipleDataStream，SIMD）

SIMD以并行處理機為代表，結構如圖，并行處理機包括多個重複的處理單元PU1～PUn，由單一指令部件控制，按照同一指令流的要求為它們分配各自所需的不同的數據。

3·多指令流單數據流（MultipleInstructionStreamSingleDataStream，MISD）

MISD的結構，它具有n個處理單元，按n條不同指令的要求對同一數據流及其中間結果進行不同的處理。一個處理單元的輸出又作為另一個處理單元的輸入。

4·多指令流多數據流（MultipleInstructionStreamMultipleDataStream，MIMD）

MIMD的結構，它是指能實現作業、任務、指令等各級全面并行的多機系統，多處理機就屬于MIMD。（2）

馮式分類法

1972年馮澤雲提出用最大并行度來對計算機體系結構進行分類。所謂最大并行度Pm是指計算機系統在單位時間内能夠處理的最大的二進制位數。設每一個時鐘周期△ti内能處理的二進制位數為Pi，則T個時鐘周期内平均并行度為Pa=(∑Pi)/T(其中i為1，2，…，T)。平均并行度取決于系統的運行程度，與應用程序無關，所以，系統在周期T内的平均利用率為μ=Pa/Pm=(∑Pi)/(T*Pm)。用最大并行度對計算機體系結構進行的分類。用平面直角坐标系中的一點表示一個計算機系統，橫坐标表示字寬(N位)，即在一個字中同時處理的二進制位數；縱坐标表示位片寬度(M位)，即在一個位片中能同時處理的字數，則最大并行度Pm=N*M。

由此得出四種不同的計算機結構：

①字串行、位串行(簡稱WSBS)。其中N=1，M=1。

②字并行、位串行(簡稱WPBS)。其中N=1，M>1。

③字串行、位并行(簡稱WSBP)。其中N>1，M=1。

④字并行、位并行(簡稱WPBP)。其中N>1，M>1。

技術革新

計算機體系結構以圖靈機理論為基礎，屬于馮·諾依曼體系結構。本質上，圖靈機理論和馮·諾依曼體系結構是一維串行的，而多核處理器則屬于分布式離散的并行結構，需要解決二者的不匹配問題。

首先，串行的圖靈機模型和物理上分布實現的多核處理器的匹配問題。圖靈機模型意味着串行的編程模型。串行程序很難利用物理上分布實現的多個處理器核獲得性能加速.與此同時,并行編程模型并沒有獲得很好的推廣，僅僅局限在科學計算等有限的領域.研究者應該尋求合适的機制來實現串行的圖靈機模型和物理上分布實現的多核處理器的匹配問題或縮小二者之間的差距，解決“并行程序編程困難，串行程序加速小”的問題。

在支持多線程并行應用方面，未來多核處理器應該從如下兩個方向加以考慮。第一是引入新的能夠更好的能夠表示并行性的編程模型。由于新的編程模型支持編程者明确表示程序的并行性，因此可以極大的提升性能。比如Cell處理器提供不同的編程模型用于支持不同的應用。其難點在于如何有效推廣該編程模型以及如何解決兼容性的問題。第二類方向是提供更好的硬件支持以減少并行編程的複雜性。并行程序往往需要利用鎖機制實現對臨界資源的同步、互斥操作，編程者必須慎重确定加鎖的位置，因為保守的加鎖策略限制了程序的性能，而精确的加鎖策略大大增加了編程的複雜度。一些研究在此方面做了有效的探索。比如，SpeculativeLockElision機制允許在沒有沖突的情況下忽略程序執行的鎖操作，因而在降低編程複雜度的同時兼顧了并行程序執行的性能。這樣的機制使得編程者集中精力考慮程序的正确性問題，而無須過多地考慮程序的執行性能。更激進的，TransactionalCoherenceandConsistency(TCC)機制以多個訪存操作（Transaction）為單位考慮數據一緻性問題，進一步簡化了并行編程的複雜度。

主流的商業多核處理器主要針對并行應用，如何利用多核加速串行程序仍然是一個值得關注的問題。其關鍵技術在于利用軟件或硬件自動地從串新程序中派生出能夠在多核處理器上并行執行的代碼或線程。多核加速串行程序主要有三種方法，包括并行編譯器、推測多線程以及基于線程的預取機制等。在傳統并行編譯中，編譯器需要花費很大的精力來保證拟劃分線程之間不存在數據依賴關系。編譯時存在大量模糊依賴，尤其是在允許使用指針（如C程序）的情況下，編譯器不得不采用保守策略來保證程序執行的正确性。這大大限制了串行程序可以挖掘的并發程度，也決定了并行編譯器隻能在狹窄範圍使用。為解決這些問題，人們提出推測多線程以及基于線程的預取機制等。然而，從這種概念提出到現在為止，這個方向的研究大部分局限于學術界，僅有個别商業化處理器應用了這種技術，并且僅僅局限于特殊的應用領域。我們認為動态優化技術和推測多線程（包括基于線程的預取機制）的結合是未來的可能發展趨勢。

馮·諾依曼體系結構的一維地址空間和多核處理器的多維訪存層次的匹配問題。本質上，馮·諾依曼體系結構采用了一維地址空間。由于不均勻的數據訪問延遲和同一數據在多個處理器核上的不同拷貝導緻了數據一緻性問題。該領域的研究分為兩大類：一類研究主要是引入新的訪存層次。新的訪存層次可能采用一維分布式實現方式。典型的例子是增加分布式統一編址的寄存器網絡。全局統一編址的特性避免了數據一緻性地考慮。同時，相比于傳統的大容量cache訪問，寄存器又能提供更快的訪問速度。TRIPS和RAW都有實現了類似得寄存器網絡。另外，新的訪存層次也可以是私有的形式。比如每個處理器和都有自己私有的訪存空間。其好處是更好的劃分了數據存儲空間，已洗局部私有數據沒有必要考慮數據一緻性問題。比如Cell處理器為每個SPE核設置了私有的數據緩沖區。另一類研究主要涉及研制新的cache一緻性協議。其重要趨勢是放松正确性和性能的關系。比如推測Cache協議在數據一緻性未得到确認之前就推測執行相關指令，從而減少了長遲訪存操作對流水線的影響。此外，TokenCoherence和TCC也采用了類似的思想。程序的多樣性和單一的體系結構的匹配問題。未來的應用展現出多樣性的特點。一方面，處理器的評估不僅僅局限于性能，也包括可靠性，安全性等其他指标。另一方面，即便考慮僅僅追求性能的提高，不同的應用程序也蘊含了不同層次的并行性。應用的多樣性驅使未來的處理器具有可配置、靈活的體系結構。TRIPS在這方面作了富有成效的探索，比如其處理器核和片上存儲系統均有可配置的能力，從而使得TRIPS能夠同時挖掘指令級并行性、數據級并行性及指令級并行性。

多核和Cell等新型處理結構的出現不僅是處理器架構曆史上具有裡程碑式的事件，對傳統以來的計算模式和計算機體系架構也是一種颠複

2005年，一系列具有深遠影響的計算機體系結構被曝光，有可能為未來十年的計算機體系結構奠定根本性的基礎，至少為處理器乃至整個計算機體系結構做出了象征性指引。随着計算密度的提高，處理器和計算機性能的衡量标準和方式在發生變化，從應用的角度講，講究移動和偏向性能兩者已經找到了最令人滿意的結合點，并且有可能引爆手持設備的急劇膨脹。盡管現在手持設備也相對普及，在計算能力、可擴展性以及能耗上，完全起到了一台手持設備應該具備的作用；另一方面，講究性能的服務器端和桌面端，開始考慮減少電力消耗趕上節約型社會的大潮流。

Cell本身适應這種變化，同樣也是它自己創造了這種變化。因而從它開始就強調了不一樣的設計風格，除了能夠很好地進行多倍擴展外，處理器内部的SPU(SynergisticProcessorUnit協同處理單元)具有很好的擴展性，因而可以同時面對通用和專用的處理，實現處理資源的靈活重構。也就意味着，通過适當的軟件控制，Cell能應付多種類型的處理任務，同時還能夠精簡設計的複雜。

圖書信息

基本信息

書名: 計

算機體系結構

作者：吳豔霞

出版社：清華大學出版社

出版時間： 2010年10月1日

ISBN: 9787302231301

開本： 16開

定價: 29.80元

内容簡介

《計算機體系結構》在介紹計算機系統結構的基本概念、原理、結構和分析方法的基礎上，着重闡述了計算機系統的并行化技術，旨在幫助學生在建立計算機系統的完整概念，充分掌握計算機系統結構的最新研發思想與技術。

《計算機體系結構》共分5章。第1章論述計算機系統的概念及其設計原則，通過對馮·諾依曼計算機模型指令集的分類，簡要闡述計算機系統發展的脈絡及與體系結構發展密不可分的核心領域的現狀與發展，最後簡單介紹幾種先進的微體系結構；第2章論述流水線的基本概念、分類及性能計算方法，并以DLX模型為實例詳細描述流水線執行的關鍵技術，并對流水線中相關和沖突問題進行重點闡述；第3章通過指令級并行概念的介紹，詳細闡述實現指令級并行的關鍵技術和算法；第4章為“存儲系統”，重點講述虛拟存儲系統，Cache存儲系統及并行主存系統；第5章詳細介紹輸入輸出系統，講述總線類型、控制及通信方式，并詳細闡述中斷系統及總線與CPU及存儲器的通信原理。

《計算機體系結構》可作為高等院校計算機專業的高年級本科生，或研究生的教材，也可作為從事計算機體系結構或嵌入式系統設計的工程技術人員的參考書。