曙光一號并行計算機(以下簡稱曙光一號)是 1993 年我國自行研制的第一臺用微處理器芯片(88100 微處理器)構成的全對稱緊耦合共享存儲多處理機系統(tǒng)(SMP),最大支持 16 個 CPU(4 CPU 共享存儲為一結點主板,4 個主板通過 VME總線連接),系統(tǒng)外設采用 SCSI 設備,系統(tǒng)峰值定點速度每秒 6.4億,主存容量最大 768 MB。在對稱式體系結構、操作系統(tǒng)核心代碼并行化和支持細粒度并行的多線程技術等方面實現(xiàn)了一系列的技術突破。硬件的技術突破包括多處理機共享內部總線協(xié)議設計、多機中斷控制器芯片設計等;軟件包括 SNIX (Symmetric uNIX) 操作系統(tǒng)采用的細粒度加鎖以及動態(tài)分配 I/O 中斷向量以實現(xiàn)多機系統(tǒng)對稱式處理的方法;在 UNIX 核心中增加共享資源進程以及成群調度 ( Gang Scheduling) 策略,在用戶空間以庫函數(shù)的方式實現(xiàn)線程 ( Threads) 概念,支持中微粒度的并行計算等。 同時作為具有市場競爭力的產(chǎn)品,曙光一號折價 2000 萬人民幣知識產(chǎn)權,吸引資金成立曙光信息產(chǎn)業(yè)有限公司。以曙光一號技術為源頭,開發(fā)出曙光機兩個系列20多種服務器產(chǎn)品(曙光天演、曙光天闊),創(chuàng)造出巨大的社會與經(jīng)濟效益。曙光一號同時還得到不少的榮譽:包括科學院科技進步特等獎、國家科技進步二等獎等。1994 年被認為是國內科學技術的主要成就之一,寫入當年全國人大八屆二中全會李鵬總理的政府工作報告。
曙光一號的研制過程包括準備(1990.5-1992.2)、攻堅(1992.3-1993.10)及應用(1993.11-1995.6)三個階段。第一階段開始于計算所國家智能計算機研究開發(fā)中心(以下簡稱智能中心)軟硬件組成立;第二階段開始于陳鴻安、樊建平、劉金水等人集中于美國硅谷“封閉式”攻關;第三階段從開發(fā)早期的 Internet 服務器、及后來成立曙光公司為標志。曙光一號的研制過程中凝聚了很多人的辛勤勞動,包括早期參加決策的領導、專家,攻關過程中的眾多科研人員以及應用過程中的相關人員。以下我們將從曙光一號技術準備與決策、攻堅、應用等幾個階段回顧曙光一號的誕生,以及涉足各個階段的相關人員。由于以下描述的過程均發(fā)生在 6 年前(有的超過 10年),如有疏漏望諒解。 一、決策與技術準備階段
智能中心成立之初,集中兩年左右的時間,不斷論證技術發(fā)展思路,為曙光一號并行計算機的研制任務的決策與任務的下達進行準備,同時進行技術與人才的儲備工作。
曙光一號采用多處理器共享存儲并行體系結構,今天看來是較自然的選擇,當時卻很困難,主要影響決策的幾個因素包括:日本第五代智能計算機計劃(Prolog, Lisp 專用機策略);國內外傳統(tǒng)大型機發(fā)展思路的慣性(采用集成電路設計運算控制器主板而非采用商品化的微處理器);并行計算機初期發(fā)展的不確定性等。參與決策者包括當時國家科委高新司冀復生總工、863計劃智能計算機專家組汪成為等人。最終選擇多處理機服務器方案,以下四點是主要的原因:a. 與傳統(tǒng)的小型機(VAX 機)、大型機(IBM mainframe)比較,多處理機服務器在性能價格比方面有明顯優(yōu)勢;b. 并行機技術國外也不十分成熟,沒有形成一家壟斷的局面,我們有可能迎頭趕上; c. 多處理機關鍵技術是軟件,技術難點的轉移對我們有利;d. 一旦掌握多處理機技術,易形成高性能計算機系列產(chǎn)品。當時美國加洲大學 Belkely 分校的 David patterson 教授和 Princeton 大學的李凱教授也給了很多的建議與幫助。 人才與技術儲備方面,智能中心1990年3月成立,到1991年3月基本形成了以剛畢業(yè)的碩博士為主的技術隊伍。中心主任李國杰,下設系統(tǒng)軟件組、硬件組、應用組、理論組。軟件組組長樊建平,組員包括王永杰、劉文卓、劉宏、戰(zhàn)超、孫培興、劉曉華、孫凝暉等。硬件組組長陳鴻安,組員包括李如昆、杜曉黎、曾嶸、董向軍、張艷、梁雪、熊勁等。應用組包括韋明、隋雪青、吳建明、封勇、楊堅、賴曉婧等。理論組組長白碩,組員包括曹存根、閻保平、楊莉等。當時計算機研制方面有經(jīng)驗者包括陳鴻安、李如昆及在攻堅階段加入的劉金水等,其他人是第一次從事計算機研制方面的工作。 軟件組前兩年主要的工作包括對 AT&T UNIX V3、V4、BSD 3.2、CMU MACH1.0 等操作系統(tǒng)核心代碼, BIOS 及相關工具(Cross Compiler, sccs 等)分析、掌握。硬件組開展的工作包括各種微處理器芯片及接口芯片的理解、多機系統(tǒng)的構成、硬件設計工具的使用等。研究成果以論文、專著的形式進行發(fā)表,為曙光一號及后來的曙光1000 的發(fā)展打下堅實的基礎。這一期間東南大學的黃大海同志在操作系統(tǒng)的理解方面給了很大的幫助。
二、攻堅階段
1991年11月 左右曙光一號采用 Motorola M88100 微處理器,共享存儲多機系統(tǒng)(單板共享 4 CPU),通用開放系統(tǒng)結構(UNIX 操作系統(tǒng))的總體方案確定。88K 處理器的開發(fā)機以及 AT&T UNIX 操作系統(tǒng)的源代碼均已訂購。此時夏培肅院士的碩士學生劉金水作為硬件設計的主要人員從航天工業(yè)總公司 706 所全職參加到曙光一號的設計中來。1992年3月,考慮到國內購買硬件器件速度慢,操作系統(tǒng)、部件與工具廠商技術支持弱,高密度生產(chǎn)技術缺乏等因素,智能中心組織了陳鴻安、樊建平、劉金水、李如昆、王永杰等人到美國硅谷進行曙光一號的封閉式開發(fā)。出發(fā)前開了誓師大會,提出了“人生能有幾回博”激動人心的口號,開始了 11 個月左右大家后來戲稱為“美國洋插隊”的生活。 課題組在美國工作與生活的地方已由先期到達美國的計算所研究人員賈沛長負責安排。生活處為一美式獨居小院,4個臥室,廚房與客廳很大。辦公處距生活處汽車要開 20 分鐘左右。為方便加班,大家決定將辦公地點設在客廳中。這樣除與外界接觸(如:部件廠商的技術交流、生產(chǎn)談判等)仍然安排在原辦公處外,其他的生活與工作活動就都在生活處進行了。
美國期間的工作分總體方案完善、設計、生產(chǎn)加工及部分調試幾個階段??傮w方案的完善持續(xù)一個多月,主要是多處理機中斷控制器的設計與實現(xiàn)方面。這一期間與國內交流最密切,傳真頻繁(當時計算所很難接收 E-mail)。國內軟件與硬件組的部分人員繼續(xù)配合曙光一號硬件及并行程序設計環(huán)境外,同時抽調部分人員組成曙光1000 組,開始曙光1000 早期預研工作。 曙光一號的硬件設計在 1992年9月 左右結束,10 月完成主板設計并進入PCB板的設計和生產(chǎn),11 月左右中斷控制器的 FPGA 完成。1992.12-1993.1 進行 BIOS 與 Monitor 的初步調試。軟件設計與調試與硬件并行展開,BIOS、Monitor 及操作系統(tǒng)的改造與移植在開發(fā)機模擬環(huán)境下按計劃進度進行,沒有發(fā)生大的失誤,基本匹配了硬件的開發(fā)速度。生活方面大家分組以一個星期為單位進行輪班做飯。晚飯后的散步或騎自行車(從鄰居家中購買)成為早期的主要娛樂與體育鍛煉的方法。后來購買了一輛二手汽車,學習開車(為省錢自學為主)及進行駕駛執(zhí)照的考試成為另一種娛樂活動。 1993年2月,我們帶著已進行初步調試的幾塊曙光一號主板回到國內。與國內的同事開始聯(lián)調及軟件的移植工作。硬件、Monitor、BIOS 及操作系統(tǒng)核心的調試工作在回來兩個月后基本完成。由張兆慶、喬如良領導的并行編譯組、劉曉華進行的Express 編程環(huán)境、孫凝暉等進行的計算性能測試與優(yōu)化、隋雪青等進行的數(shù)據(jù)庫移植與事務處理的測試等工作在后來的2-3個月內逐一完成。同時將863的研究成果在曙光一號上進行集成,包括石油大學開發(fā)的“Powel—油氣田布井決策系統(tǒng)“,浙江大學開發(fā)的智能軟件開發(fā)環(huán)境KMEPS,華中理工大學開發(fā)的地圖數(shù)據(jù)庫管理系統(tǒng)MDB,西安交大開發(fā)的LISP/CLOS 系統(tǒng),科學院系統(tǒng)所開發(fā)的幾何定理證明軟件系統(tǒng),以及清華大學移植的Ingres 數(shù)據(jù)庫等。93年10月由科技部組織國內的專家學者進行了成果的技術鑒定工作。成果受到好評,當時的科學院副院長胡啟恒稱曙光一號咬住國際高性能計算機發(fā)展的“尾巴”。 曙光一號部分研制人員(樊建平、陳鴻安等)在曙光一號鑒定完后轉入曙光1000組,與原硬件組、軟件組的人員一起從完善曙光1000原型系統(tǒng)的總體實施方案入手,投入到曙光1000的研發(fā)過程中;部分人員回到原單位(劉金水),部分人員出國(李如昆、王永杰等)。曙光一號的推廣應用工作交由當時智能中心成立的成果推廣部實施(組長張玉志,組員包括楊檳等),開始基于曙光一號知識產(chǎn)權成立曙光信息產(chǎn)業(yè)有限公司的早期融資活動。1994年8月,曙光1000的8節(jié)點原型系統(tǒng)已可運行,曙光一號的融資活動已進行高峰期。智能中心的領導決定成立基于原曙光一號組人員的曙光計算機部,樊、陳又從曙光1000組抽回,開始人員的招聘,后續(xù)產(chǎn)品的開發(fā)(基于PowerPC芯片的曙光天演)以及曙光一號生產(chǎn)與銷售的支持工作等。該部門最后成為1995年曙光公司成立時的三個事業(yè)部之一:曙光計算機事業(yè)部。當時陸續(xù)開展的研發(fā)工作包括基于曙光一號的Internet 服務器和鄭州電子工程學院和郵電大學的協(xié)作項目基于曙光機的智能網(wǎng) SCP 平臺,1—2CPU 的 PowerPC SMP 升級服務器,雙機HA高可用系統(tǒng)等。 三、應用情況
曙光一號在設計階段的一個理想就是能成為產(chǎn)品而非僅僅是科研成果,鑒定會已是它的市場推廣會。曙光公司成立前,曙光一號已在教育行業(yè)(中國科技大學、武漢大學)、信息服務(1994年開通國內第一個BBS網(wǎng)站——曙光BBS 站,三期日貸項目北京信息中心)、軍隊(總后油庫管理)、政府(國家科委辦公自動化)、援外項目(埃及穆巴拉克科學園)等項目上進行了成功的銷售。曙光一號累計生產(chǎn)與銷售20多套。曙光公司成立后,以曙光一號技術為源頭,智能中心與曙光公司逐步發(fā)展出兩個系列的產(chǎn)品曙光天演UNIX 服務器系列及曙光天闊PC 服務器系列,1997年已達20多個品種。曙光計算機多次參加國際及國內的服務器競標(包括世行、亞行、日貸),大大降低國外主流廠商在中國銷售服務器的價格(科技部估算僅此一項的社會效益超過 2 億美圓以上)。曙光機被成功應用到數(shù)十個行業(yè),促進傳統(tǒng)行業(yè)的信息化進程,這些行業(yè)包括:科研、教育、政府、石化、電信、軍隊、保險、交通、出版、銀行等。目前曙光服務器累計銷售1萬多套,產(chǎn)值3億以上,曙光已成為中國高性能服務器的著名品牌。