二進位的世界:記憶體發展簡史 / DDR4 VS. DDR3 效能評測
無論是個人電腦,或是今日最夯最潮的手持式智慧行動裝置,記憶體都是不可或缺的一項重要元件。隨著科技的日新月異、及製程與良率的提昇,記憶體效能有著讓人眼睛為之一亮的成長。
經歷過群雄併起的競爭與整併,目前記憶體顆粒大廠已是屈指可數,相較於十年前晶圓、顆粒的洛陽紙貴,今日模組在價格上的親民化與平價化,對於個人電腦的普及更是有著功不可沒的貢獻。
除此之外,記憶體技術各領域的應用,諸如:數位相機、隨身碟、手機等,皆對人類文明的發展,有著更上一層樓的突破。因此,筆者這次便淺談記憶體的發展史及其相關運用,希望大家能夠有一個基本而簡單的瞭解。
0與1、開與關
現行主流的電腦系統裡,運算作業一直都是二進位的世界。那麼,為何人類在日常生活中,大多時候都使用十進位,為什麼電腦卻要設計成二進位呢?這是由於0與1兩種資料訊號,剛好可以對應物理材料的「開」與「關」,使得實體世界與作業系統的運算空間,有了一道銜接的橋樑。
西元1958年對電腦來說是一個轉捩點,基爾比與諾義斯兩人創作出積體電路,將原本體積龐大、笨重的繼電器電路,轉化成模組化微晶片模式,透過積體電路上電流的通過與否,這兩種相反的狀態來表示0與1,也就是不通電代表0,而通電代表1。自此,每一條電路,都可以記錄成0與1兩種狀態變化(Binary Digit),而摘自Binary的B結合Digit的it,我們就定義命名積體電路工作時的數據資料為Bit,也就是今天眾人耳熟能詳的位元。
圖 / 積體電路是一種把電路,主要包括半導體裝置,被動元件等小型化的方法,將電路映射在半導體晶片表面上的積體電路,又稱薄膜(thin-film)積體電路。由獨立半導體裝置和被動元件,整合到基板或線路板所構成的小型化電路,稱之為厚膜(thick-film)積體電路。
二進位的大千世界
前文提到,在數位資料的組成當中,最小單位是位元(bit),每個位元即代表0或1,對應到實體元件上,即為開與關;自此,硬體世界裡的開與關,和軟體園地裡的0與1,兩者之間開始有了一個完美的映射關係(Mapping)。
如果我們把位元想像成電燈,那麼一個電燈的開與關,可用(0,1)作為描述符號;但如果要讓以無數電路組成的電腦,模擬出人類慣用的十進位數字規則(0 ~ 9),單只有一個位元是不夠的,至少必需要四個位元才足夠涵括。
像0101和1001就是兩種不同的變化,因此四個位元總共有24種組合,也就是有0 ~ 15共計十六種變化。雖說四個位元已經超過了十進位中0到9,總計十種字元的需求,但科學家卻也因此順水推舟,發展出一套十六進位的系統,將每個位元善加利用。
圖 / 四種主流進位制的等價關係表,稍懂原理即可輕鬆換算,以十六進位常見的FFFF為例,即為十進位世界裡的65535。
八位元 位元組
在十進位的基礎下,我們若想讓電腦使用26個英文字母及0~9共十個阿拉伯數字,則總共需要36個符號字元,換算之下,五個位元只能涵括32個符號字元,總計至少需要六個位元,方能加以完全涵括。
我們知道,六位元總共有六十四種變化,因此還可以表示英文字母的大寫與小寫與0 ~ 9十個數字。演變到最後,今日我們在鍵盤上所看到的各種符號字元,基本上都有一個對應的位元碼,像是英文字母大寫B,二進位表示即為01000010。
如此一來,只要使用者能把某件工作轉換成一個純粹的「運算問題」,並且以鍵盤組合出來的語言丟給處理器計算處理,那麼電腦就可以處理所有現實生活中,你所能夠以鍵盤組合出來的各種問題。
而這些鍵盤中常用的各種符號字元接近兩百五十六種,因此,很自然地我們便以八位元(2的8次方=256)當成一個組合,稱之為位元組(Byte),成為資料傳輸的基本單位。而在記憶體內部,最小定址單位即為一個位元組。換句話說,你無法單獨存取1 bit的數據或者任意小於一個位元組的資訊。
圖 / 把八個位元想成八個電燈開關,每個電燈都有開與關(0與1)兩種狀態,因此總共有28種組合,其中00000000是第一種狀態,11111111是第兩百五十六種狀態,總計有256種狀態。
圖 / 把八個位元想成八個電燈開關,每個電燈都有開與關(0與1)兩種狀態,因此總共有28種組合,其中00000000是第一種狀態,11111111是第兩百五十六種狀態,總計有256種狀態。
GB級主流世代
上一段提到,位元組(Byte)是電腦內最基本的傳輸單位,再往後則每乘以1024來增加一個單位量級,換言之,1KB(Kilo Byte)等於1024 個 Byte、1MB(Mage Byte)等於1024個KB、1GB(Giga Byte)等於1024 個 MB、1TB(Tera Byte)等於1024 個 GB、1PB(Peta Byte)等於1024 個 TB、1EB(Eksa Byte)等於1024 個 PB。
在2015年的今天,無論是手機或是個人電腦,記憶體與處理器之間的數據傳輸,已經走到GB級世代。消費級主機板搭載2~8條記憶體插槽,X99晶片組最大支援至128GB,隨著處理器的運算速度越來越快,傳輸的數據越來越多,只要記憶體儲放資料的空間夠大,實體位址足夠應付傳輸數據不被塞滿,那麼作業的流暢度也就會更無滯無礙。
圖 / 最新一代X99晶片組,支援DDR4記憶體,容量最大至128GB,運算傳輸能力更加強悍。
「揮發性」與「非揮發性」記憶體
除了容量之外,依據資料儲存能力與電源存蓄關係,記憶體主要可以分為揮發性記憶體(Volatile memory)與非揮發性記憶體(Non-volatile memory)兩大類;前者指的是當電源供應中斷以後,實體位址所儲存的資料便會消失的記憶體;後者即使電源供應中斷,實體位址所儲存的資料也不會消失,再經供電之後,便能夠繼續讀取資料的記憶體。
因此,從定義來看,插在主機板上的隨機存取記憶體,屬於揮發性記憶體;而我們主機板上的BIOS,其實就是非揮發性記憶體的一種組成系統,
當電腦載入主要作業系統之前,BIOS(基本輸入/輸出系統)是各項硬體元件的基本 I/O 控制程序之集合。BIOS寄存在EEPROM (Electrically Erasable Programmable Read Only Memory︰電子式可抹除可編程唯讀記憶體)上,演變到現在,多數主機板已經進化到把BIOS軔體存放於Flash ROM上,進化成UEFI(Unified Extensible Firmware Interface,統一可延伸韌體介面)。與早期PROM、EPROM相比,EEPROM、Flash ROM與UEFI具有可重複抹除覆寫的特性,方便BIOS進行軔體更新昇級,同時讓主機板廠與使用者雙方,都得到了更大的彈性。
圖 / 到了UEFI時代,BIOS不再是以往冰冷的籃底白字紅警框,除了版面更加清晰,隨手一切就能發現導入了圖型化設計,使得初學者也能更加快速的入門、上手。
源自蛋糕的隨身碟
在非揮發性記憶體領域成就上,最值得一提的,莫過於現任中央研究院院士、手機四大發明者之一,同時也是前國家奈米元件實驗室主任的華人之光─施敏博士。西元一九六七年,施敏博士提出記憶體浮動閘(floating gate)技術,直接促成了Flash Memory的誕生,現在我們常用的隨身碟、手機、數位相機、MP3等,無處不見Flash Memory的蹤跡,而施教授創造Flash Memory的發想則來自一個有趣的靈感。
某日午餐過後,施教授看到同事點了一塊蛋糕當甜點,中間層塗了一層可口的奶油,此時大師腦中的蘋果突然掉下來,想到何不在MOSFET中間加一層很薄的金屬層(也就是所謂的浮動閘)。此時,只要施加電壓,便可將電子導入浮動閘內並保存其中,同時更意謂著電路的導通性發生改變!這層金屬浮動閘的上下兩側皆屬絶緣體,因此除非再度施加反向電壓,否則電子會一直保存在裡面,因此與DRAM相比,擁有即使斷電資料也不會消失的優點。
這個原理和前文所述一樣簡單明確,金屬層浮動閘內存有電子時,電路無法導通,可視為0,反之當電子衝出浮動閘時即形成電流,則視為1。自此,第一個「非揮發性記憶體」於焉誕生。
圖 / Flash Memory主要有NOR與NAND兩種;前者常見於主機板BIOS,後者常見於一般消費性電子產品,諸如︰手機、隨身碟、SSD等。圖為大廠OCZ Vector 150 240GB固態硬碟。
揮發性記憶體(Volatile memory)
王安電腦於今日已成為歷史的一頁,但在電腦產業萌芽初期,王安電腦研發出磁圈記憶體(Magnetic Core Memory)作為記憶體元件,這項劃時代發明徹底終結了電腦的真空管時代,進一步將電腦往半導體時代推進。隨後,施敏博士研發的快閃記憶體(Flash Memory)改善了磁圈記憶體巨大笨重的缺陷,有望取代磁圈記憶體的地位一躍而上。
不過命運之神總愛開玩笑,幾乎與施敏博士在同一時間,科技巨擘IBM於西元一九六七年,提出了DRAM(Dynamic random access memory,動態隨機存取記憶體)技術規格,隨後DRAM便在IT領域裡一炮而紅,而一直到二十年後,當諾基亞、易利信、摩托摩拉等手機大廠,在遍尋不著同時擁有輕薄、省電、具記憶性的通訊記憶體元件時,具備非揮發性特徵的快閃記憶體才一鳴驚人,立即迅速地被廣泛地推廣到各種領域,開發出不同應用層面的產品。
DRAM與Flash Memory最大的差異在於前者一個位元只使用一個電晶體,而電晶體僅能維持幾毫秒的帶電狀態,因此它必須不斷地充電,以保持記憶體內的資料不致流失,是故這是一種揮發性記憶體(Volatile memory)。另一種不可不提的揮發性記憶體,當屬SRAM(Static Random Access Memory,靜態隨機存取記憶體),我們在中央處理器上的Cache即可以見到SRAM的蹤跡。
圖 / 王安電腦的磁圈記憶體終結了電腦的真空管時代,曾經獨領風騷一時,並進一步將電腦往半導體時代推進。(圖片來源︰維基百科)
靜態隨機存取記憶體(Static Random Access Memory)
還記得今年夏天,胖達在中山大學電腦營授課時,有位同學提出了一個好問題。「既然處理器上的L1、L2 cache那麼快,為什麼電腦平台記憶體不用SRAM取代、提速就好?何必搞什麼DDR3、DDR4!」
胖達只能說,這真是個大哉問!簡單來說,SRAM和DRAM一樣,都是由電晶體組成,通路代表1,斷路代表0,但是SRAM 對稱式的電路結構設計,使得每個記憶單元內所儲存的數值,都能夠以比 DRAM 還要快的速率被讀取。除此之外,由於 SRAM 多數都被設計成一次讀取所有的資料位元(Bit),比起DRAM在高低位址間的資料交互讀取,SRAM在工作效率上快上許多。
然而,SRAM最大的問題在於每一個儲存位元需要六個電晶體;相較之下,DRAM的優勢在於結構簡單,每一個位元的資料都只需一個電晶體作動,因此在成本上,SRAM遠比DRAM所費不貲之外,除非製程技術提昇,使得電晶體體積(Die Size)縮小,同樣尺寸大小的處理器才能塞進更多的電晶體,換句話說,SRAM的容量才有辦法拉高。
因此每一世代,晶圓廠製程更加先進,處理器Cache容量也才能隨之受惠、提昇。從廣義來看,這就是Tick-Tock戰略下的支脈延伸,是故總結而論,SRAM相對於DRAM來說,由於所需電晶體較多,因此體積也大上不少,同時成本也隨之居高難下,是以在不同元件的設計取向上,兩者各自發揮自我優勢,互擅勝場。
圖 / 摩爾定律是指同一個尺寸相同的晶圓上,所容納的電晶體數量,因製程技術的提升,每十八個月會加倍,但成本不變;電晶體愈多則晶片執行運算的速度愈快,當然,所需要的製程技術也愈加具有挑戰性。
動態隨機存取記憶體(Dynamic random access memory,DRAM)
DRAM之所以被稱為動態隨機存取記憶體,是因為必需周期性地不斷充電,才能夠保持資料的完整;相較Flash Memory,DRAM存取時間較長,且不具有記憶性。不過,由於製造成本低廉,且當年IBM在制定規格時,又具有一鎚定音的影響力, 因此DRAM最後在這場競爭中脫穎而出,擊敗了施敏博士的Flash Memory,成為了電腦系統中記憶體規格的主流。
之後不斷螁變、進化,演義迄今,為個人電腦及伺服器所廣泛使用。其作用主要用以儲存執行作業所須的暫時指令以及資料,使電腦的中央處理器能夠更快速讀取儲存在記憶體的指令及資料,確保電腦能以更短的時間來執行作業,而使工作能夠更迅速地完成。
依製作方式的不同,DRAM可分為SIMM(Single In-line Memory Module,單線記憶模組),及DIMM(Dual In-line Memory Module,雙線記憶模組);前者常見於早期的30 Pin或 72 Pin 的 DRAM,部份168 Pin的SDRAM亦為如此設計。SIMM特徵在於記憶體僅一面有IC與顆粒,而另一面則沒有,故又被稱為單面記憶體;而DIMM顧名思義則是兩面皆有IC與顆粒佈局其中,也是現今的主流設計。另一方面,一般在不討論特殊規格的情況下,比較普及的記憶體的種類大致可分為以下四大種類,分別是FP RAM (Fast Page RAM)、EDO DRAM(Extend Data Out Dynamic Random Access Memory)、RDRAM(RAMBus Dynamic Random Access Memory)、以及SDRAM(Synchronous Dynamic Random Access Memory)。
圖 / 其實Intel H61晶片組的發佈還是不久以前的事,但最多只能安裝兩條記憶體;就算是少數有四條記憶體插槽的H61主機板,也只能安裝4條「單面」SIMM記憶體。這樣的設計,使得當年許多DIY使用者在昇級時買錯記憶體,到了7系列晶片組後,幾乎所有的新產品都已取消類似設計。
圖 / 由上至下,這四種記憶體都曾是主流,現在已經是昨日黃花。其實每一種記憶體都有其可歌可泣的歷史,但礙於胖達確實是一個懶人,因此無法在這篇文章裡完整交待完畢,只能概述而過。
FP RAM(Fast Page Random Access Memory)
Fast Page DRAM,簡稱之為FP RAM,是被廣泛運用的一種改良型DRAM,主流區分為30pin與72pin兩種規格,工作電壓為5V,主流容量僅有1MB和2MB兩種可供消費者選擇。30pin FP RAM頻寬為8bit,常見於XT/AT 286、386和486電腦當中,一次至少需要安裝四條;72Pin FP RAM頻寬為32bit,需成對使用,常見於486電腦中,少數初期Pentium電腦也看得到72pin FP RAM的蹤跡,但並不常見。FPRAM在當讀取同一列資料時,可連續傳送行位址,不需再送列位址,即可讀出多筆資料,雖然在當時頗為先進,但在現在看來是非常沒有效率的工作方式。而FPRAM最大的問題在於時脈頻頸為66 MHz,跟不上中央處理器的工作速度,因此,隨著處理器的進化,FP RAM也隨著成為昨日黃花,消逝在歷史的洪流裡。
圖 / 這是特規4MB FPRAM,奠定了今日記憶體模組的外貌原型,當年要價所費不貲,但今天只能在工業控制領域偶爾瞥見了。
EDO RAM(Extend Data Out Dynamic Random Access Memory)
EDO RAM採用SIMM(Single In-line Memory Module)插槽,是美光(Micron)公司的專利技術;主要有72pin 和168pin之分,工作電壓為5V,頻寬32bit,由於自Pentium處理器以降,資料頻寬是以六十四位元運作,因此EDO RAM必需成對使用,只插單條無法運行。EDO RAM 是由傳統 FPRAM (Fast Page RAM) 中演化改善而來,在早期,資料傳輸運作上主要假設下一次的存取地址都是與上一次連續,系統運作前準備將資料妥善定址,這樣便能把記憶體資料吞吐量由前一代FPRAM 的最高 176MB/s 提升到 EDO RAM 的最高 264MB/s,因此,於1993 年後 EDO RAM 便開始取代FPRAM所扮演的角色,並常見於486及早期 Pentium 系列個人電腦,若家中還有十多年前的個人電腦,不妨可以拆開來一睹當年EDO RAM的風采。
EDO RAM當道時期,在x86領域裡Windows 95稱霸作業系統,這個時期主流Pentium處理器還只有三十二條定址線、晶片組沒有re-mapping技術,當然作業系統也就還沒有PAE功能,這因為規格制定者,沒有想到技術與製程演進速度如此之快的緣故,也因此後續還衍生出一些像是32位元作業系統有4GB記憶體容量上限等議題,但今日皆已解決、問題亦不復見。
圖 / 胖達人生第一次手動昇級的記憶體,就是圖中的EDO RAM規格,容量也只有少少4MB,回想起來已經是快要20年前的事了。
圖 / 由「工作管理員」與「系統內容」頁面都可以發現,測試平臺32位元Win 7僅預設支援約3.5GB記憶體容量空間,就算你像圖中插上6GB也無法完整抓到。
SD RAM(Synchronous Dynamic Random Access Memory)
當時在 Intel Celeron 系列以及 AMD K6 處理器以及相關的主機板晶片組推出後,EDO DRAM 的性能再也無法滿足系統需求,記憶體技術必須徹底革新,才能滿足新一代 CPU架構的需求;此時記憶體開始進入極為經典的 SD RAM 時代。
SDRAM所插的插槽叫DIMM(Dual In-line Memory Module),因其兩側的金手指所傳的資料不一樣故得其名,本體雖說是168Pin,但是單面只有84Pin;又由於當時常見的筆記型電腦,其DIMM為144pin,比桌上型電腦的還短,因此又常稱168Pin的DIMM為Long DIMM。
第一代 SDRAM 記憶體工作頻率為66MHz(PC66),但很快由於Intel和AMD的頻率之爭,將CPU外頻拉高到100MHz,所以PC66記憶體很快就被PC100記憶體取代,接著133MHz外頻的PIII以及K7時代於焉來臨。此外,PC133規範也以相同的方式進一步提升SDRAM的整體性能,大幅將頻寬提高到1GB/sec以上的理論值。由於SDRAM 為六十四位元之規範 ,正好對應處理器六十四位元的資料頻寬,也因此它只需要單條記憶體便可穩定工作,方便性進一步提高。在性能方面,由於其輸入輸出信號保持與系統外頻同步,因此速度明顯超越EDO記憶體。
不可否認的是,雖然SDRAM由早期的66MHz,發展到後來的100MHz、133MHz ,儘管沒能徹底解決記憶體頻寬的瓶頸問題,但在這個時期「超頻」已經成為DIY用戶永恆的話題,不少玩家將某些知名大廠的PC100記憶體超頻到133MHz使用,為中央處理器的超頻取得更大的成功及效益。值得一提的是,當時為了方便一些超頻用戶需求,市場上出現了一些 PC150、PC166規格記憶體。儘管PC133記憶體在當時高達 1064MB/sec已是劃時代的突破,但此時 Intel已經開始著手Pentium 4的接班計劃,是故PC133 SD RAM已然無法滿足時代的需求,於是一場「誰是接班人」的好戲緊接而來,DDR RAM和RAMBUS的奪位大戰硝煙瀰漫、一觸即發。
圖 / 這是一對512MB PC133 SD RAM,剛推出時售價約兩萬元台幣,反觀今日記憶體價格,DIY玩家們實在是太幸福了。
圖 / 筆電專用的短版記憶體,常稱之為SO-DIMM;現今主流DRAM SO-DIMM針腳為200Pin。圖為 Apacer黑豹金品系列。
DDR SDRAM(Double Data Rate Synchronous Dynamic Random Access Memory)
Double Date Rate SDRAM 簡稱 DDR SDRAM,顧名思義也就是「雙倍速率 SDRAM」的意思。DDR SDRAM可以說是SDRAM的升級版本。DDR SDRAM在時脈訊號上升端與下降端時各傳輸一次數據,這使得DDR SDRAM的資料傳輸速度為傳統SDRAM的兩倍, 由於只多添加了下降端訊號,因此並不會造成功耗上的增加,另一方面,在定址與控制信號部份,DDR SDRAM則與傳統 SDRAM相同,僅在時脈上升端傳輸,為當時x86架構的相容性與速度的提昇作了最好的折衷。
DDR可說是作為一種在性能與成本之間妥協的解決方案,其戰略是迅速建立起牢固的市場空間,繼而一步步在頻率上高歌猛進,最終彌補記憶體頻寬上的不足。
第一代 DDR200規範並沒有得到普及,第二代PC266 DDR SDRAM(133MHz時脈×2倍數據傳輸=266MHz頻寬)是由 PC133 SDRAM記憶體所衍生出的,它將DDR記憶體帶向大眾市場第一個高潮,直到目前,還有少數老用戶家裡使用的賽揚和AMD K7處理器都採用DDR266規格的記憶體,到後來的DDR333 記憶體也只屬於一種過渡規格,在數年前DDR400記憶體成為800FSB處理器搭配的基本標準,隨後的 DDR533 規格,則成為超頻用戶的選擇對象;而DDR400記憶體最後也一統江湖,成為了當時平台之主流。
圖 / 圖為512MB DDR400 SDRAM,這個時期的記憶體雖然仍不便宜,但比起RDRAM的天價已算相當平實。Kingston在這個時期累積了良好的口碑,佔有率大幅提昇,今日穩居霸主地位。
RDRAM(RAMBus Dynamic Random Access Memory)
RDRAM採用RIMM ( Rambus In-line Memory Module) 插槽,是由RAMBus與Intel共同提出,頻寬16bit,有184pin和168pin之分,工作電壓為2.5V,工作頻率達600、800、1066MHz,對應命名為PC600、PC800、PC1066規範。
RDRAM相對常見於Intel PIII、P4電腦。在當時原本很有發展潛力,在規格剛發表的同時,一時之間有和DDR SDRAM一決高下,取代SD RAM的趨勢;但由於製作成本過高,導致許多記憶體大廠興趣缺缺,而不巧屋漏偏逢連夜雨,當時Intel Pentium4處理器的效能又被AMD K7陣營壓著打,Intel陣營Pentium4處理器綁RAMBUS的作法,反應在零售價上,消費者也不願買單;一時之間,零售市場紛紛轉向AMD K7綁DDR SDRAM的高CP值組合,因此最終RDRAM在普及率上完敗給DDR SDRAM,因此市場上並不常見。
但值得一提的是,當年三大次世主機︰SONY的初代PS、SEGA的SS、與任天堂的N64的大戰之中,任天堂為了取得主機性能上的優勢,斷然採用了RDRAM這項高成本的產品,而SONY因見到RDRAM相較於其他規格記憶體上的優勢,在PS2主機上也使用了32MB的RD RAM。
圖 / 拆開任天堂64遊戲器,可以清楚發現RDRAM的身影躍然其上。
DDR二代目
隨著處理器性能不斷提高,眾人對記憶體性能的要求也愈加狂熱。因此JEDEC組織很早就開始醞釀DDR2標準,加上當時Intel首先發難,宣佈LGA775腳位的915/925平台開始對 DDR2記憶體的支持,於是DDR2記憶體便一路活躍記憶體領域迄今。
DDR2能夠在100MHz的頻率基礎上,提供至少400MB/s的頻寬,同時運作電壓僅1.8V,採用FBGA封裝,從而進一步降低電腦運作時所產生的廢熱,並拉高運行頻率。此外,DDR2融入CAS、OCD、ODT等新性能指標和中斷指令,提升記憶體頻寬的利用率。從JEDEC組織者闡述的DDR2標準來看,針對PC等市場的DDR2記憶體擁有400、533、667MHz等不同的時脈頻率,最後由於全球大廠的瘋狂競爭,一舉將DDR2記憶體的時脈標準拉高至800,甚至可見1000MHz等更高的頻率;時至今日,許多人正在使用的電腦上,主機版上正是插著DDR2 SDRAM。
圖 / 加入CAS、OCD、ODT技術規範的DDR2,相對元祖SDRAM與初代DDR,有更好的運作效率。
DDR三代目
DDR3 SDRAM是目前零售市場上,速度最快的記憶體種類。DDR3 SDRAM為了更省電、傳輸效率更快,使用了SSTL 15的傳輸介面,工作電壓是1.5V,採用CSP、FBGA方式封裝,除了延續DDR2 SDRAM的CAS、OCD、ODT、AL等控制方式外,另外新增了更為精進的CWD、Reset、ZQ、SRT、RASR技術規範。
CWD是作為寫入延遲之用,Reset提供了超省電功能的命令,可供DDR3 SDRAM記憶體,實行顆粒電路運作停止、進入超省電待命模式;新增了SRT,可程式化溫度控制記憶體時脈功能,SRT的加入讓記憶體顆粒在溫度、時脈和電源管理上比起DDR 2有了極大的進化,可說是在記憶體內,就做了電源管理的功能,同時,更讓記憶體顆粒的穩定度也更加提升,確保記憶體顆粒不會因工作時脈過高時,發生燒燬的情況。同時DDR3 SDRAM還加入RASR(Partial Array Self-Refresh)局部Bank刷新的功能,可以針對特定記憶體Bank做更有效率的資料讀寫,以達到更加省電的效果。值得一提的是,DDR3皆為RoHS規格,保證無毒無害,更為綠色環保盡了一份心力。
DDR3還新增了重置功能(Reset),重置是DDR3新增的一項重要功能,並為此特定準備了一個引腳。DRAM業界很早以前就要求增加這一功能,直到如今,才終於在DDR3身上實現。這一引腳使DDR3的初始化處理變得簡單。當重置命令執行時,DDR3記憶體可以停止所有操作,切換至最少活動量的狀態,可使DDR3達到最節省電力的目的。
圖 / DDR3時代開始,市場開始流行Kit包,簡單來說,就是廠商挑選好同規格、同製程之同對同捆包,在超頻使用上更加穩定可靠。
DDR4記憶體 X99初登場
推出甫半年的X99平臺,首次導入了千呼萬喚始出來的DDR4記憶體模組。相較於DDR3記憶體,DDR4無論在外在或是內在上,都有了更大幅度的演進。首先,DDR3以前的記憶體,金手指都是以平直態在使用者面前呈現,而DDR4在金手指設計上,則略顯彎曲狀。
在防呆缺口上,DDR4比DDR3更加接近中間位置,而在金手指接點數量上,DDR4計有284個,比DDR3的240個多出了44個。而也因此,DDR4每一個接點之間的間距,從1mm縮短至0.85mm。
或許是mini-ITX與大型散熱器的流行,DDR3記憶體金手指是整片平直地埋在DIMM槽內,其接觸面積相較DDR4更大,摩擦力相對DDR3也來得更大。這對於空間有限的mini-ITX機殼或是大型散熱器卡高度的情況下,DDR3記憶體有時在安裝或是拔除上,必需得先將散熱器卸除才能順利進行。
仔細觀察DDR4金手指,可以發現中間部位稍顯突出,邊緣則漸為收矮,在中央的最高點與兩端的最低點之間,則帶以微彎曲線渡過。如此一來,DDR4金手指既能夠與DIMM插槽保有充足的訊號接觸面,在拔除記憶體時,也比DDR3來得更加輕鬆許多。
圖 / 上方為DDR4記憶體,下方則為DDR3記憶體,仔細觀察,你會發現DDR4記憶體的金手指並非平直到底,而是中間略凸,兩邊微有彎曲。
Bank Group 分組架構
相信大家對於DDR4最感興趣的,莫過於速度與容量上的提昇。從技術白皮書來看,DDR4每針腳位都可提供每秒256MB/s(2Gbps)傳輸速度,作個簡單換算,DDR4-3200的頻寬高達51.2GB/s,相較於DDR3-1866高出71. (www.disabilityhelpcenter.org) 5%,更不用說白皮書中表明DDR4頻率可達4266MHz。
我們知道,DDR記憶體在歷代演化的過程中,都採用了所謂的資料預取機制(Prefetch),理所當然DDR4也採用了這項機制。不過,到了DDR4世代,在資料預取上仍沿用DDR3的8n資料預取架構而未有提昇,因此最終DDR4導入了Bank Group分組架構,作為提昇效能的手段之一。
簡單來說,在DDR4的每個Bank Group中,都可以獨立讀寫資料,而Bnak Group可以選擇2個或4個獨立分組,而DDR4模組內的每單位Bnak Group都可獨立進行讀取、寫入、喚醒及更新等動作。從數量來看,如果記憶體內部設計了2個獨立的Bnak Group,那麼資料預取則來到16n;如果使用了4獨立的Bank Group,那麼資料預取則一口氣提高到32n。
換言之,如此一來,資料吞吐量得到了直接有效的提昇,其等效頻率也隨之受益匪淺;一言以蔽之,Bnak Group是DDR4提昇頻寬的關鍵技術之一。
圖 / 前後兩代DDR記憶體比一比,其實兩者在高度上就略有差異。此外,PIN腳數量、間距也有所不同,雖然歷代DDR都採用了資料預取機制(Prefetch),但最終DDR4導入了Bank Group分組架構,作為提昇效能的手段之一。
DDR3 多點分支單流架構
我們知道,DDR3採用多點分支單流架構,在同一條通道下,可以掛上許多同樣規格的記憶體晶片。這樣的設計有一個明顯的缺點,那就是一旦當資料傳輸量超過通道最大承載量時,就算記憶體容量提高再多,效能的提昇也是微乎其微。
簡單打個比喻,記憶體容量就好像注水量,只要注水量不超過水管通道傳輸量,那麼只要專注提昇注水量,那麼最後累積的總水量就會得到顯著的提昇;反之,一旦注水量已大於水管傳輸量時,此時再去增加注水量,對於單位時間內的總水量成長幫助不大。
換言之,將記憶體從2GB昇級到4GB,你可以感受到速度變快、效能提昇,那是因為傳輸通道還沒被吃滿,但只要容量往上遞增,在效能增長上的邊際效益將會在達到臨界點時失去動力。總評而論,DDR3的多點分支單流架構,在記憶體容量上的增加很簡單,但很容易受到單條寶貴的傳輸頻寬之限制。
圖 / 簡單來說,DDR3採用了大水庫理論,所有資料集中到一根大水管後送出。而DDR4則採用點對點分流架構,當每一條水管流量都很大時,累加起來的流量則會超過單一條大水管,而且還能避免瓶頸效應拖慢整體效能。(圖片來源︰PC Watch)
DDR4 點對點傳輸架構
在新一代DDR4的架構中,傳輸部份採用了點對點設計,也就是每一個晶片控制器對應專屬唯一的通道,也就是說一口出水井只對應一條輸水管,如此一來就不易受到瓶頸效應所帶來的限制,模組設計更加簡化、頻率提昇也更加容易。
但點對點傳輸架構的缺點也相當明顯,因為點對點的每條通道只能對應一根記憶體,如果單條記憶體容量太小,就像單口井的出水量太少,那麼總傳輸量也就是總出水量,甚至有可能比DDR3的多點分支單流架構還要來得少。
解決這個問題的方法既直接又簡單,那就是只要把單條記憶體的容量拉大就好啦!老實說,鍵盤上打字增加容量很簡單,實務上可沒那麼容易,不然現在記憶體早就一條16GB滿街跑了。
行文至此,我們得把因果關係倒過來看,事實上,是晶圓廠的輪班星人們先發展出所謂的3DS(3-Dimensional Stack,3維堆疊)製程,使得單顆晶片的容量增加,最終才能使得整條記憶體模組的容量一舉擴大。也因為有3DS製程,DDR4導入了點對點傳輸架構,在效能提昇上才有了實質意義。
圖 / 因為有了3DS堆疊封裝製程,得以讓單條DDR4記憶體容量得以更大,才使得DDR4的點對點傳輸架構變得有意義。
TSV矽穿孔 3DS堆疊封裝
3DS製程最早由美光(Micron Technology)所提出,這是一種堆疊封裝技術,而實作手法又有兩種,一種是單顆晶片在封裝完成後,在PCB上堆疊;另一種則是在晶片封裝之前,在晶片內部進行堆疊。在絕大多數的情況下,只要能夠解決散熱問題,內部堆疊封裝可以一舉大幅降低晶片面積,最大的好處就是對於製成品的小型化有相當大的幫助。
在DDR4中,實現3DS堆疊製程的關鍵推手,則是矽穿孔技術(TSV,Through Silicon Via)。TSV以雷射或蝕刻為手段,在矽晶圓打出一個小洞,然後以導電材質穿過這個小洞後將多個矽晶圓串接起來,此後不同矽晶圓之間的訊號便得以傳輸。
也就是說,透過3DS製程的堆疊封裝,使得單一晶片的發熱量更小、容量更大,因此在DDR4記憶體模組成品上,就可以塞下更多的晶片,單條記憶體容量也隨之更大。
圖 / 透過TSV矽穿孔技術,得以將多個矽晶圓串接起來,最終在3DS堆疊封裝製程下,晶片的發熱量更小、容量更大。
低電壓 低功耗
DDR4的另一個亮點,則是能夠以相對DDR3更低的電壓運行系統。事實上,DDR4相較於DDR3,由於時代的進步,製程工藝本來就較為先進,以本次搭配測試的Kingstone DDR4記憶體為例,顆粒採用20nm製程,因此能以1.2V電壓穩定運行系統,相較於DDR3標準工作電壓1.5V,理論上擁有兩成以上的節能效率。
除此之外,DDR4搭載了溫度自更新回饋機制(TCSE,Temperature Compensated Self-Refresh),能夠降低晶片在自動更新時所需耗費的電力,同時,還導入了資料匯流反轉機制(DBI,Data Bus Inversion),使得VDDQ電流量得到有效控制。平心而論,DDR4在功耗上的下降,還是稱得上與時俱進。
圖 / 從圖表中,我們可以看到初代DDR一路演進到DDR4,對於功耗上的表現都有著亮眼的進步。
DDR3 / DDR4 效能、頻寬測試
由於目前Z97消費級平臺仍採用DDR3模組,而X99旗艦級平臺則採用新一代DDR4模組。為了測試出DDR3與DDR4之間的實力差距,胖達挑選了前後兩代旗艦進行測試。由於X79與X99對應的處理器腳位並不相容,所以我們還是先對處理器與記憶體同時進行簡易測試,藉以更加客觀的面向評論DDR3與DDR4之間的差距。
對於處理器在遊戲上的效能表現,胖達選擇使用3DMARK中的物理分數,作為一個評斷指標。此時,代表Haswell-E陣營的Core i7-5960X得分為14858,而Ivy-Bridge的代表Core i7-4960X,得分為13127。換言之,新旗艦Core i7-5960X領先幅度達13.19%。
在新一代DDR4記憶體的效能成長上,在Sandra記憶體頻寬測試項目中,搭載Core i7-5960X的X99平臺得分為45.23,而Core i7-4960X的X79平臺得分為51.17。換言之,DDR4在X99平臺上,領先DDR3在X79上的頻寬幅度達13.13%。
此外,在Sandra緩存與記憶體測試項目中,搭載Core i7-5960X的X99平臺得分為337.83,而Core i7-4960X的X79平臺得分為243.12。換言之,DDR4在X99平臺上,領先DDR3在X79上的效能幅度高達38.96%。
最後,胖達測試了新舊兩代旗艦在Sandra密碼學頻寬的效能表現,搭載Core i7-5960X的X99平臺得分為10.89,而Core i7-4960X的X79平臺得分為7.62。換言之,新旗艦Core i7-5960X效能領先幅度高達42.91%。
在溫度方面,胖達在室溫攝氏29度下,以ENERMAX ETS-40空冷散熱器,運行3DMARK。透過TES-1326S 紅外線測溫槍,量得X99平臺處理器為攝氏73.6度,X79平臺處理器為攝氏78.3度;透過松大變電家量測功耗,量得X99平臺功耗為218瓦,X79平臺功耗為223瓦。換言之,X99平臺功耗略低,但溫度卻低了不少,這意謂著每一分電力的轉換效率更高,因此廢熱更少,最終測量出來的溫度才會低上許多。胖達猜測,這應該是FIVR與DDR4兩項關鍵因素優化出來的結果,或許這也解釋了為何Core i7-5960X的TDP比起Core i7-4960X略高,但最後X99平臺功耗竟比X79還低的原因吧。
記憶體的未來展望
早些時候,IBM在公司成立百年的慶祝活動中,高調展示出Phase Change Memory(PCM),號稱「瞬間」記憶體,領先現行的隨機動態存取記憶之讀寫速度不可以道里計。
這種記憶體的原理,是運用一種特殊合金為開發基礎,其擁有結晶與不定形的兩種形態,這種合金在結晶時電阻低,導電性極佳;但在不定形狀態下電阻就變得很高。因此我們便可以利用通電來改變結晶或不定形,來重新訂義0與1的資料予以存取。這種方式在效果上類似憶阻器,和現行快閃記憶體相較之下,讀寫速度號稱可以快上近百倍,更驚人的是,可以穩定地使用數百萬個寫入循環,相對於現在流行的快閃記憶體約數幾千次壽命便宣告結束,可以說是讓人期待的新技術。除上述所言,IBM在PCM的基礎上,成功發展出一套方法,將原本在一個單位的電晶體上,僅能儲存1bit(0、1)兩種狀態,變成可以儲存2bit(00、01、10、11)四種狀態,如此一來,容量瞬間翻倍。除了在速度上更有效率之外,對於容量加大、資料保存的可靠度,都將再踏入一個全新進化的領域。
另一方面,英特爾攜手美光於今年7月29日宣布開發出新世代記憶體技術「3D Xpoint」,據稱其儲存的資料比 DRAM 高出十倍,讀寫速度與耐受度更是 NAND 型快閃記憶體的 1 千倍之多。
前文提到,NAND 型快閃記憶體在讀取或寫入資料時,不會直接針對某個記憶體單元動作,而是會讀取一整排的單元、然後選出需要的資訊。相較之下,3D XPoint 則可指定特定的記憶體單元,經由電路把資料存入,這些電路被排列成水平與垂直線,其交會點可為每一個單元創造位址。
根據英特爾的說法,3D XPoint以類3D架構之姿,將記憶體單元層層堆疊,而由於這些單元是被擺在電路中間,因此的確能夠設計出一個多層架構,把單元與電路依序堆疊起來。英特爾也預計今年下半年就能將 3D XPoint 記憶體原型配送給企業夥伴,產品將在 2016 年問世,希望胖達明年就有測試的機會,再和讀者們一起分享。
這次簡單地為讀者們介紹了記憶體的發展簡史,希望大家能夠對這項重要的儲存、傳輸元件有一個初步的瞭解,相信日後對你在記憶體超頻,或是研究固態硬碟的顆粒組成,可以有一個基本的認識。
圖 / IBM展出Phase Change Memory之原型,能否像DRAM一樣獨領風騷數十年,就讓我們拭目以待。
圖 / 胖達非常看好英特爾與美光所開發出來的3D XPoint技術,其儲存的資料比 DRAM 高出十倍,讀寫速度與耐受度更是 NAND 型快閃記憶體的 1 千倍之多,簡直就是外星科技的火力展示。
臉書留言