整合營(yíng)銷服務(wù)商

          電腦端+手機(jī)端+微信端=數(shù)據(jù)同步管理

          免費(fèi)咨詢熱線:

          DeepSpeed: 大模型訓(xùn)練框架 - 京東云技術(shù)

          DeepSpeed: 大模型訓(xùn)練框架 - 京東云技術(shù)團(tuán)隊(duì)

          景:

          目前,大模型的發(fā)展已經(jīng)非常火熱,關(guān)于大模型的訓(xùn)練、微調(diào)也是各個(gè)公司重點(diǎn)關(guān)注方向。但是大模型訓(xùn)練的痛點(diǎn)是模型參數(shù)過大,動(dòng)輒上百億,如果單靠單個(gè)GPU來完成訓(xùn)練基本不可能。所以需要多卡或者分布式訓(xùn)練來完成這項(xiàng)工作。

          一、分布式訓(xùn)練

          1.1 目前主流的大模型分布式訓(xùn)練主要包括兩種:

          ?數(shù)據(jù)并行訓(xùn)練

          ?模型并行訓(xùn)練

          二、DeepSpeed

          DeepSpeed是由Microsoft提供的分布式訓(xùn)練工具,旨在支持更大規(guī)模的模型和提供更多的優(yōu)化策略和工具。對(duì)于更大模型的訓(xùn)練來說,DeepSpeed提供了更多策略,例如:Zero、Offload等。

          2.1 基礎(chǔ)組件

          分布式訓(xùn)練需要掌握分布式環(huán)境中的基礎(chǔ)配置,包括節(jié)點(diǎn)變化、全局進(jìn)程編號(hào)、局部進(jìn)程編號(hào)、全局總進(jìn)程數(shù)、主節(jié)點(diǎn)等。這些組件都跟分布式訓(xùn)練緊密相關(guān),同時(shí)組件之間也有非常大的聯(lián)系,例如通信聯(lián)系等。

          2.2 通信策略

          既然是分布式訓(xùn)練,那機(jī)器之間必須要保持通信,這樣才可以傳輸模型參數(shù),梯度參數(shù)等信息。

          DeepSpeed提供了mpi、gioo、nccl等通信策略

          通信策略

          通信作用

          mpi

          它是一種跨界點(diǎn)的通信庫,經(jīng)常用于CPU集群的分布式訓(xùn)練

          gloo

          它是一種高性能的分布式訓(xùn)練框架,可以支持CPU或者GPU的分布式訓(xùn)練

          nccl

          它是nvidia提供的GPU專用通信庫,廣泛用于GPU上的分布式訓(xùn)練

          我們?cè)谑褂肈eepSpeed進(jìn)行分布式訓(xùn)練的時(shí)候,可以根據(jù)自身的情況選擇合適的通信庫,通常情況下,如果是GPU進(jìn)行分布式訓(xùn)練,可以選擇nccl。

          2.3 Zero(零冗余優(yōu)化器)

          Microsoft開發(fā)的Zero可以解決分布式訓(xùn)練過程中數(shù)據(jù)并行和模型并行的限制。比如: Zero通過在數(shù)據(jù)并行過程中劃分模型狀態(tài)(優(yōu)化器、梯度、參數(shù)),來解決數(shù)據(jù)并行成可能出現(xiàn)內(nèi)存冗余的情況(正常數(shù)據(jù)并行訓(xùn)練,模型全部參數(shù)是復(fù)制在各個(gè)機(jī)器上的);同時(shí)可以在訓(xùn)練期間使用動(dòng)態(tài)通信計(jì)劃,在分布式設(shè)備之間共享重要的狀態(tài)變量,這樣保持計(jì)算粒度和數(shù)據(jù)并行的通信量。

          Zero是用于大規(guī)模模型訓(xùn)練優(yōu)化的技術(shù),它的主要目的是減少模型的內(nèi)存占用,讓模型可以在顯卡上訓(xùn)練,內(nèi)存占用主要分為Model States和Activation兩個(gè)部分,Zero主要解決的是Model States的內(nèi)存占用問題。

          Zero將模型參數(shù)分成三個(gè)部分:

          狀態(tài)

          作用

          Optimizer States

          優(yōu)化器在進(jìn)行梯度更新的時(shí)候需要用到的數(shù)據(jù)

          Gradient

          在反向轉(zhuǎn)播過程中產(chǎn)生的數(shù)據(jù),其決定參數(shù)的更新方向

          Model Parameter

          模型參數(shù),在模型訓(xùn)練過程中通過數(shù)據(jù)“學(xué)習(xí)”的信息

          Zero的級(jí)別如下:

          級(jí)別

          作用

          Zero-0

          不使用所有類型的分片,僅使用DeepSpeed作為DDP

          Zero-1

          分割Optimizer States, 減少4倍內(nèi)存,通信容量和數(shù)據(jù)并行性相同

          Zero-2

          分割Optimizer States和Gradients,減少8倍內(nèi)存,通信容量和數(shù)據(jù)并行性相同

          Zero-3

          分割Optimizer States、gradients、Parametes,內(nèi)存減少與數(shù)據(jù)并行度呈線性關(guān)系。例如,在64個(gè)GPU(Nd=64)之間進(jìn)行拆分將產(chǎn)生64倍的內(nèi)存縮減。通信量有50%的適度增長(zhǎng)

          Zero-Infinity

          Zero-Infinity是Zero-3的擴(kuò)展,它允許通過使用 NVMe 固態(tài)硬盤擴(kuò)展 GPU 和 CPU 內(nèi)存來訓(xùn)練大型模型

          2.4 Zero-Offload:

          相比GPU,CPU就相對(duì)比較廉價(jià),所以Zero-Offload思想是將訓(xùn)練階段的某些模型狀態(tài)放(offload)到內(nèi)存以及CPU計(jì)算。?

          ??Zero-Offload不希望為了最小化顯存占用而讓系統(tǒng)計(jì)算效率下降,但如果使用CPU也需要考慮通信和計(jì)算的問題(通信:GPU和CPU的通信;計(jì)算:CPU占用過多計(jì)算就會(huì)導(dǎo)致效率降低)。

          Zero-Offload想做的是把計(jì)算節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)分布在GPU和CPU上,計(jì)算節(jié)點(diǎn)落到哪個(gè)設(shè)備上,哪個(gè)設(shè)備就執(zhí)行計(jì)算,數(shù)據(jù)節(jié)點(diǎn)落到哪個(gè)設(shè)備上,哪個(gè)設(shè)備就負(fù)責(zé)存儲(chǔ)。

          Zero-Offload切分思路:

          下圖中有四個(gè)計(jì)算類節(jié)點(diǎn):FWD、BWD、Param update和float2half,前兩個(gè)計(jì)算復(fù)雜度大致是 O(MB), B是batch size,后兩個(gè)計(jì)算復(fù)雜度是 O(M)。為了不降低計(jì)算效率,將前兩個(gè)節(jié)點(diǎn)放在GPU,后兩個(gè)節(jié)點(diǎn)不但計(jì)算量小還需要和Adam狀態(tài)打交道,所以放在CPU上,Adam狀態(tài)自然也放在內(nèi)存中,為了簡(jiǎn)化數(shù)據(jù)圖,將前兩個(gè)節(jié)點(diǎn)融合成一個(gè)節(jié)點(diǎn)FWD-BWD Super Node,將后兩個(gè)節(jié)點(diǎn)融合成一個(gè)節(jié)點(diǎn)Update Super Node。如下圖右邊所示,沿著gradient 16和parameter 16兩條邊切分。?

          ??Zero-Offload計(jì)算思路:

          在GPU上面進(jìn)行前向和后向計(jì)算,將梯度傳給CPU,進(jìn)行參數(shù)更新,再將更新后的參數(shù)傳給GPU。為了提高效率,可以將計(jì)算和通信并行起來,GPU在反向傳播階段,可以待梯度值填滿bucket后,一遍計(jì)算新的梯度一遍將bucket傳輸給CPU,當(dāng)反向傳播結(jié)束,CPU基本上已經(jīng)有最新的梯度值了,同樣的,CPU在參數(shù)更新時(shí)也同步將已經(jīng)計(jì)算好的參數(shù)傳給GPU,如下圖所示。?

          ?2.5 混合精度:

          混合精度訓(xùn)練是指在訓(xùn)練過程中同時(shí)使用FP16(半精度浮點(diǎn)數(shù))和FP32(單精度浮點(diǎn)數(shù))兩種精度的技術(shù)。使用FP16可以大大減少內(nèi)存占用,從而可以訓(xùn)練更大規(guī)模的模型。但是,由于FP16的精度較低,訓(xùn)練過程中可能會(huì)出現(xiàn)梯度消失和模型坍塌等問題。

          DeepSpeed支持混合精度的訓(xùn)練,可以在config.json配置文件中設(shè)置來啟動(dòng)混合精度("fp16.enabled":true)。在訓(xùn)練的過程中,DeepSpeed會(huì)自動(dòng)將一部分操作轉(zhuǎn)化為FP16格式,并根據(jù)需要?jiǎng)討B(tài)調(diào)整精度縮放因子,來保證訓(xùn)練的穩(wěn)定性和精度。

          在使用混合精度訓(xùn)練時(shí),需要注意一些問題,例如梯度裁剪(Gradient Clipping)和學(xué)習(xí)率調(diào)整(Learning Rate Schedule)等。梯度裁剪可以防止梯度爆炸,學(xué)習(xí)率調(diào)整可以幫助模型更好地收斂。

          三、總結(jié)

          DeepSpeed方便了我們?cè)跈C(jī)器有限的情況下來訓(xùn)練、微調(diào)大模型,同時(shí)它也有很多優(yōu)秀的性能來使用,后期可以繼續(xù)挖掘。

          目前主流的達(dá)模型訓(xùn)練方式: GPU + PyTorch + Megatron-LM + DeepSpeed

          優(yōu)勢(shì)

          1.存儲(chǔ)效率:DeepSpeed提供了一種Zero的新型解決方案來減少訓(xùn)練顯存的占用,它與傳統(tǒng)的數(shù)據(jù)并行不同,它將模型狀態(tài)和梯度進(jìn)行分區(qū)來節(jié)省大量的顯存;

          2.可擴(kuò)展性:DeepSpeed支持高效的數(shù)據(jù)并行、模型并行、pipeline并行以及它們的組合,這里也稱3D并行;

          3.易用性: 在訓(xùn)練階段,只需要修改幾行代碼就可以使pytorch模型使用DeepSpeed和Zero。

          參考:

          1. http://wed.xjx100.cn/news/204072.html?action=onClick

          2. https://zhuanlan.zhihu.com/p/513571706

          作者:京東物流 鄭少強(qiáng)

          來源:京東云開發(fā)者社區(qū) 轉(zhuǎn)載請(qǐng)注明來源

          看個(gè)錨點(diǎn)定位的例子

          發(fā)現(xiàn)頁面唰的一些就到頂部了,快到我們懵逼了。。。

          開始解決

          scroll-behavior

          CSS屬性 scroll-behavior 為一個(gè)滾動(dòng)框指定滾動(dòng)行為,其他任何的滾動(dòng),例如那些由于用戶行為而產(chǎn)生的滾動(dòng),不受這個(gè)屬性的影響。在根元素中指定這個(gè)屬性時(shí),它反而適用于視窗。

          scroll-behavior:smooth 寫在滾動(dòng)容器元素上,可以讓容器的滾動(dòng)變得平滑。

          在網(wǎng)頁默認(rèn)滾動(dòng)是在<html>標(biāo)簽上,移動(dòng)端大多數(shù)在<body>標(biāo)簽上。

          我們可以這樣加:

          html, 
          body { scroll-behavior:smooth; }
          

          加了以后的效果如下:

          這是錄制的GIF圖,效果沒那么好。 大家可以動(dòng)手試一下,滑動(dòng)體驗(yàn)非常不錯(cuò)。

          缺點(diǎn)

          兼容性不夠好

          當(dāng)然我們可以通過js來做個(gè)類似

          Element.scrollIntoView() 方法

          DOM元素的scrollIntoView() 方法讓當(dāng)前的元素滾動(dòng)到瀏覽器窗口的可視區(qū)域內(nèi),通過觸發(fā)滾動(dòng)容器的定位實(shí)現(xiàn)。

          DOM元素的scrollIntoView()方法 是原生JS 兼容到IE6,兼容性非常好。

          參數(shù)如下

          {
           behavior: "auto" | "instant" | "smooth", // 默認(rèn) auto
           block: "start" | "center" | "end" | "nearest", // 默認(rèn) center
           inline: "start" | "center" | "end" | "nearest", // 默認(rèn) nearest
          }
          

          解釋一下這三個(gè)參數(shù):

          1. behavior 表示滾動(dòng)方式。auto 表示使用當(dāng)前元素的 scroll-behavior 樣式。instant 和 smooth 表示 直接滾到底 和 使用平滑滾動(dòng)。
          2. block 表示塊級(jí)元素排列方向要滾動(dòng)到的位置。對(duì)于默認(rèn)的 writing-mode: horizontal-tb 來說,就是豎直方向。start 表示將視口的頂部和元素頂部對(duì)齊;center 表示將視口的中間和元素的中間對(duì)齊;end 表示將視口的底部和元素底部對(duì)齊;nearest 表示就近對(duì)齊。
          3. inline 表示行內(nèi)元素排列方向要滾動(dòng)到的位置。對(duì)于默認(rèn)的 writing-mode: horizontal-tb 來說,就是水平方向。其值與 block 類似。

          用法:

          html:

          <div class="wrap">
           <div onClick="onScrollIntoView()">點(diǎn)擊讓黑色塊到頂部</div>
           <ul class="body">
           <li>1</li>
           <li>2</li>
           <li id="box">我是黑色</li>
           <li>3</li>
           <li>4</li>
           </ul>
          </div>
          

          js:

          function onScrollIntoView () {
           var element=document.getElementById("box");
           element.scrollIntoView({behavior: "smooth"});
          }
          

          效果:

          這回大家再也不用害怕做錨點(diǎn)定位啦。

          最后我們?cè)谡f一個(gè)關(guān)于頁面滾動(dòng)問題吧,那就是 返回頂部 功能實(shí)現(xiàn)

          返回頂部 功能實(shí)現(xiàn)

          我們常用定時(shí)器 setInterval 來不斷減去高度。

          如:當(dāng)前距離頂部 1000, 我們每10毫秒減50,

          var timer=setInterval(function() { // 定時(shí)器 每10毫秒執(zhí)行一次
           // 頂部距離 document.body.scrollTop=1000 
           var speed=50 // 返回頂部速度 
           document.body.scrollTop=document.body.scrollTop - speed
           if (document.body.scrollTop===0) { // 返回到達(dá)頂部后, 銷毀定時(shí)器
           clearInterval(timer)
           }
          }, 10)
          

          效果:

          大家會(huì)發(fā)現(xiàn),頁面返回是滾動(dòng)起來很干。 沒10毫秒減50. 很平均,在交互上效果并不好。

          借鑒上面 scroll-behavior:smooth 的交互效果。 緩動(dòng)的返回頂部。

          改一下計(jì)算方式:1000/2=500, 500/2=250, 250/2=...... 這樣滑動(dòng)起來是不是就平滑了呢?

          換算成公式:開始位置=開始位置 + (結(jié)束位置 - 開始位置) / 速度

          document.body.scrollTop=1000 + (0 - 1000) / 2

          公式太煩了還是上代碼吧:

          var onTop=function (a, b, c, d) {
           if (a==b || typeof a !='number') {
           return
           }
           b=b || 0
           c=c || 2
           
           var speed=function () {
           a=a + (b - b) / c
           
           if (a < 1) {
           d(b, true)
           return
           }
           d(a, false)
           requestAnimationFrame(speed)
           }
           speed()
          }
          
          • a 開始位置
          • b 結(jié)束位置
          • c 速度
          • d 位置回調(diào),d(當(dāng)前的位置值, 否動(dòng)畫結(jié)束)


          調(diào)用:

          var target=document.body.scrollTop ? document.body : document.documentElement
          onTop(target.scrollTop, 0, 4, function (value) {
           target.scrollTop=value
          })
          

          效果:

          Ps: gif錄制效果不好,大家可以動(dòng)手寫一下DEMO

          者:黑山老妖LYN

          為了爭(zhēng)奪入門級(jí)SSD的市場(chǎng)份額,從2015年開始很多廠家都先后推出了采用TLC NAND顆粒的SSD產(chǎn)品,價(jià)格也不斷的創(chuàng)出新低。一直沒有推出TLC SSD的intel和浦科特兩家一線廠家也都在近期高調(diào)發(fā)布TLC SSD新品。之前炒得很熱門的浦科特第一款TLC SSD產(chǎn)品M7V現(xiàn)在已經(jīng)正式上市,M7V按照接口的不同又細(xì)分為兩個(gè)型號(hào):SATA接口的為M7VC,M.2接口的為M7VG。零售價(jià)格是:SATA接口M7VC中128G定價(jià)279元,256G定價(jià)459元,512G定價(jià)869元。M.2接口的M7VG中128G定價(jià)369元,256G定價(jià)569元,512G定價(jià)1239元。這個(gè)定價(jià)已經(jīng)與很多低端MLC SSD持平,那么廉價(jià)的入門級(jí)SSD應(yīng)該怎么選?是買高端TLC SSD,還是買低端MLC SSD呢?這次就通過M7V的實(shí)測(cè)來幫大家分析一下。

          浦科特 M7VG 128G M.2 2280固態(tài)硬盤

          浦科特M7VG 256G介紹

          先來看看這次的主角:M.2接口的浦科特M7VG 256G。M7V M.2接口與SATA接口一樣都是采用新一代的Marvell 88SS1074主控+東芝原廠15nm eTLC NAND顆粒。

          M.2接口的浦科特M7V,在包裝上要比SATA接口版本的包裝Q很多,透明塑料的包裝外殼,包裝盒正面按照老慣例標(biāo)明了具體型號(hào)和各個(gè)不同容量版本SSD的最大讀寫速度,M.2接口的具體型號(hào)為M7VG,而SATA接口的具體型號(hào)為M7VC。M.2版本的外包裝上沒有和SATA版本那樣詳細(xì)的注明緩存、電壓、電流、MTBF等參數(shù),同樣也未注明是采用TLC NAND顆粒。

          M.2版本的SSD在外觀上就肯定沒有SATA版本那么花哨了,沒有彩色的外殼,只有裸露的PCB加上各種芯片。不過浦科特M7V上貼了很多標(biāo)簽,如果要看清楚各種芯片,就需要把標(biāo)簽撕下來,我個(gè)人的做法是用吹風(fēng)筒的熱風(fēng)輕輕吹一下,就可以揭開各種標(biāo)簽,注意不要整個(gè)撕下來,輕輕卷到一邊就好,等下用熱風(fēng)再吹一下,就可以卷回去,不影響保修。M.2接口的M7V是2280的規(guī)格,綠色PCB的正面是一個(gè)主控芯片+一個(gè)緩存顆粒+兩個(gè)NAND顆粒。PCB的背面則是空白一片。

          M.2接口也稱為NGFF接口,基于PCIE M.2協(xié)議。與SATA接口不同,M.2占用的是PCIE通道,因此它可以獲得更充裕的帶寬和更快的傳輸速度。目前SATA3接口的理論傳輸速率最高只有6Gb/s,大概相當(dāng)于600MB/s的傳輸速度。面對(duì)飛速提升的固態(tài)硬盤讀寫速度,SATA3接口已經(jīng)成為高速公路上的瓶頸。而M.2接口的理論傳輸速率可以達(dá)到10Gb/s,相當(dāng)于1G/s的傳輸速度,部分走PCIE 3.0總線的Ultra M.2甚至號(hào)稱達(dá)到32Gb/s。M.2接口的設(shè)計(jì)非常靈活,可以通過金手指部分的兩個(gè)缺口來定義接口模式。小的缺口是B key,單獨(dú)使用B key時(shí)為“Socket2”,此時(shí)僅運(yùn)行在PCI-E 2X傳輸模式下,速度較低但可以提高對(duì)SATA3的兼容性。大的缺口為M key,當(dāng)B key和M key同時(shí)使用時(shí)為“Socket3”,此時(shí)運(yùn)行在PCI-E 4X傳輸模式下,真正發(fā)揮M.2接口的速度優(yōu)勢(shì)。主板上的M.2接口上一般都有“Socket2”或者“Socket3”的標(biāo)識(shí)。

          M.2接口的M7V使用的主控芯片與SATA版本一樣,都是Marvell的第五代SATA主控88SS1074B1,這是一款針對(duì)15nm NAND Flash推出的四通道主控,最高只能支持512G容量。其特點(diǎn)如下:

          1. 支持SATA 6Gb/s接口標(biāo)準(zhǔn);

          2. 采用先進(jìn)的28nm CMOS制造工藝;

          3. 可以支持15nm制程的TLC/MLC/SLC和3D堆棧閃存;

          4. 支持DEVSLP休眠模式以實(shí)現(xiàn)低功耗;

          5. 以400MT/s的速率支持ONFI 3/Toggle 2接口標(biāo)準(zhǔn);

          6. 支持256位AES加密技術(shù)。另外還支持Marvell的第三代NANDEdge糾錯(cuò)技術(shù)和LDPC低密度奇偶校驗(yàn)技術(shù)。

          從浦科特官方的宣傳資料來看,M.2接口的M7V和SATA版本一樣,支持 PlexTurbo 、PlexCompressor、PlexVault 三個(gè)浦科特自家的SSD 應(yīng)用軟件。在使用壽命方面,官方說法是最高支持2000PE。與之前浦科特采用MLC NAND的SSD有所不同的是,M7V新增了PlexNitro效能優(yōu)化緩沖技術(shù),我們知道,之前浦科特采用MLC NAND的SSD都沒有采用SLC Cache技術(shù)來提高使用體驗(yàn)。而M7V是TLC SSD,所以現(xiàn)在同樣也需要使用SLC Cache技術(shù)。浦科特官方的資料中也說明了PlexNitro是以“SLC Mode”優(yōu)化效能表現(xiàn),并且標(biāo)明了各個(gè)容量版本的SLC Cache空間大小。

          128G版本的Cache空間為1.5GB,256G版本的Cache空間為3GB,512G版本(官方圖片資料中錯(cuò)標(biāo)為521GB)的Cache空間為6GB。

          緩存由單個(gè)南亞的緩存顆粒組成,編號(hào)分別為NT5CC256M16DP-DI,為DDR3L 1600顆粒,CL=11,容量為512MB。

          NAND顆粒編號(hào)TH58TFT0UHLBAEF,從編號(hào)上來看,是BGA封裝的東芝原廠Toggle NAND,15nm制程,屬于企業(yè)級(jí)的eTLC,單顆容量為128GB,一共兩顆組成256G。

          一個(gè)SSD的性能主要由主控芯片、緩存、NAND顆粒三者共同決定,其中最關(guān)鍵的是主控和NAND。主控除了決定性能外,還確定了SSD在糾錯(cuò)、垃圾回收、壓縮算法等方面的特點(diǎn)。NAND除了決定性能外,還關(guān)系到SSD的使用壽命等問題。目前最常見的NAND有SLC、MLC、TLC三種。SLC速度快、壽命長(zhǎng),具有約10萬次擦寫壽命,但是價(jià)格昂貴,目前只有少數(shù)高端企業(yè)級(jí)產(chǎn)品在使用;MLC的速度與壽命都遜于SLC,大概5000次擦寫壽命,但是因?yàn)閮r(jià)格適中,目前被主流SSD廣泛使用;TLC速度比MLC更慢、壽命更短,約500—1000次擦寫壽命,但是價(jià)格更加便宜,目前一般被低端SSD所使用。

          為了提高M(jìn)LC的壽命,很多廠家在生產(chǎn)MLC時(shí)會(huì)對(duì)晶圓進(jìn)行篩選,選出部分優(yōu)質(zhì)的晶圓作為企業(yè)級(jí)的eMLC顆粒。廠家還通過調(diào)整eMLC的內(nèi)部參數(shù)來達(dá)到增加P/E的目的,現(xiàn)在eMLC的PE甚至可以達(dá)到10000次。目前TLC SSD普及的有利因素是價(jià)格,不利因素則是使用壽命問題。很多NAND廠家就通過篩選TLC晶圓來生產(chǎn)eTLC顆粒,即企業(yè)級(jí)的TLC顆粒,目前東芝eTLC NAND已經(jīng)號(hào)稱能夠達(dá)到2000 PE的水平,雖然達(dá)不到MLC的3000-5000 PE,但是比普通的TLC提升了一倍。

          浦科特M7VG性能實(shí)測(cè)

          下面就來實(shí)測(cè)M.2接口的浦科特M7V的實(shí)際性能究竟怎么樣。

          測(cè)試平臺(tái)用我新入手的ROG Maximus VIII Formula主板,搭配我托人從TW帶回來的特挑威剛XPG Z1 DDR4 3200。M8F主板主打RBG信仰燈,顏值秒殺仲基老公。威剛XPG Z1 DDR4 3200雖然不是燈條,但是默認(rèn)小參非常喜人,XMP直接上DDR4 3200 16-16-16-36,電壓1.35V,海力士SKhynix H5AN4G8NMFR-TFC顆粒,金黃色馬甲。默認(rèn)電壓模式時(shí)序輕松上DDR4 3466。

          一、理論性能測(cè)試

          首先測(cè)SSD的常規(guī)五項(xiàng):AS SSD Benchmark、CrystalDisk Mark、ATTO Disk Benchmark、Anvil’s Storage Utilities、TxBENCH。這五款軟件都能夠測(cè)試SSD的最大持續(xù)讀寫速度,AS SSD Benchmark可以測(cè)得SSD在隊(duì)列深度QD64下的隨機(jī)4K讀寫速度,CrystalDisk Mark和TxBENCH可以測(cè)得SSD在隊(duì)列深度QD32下的隨機(jī)4K讀寫速度,Anvil’s Storage UtilitiesSSD可以測(cè)得隊(duì)列深度QD4、QD16下的隨機(jī)4K讀寫速度。ATTO Disk Benchmark則主要是測(cè)SSD的最高持續(xù)讀寫速度。

          在AS SSD Benchmark測(cè)試中,浦科特M7VG的得分達(dá)到了1136分,Anvil’s Storage Utilities的得分為4552.60,這兩個(gè)分?jǐn)?shù)都與SATA接口的M7VC 512G非常接近,已經(jīng)超過了大多數(shù)的中端MLC SSD,是目前為止我見過的跑分最高的TLC SSD。CrystalDisk Mark測(cè)得的持續(xù)寫入速度達(dá)到了535 MB/s。在各個(gè)隊(duì)列深度下的隨機(jī)4K讀寫性能也都非常不錯(cuò)。目前TLC SSD最大的短板就是持續(xù)寫入速度和深隊(duì)列下的隨機(jī)4K寫入性能。而M7VG的理論性能測(cè)試成績(jī)比之前已經(jīng)算很強(qiáng)的OCZ Trion150系列還要好,這主要是得益于Marvell 88SS1074主控和更先進(jìn)的SLC Cache機(jī)制。

          測(cè)試成績(jī)匯總對(duì)比與結(jié)果分析:

          在上面幾個(gè)軟件的理論性能測(cè)試中,浦科特M7VG 256G的表現(xiàn)基本和SATA接口的M7VC 512G持平,可見基于SATA主控的SSD產(chǎn)品,不管是采用M.2接口還是SATA接口,其性能本質(zhì)依然是SATA級(jí)別的,并不會(huì)因?yàn)椴捎昧薓.2接口就有量的提高。在與其他二十幾款SSD的橫向?qū)Ρ戎校琈7V依靠SLC Cache的爆發(fā)力,在SSD的常規(guī)五項(xiàng)測(cè)試中甚至超越了很多MLC SSD,很多測(cè)試成績(jī)居然和浦科特3月新發(fā)布的M6S+非常接近。而且還有一點(diǎn)就是單隊(duì)列的隨機(jī)4K寫入性能偏弱,很多測(cè)試中速度只有100MB/s左右,這個(gè)可能與主板M.2接口走PCH的延時(shí)較高有關(guān)系。整體來說,M7V的理論測(cè)試成績(jī)已經(jīng)是非常的不錯(cuò),不僅完勝其他幾款TLC SSD,甚至能夠躋身中端MLC SSD的性能水平。不過這僅僅是理論性能測(cè)試,后面還有實(shí)際應(yīng)用的測(cè)試。

          接著進(jìn)行滿盤的性能衰減測(cè)試,按照慣例使用軟件對(duì)M7V進(jìn)行反復(fù)的大量數(shù)據(jù)寫入,寫滿、刪除、再寫滿、再刪除。當(dāng)M7V被反復(fù)填滿數(shù)據(jù)后,再刪除2GB數(shù)據(jù)以提供空間給運(yùn)行CrystalDisk Mark使用。M7V即使在幾乎100%空間被占用的情況下,依然能夠保持接近空盤時(shí)的性能,這個(gè)應(yīng)該得益于更加先進(jìn)的SLC Cache機(jī)制和浦科特的True Speed技術(shù)。

          二、M7VG的SLC Cache機(jī)制對(duì)比

          由于TLC NAND的寫入性能要低于MLC NAND,所以目前幾乎所有的TLC SSD都采用了SLC Cache技術(shù)來提高測(cè)試成績(jī)、改善用戶使用體驗(yàn)。SLC Cache技術(shù)的原理其實(shí)很簡(jiǎn)單,就是把部分空間模擬SLC顆粒來運(yùn)作,各個(gè)廠家的具體操作方式又各不相同,用于SLC Cache的空間大小設(shè)置也不同。

          前面已經(jīng)提到過,浦科特M7V系列中128G版本的SLC Cache空間為1.5GB,256G版本的SLC Cache空間為3GB,512G版本的SLC Cache空間為6GB。下面來對(duì)比一下M7V的SLC Cache機(jī)制。對(duì)比參照物選擇的是240G的OCZ Trion150,因?yàn)門rion150同樣非常強(qiáng)悍,而且SLC Cache空間大小的設(shè)置與M7V比較接近。OCZ Trion150采用群聯(lián)S10主控+東芝原廠15nm制程的 TLC NAND顆粒,240G版本的SLC Cache空間大小約為4.5G。同樣用于對(duì)比的還有SATA接口的M7V 512G(SLC Cache空間大小約為6G)。

          下圖是三個(gè)盤在測(cè)試數(shù)據(jù)模塊分別設(shè)置為1GB、2GB、4GB、8GB、16GB時(shí)的CrystalDisk Mark測(cè)試圖,左邊為浦科特M7VC 512G(SATA),中間為M7VG 256G(M.2),右邊為OCZ Trion150 240G。

          在我以前測(cè)試過的TLC SSD中,當(dāng)持續(xù)寫入的數(shù)據(jù)模塊大于SLC Cache空間大小時(shí),持續(xù)寫入性能就會(huì)出現(xiàn)斷層式的下降,下降到TLC NAND的真實(shí)寫入性能水平。而且此時(shí)主控會(huì)忙于盡快清理出更多的SLC Cache空間來供給測(cè)試使用,主控和緩存資源都被極大的占用,因此會(huì)影響到SSD的整體性能,尤其是深隊(duì)列下的4K隨機(jī)讀寫成績(jī)。

          當(dāng)測(cè)試數(shù)據(jù)模塊的大小設(shè)置為4GB時(shí),雖然未達(dá)到OCZ Trion150的4.5GB SLC Cache空間的容量,但是Trion150的QD32持續(xù)寫入速度和QD32隨機(jī)4K讀寫速度已經(jīng)出現(xiàn)了大幅度的下降。把測(cè)試數(shù)據(jù)模塊的大小增加到8GB和16GB之后,Trion150的但單隊(duì)列持續(xù)寫入也同樣出現(xiàn)了大幅度下降。再來看看M7V的表現(xiàn),當(dāng)測(cè)試數(shù)據(jù)模塊的大小設(shè)置為4GB時(shí),測(cè)試數(shù)據(jù)小于M7VC 512G的6GB SLC Cache,而大于M7VG 256G的3GB SLC Cache,因此M7VG 256G的主控開始要對(duì)SLC Cache空間進(jìn)行清理,因此QD32的隨機(jī)4K寫入性能稍微出現(xiàn)了下降。而M7VC 512G的性能則變化不大。把測(cè)試數(shù)據(jù)模塊的大小增加到8GB之后,測(cè)試數(shù)據(jù)模塊已經(jīng)都大于兩款M7V的SLC Cache空間大小,但是兩款M7V的性能下降幅度也并不大,尤其是M7VC 512G,性能下降非常微弱。而M7VG 256G的單隊(duì)列持續(xù)讀寫和單隊(duì)列隨機(jī)4K讀取性能下降的幅度就比M7VC 512G要大,此時(shí)SLC Cache空間大小的差距就體現(xiàn)了出來。當(dāng)測(cè)試數(shù)據(jù)模塊的大小設(shè)置為16GB時(shí),M7VG 256G在性能上的下降幅度就比M7VC 512G要更明顯一些。

          通過以上的數(shù)據(jù)對(duì)比,基本上可以得出兩個(gè)結(jié)論,第一是浦科特M7V所采用的Marvell 88SS1074主控在處理SLC Cache空間溢出時(shí)效率更高,在SLC Cache空間稍微不夠用的情況下,主控通過及時(shí)的數(shù)據(jù)整理能夠在很大程度上消除SLC Cache空間數(shù)據(jù)溢出對(duì)性能的影響。而當(dāng)測(cè)試數(shù)據(jù)模塊明顯大于SLC Cache空間大小時(shí)(例如測(cè)試數(shù)據(jù)模塊為16GB時(shí))。Marvell 88SS1074主控表現(xiàn)出了很強(qiáng)的“救火”能力,雖然各項(xiàng)讀寫速度均有小幅度的下降,但是在QD32隊(duì)列下的4K隨機(jī)讀寫性能下降幅度明顯要小于采用群聯(lián)S10主控的OCZ Trion150。這個(gè)特點(diǎn)正好針對(duì)以往TLC SSD在遇到SLC Cache空間爆倉時(shí)出現(xiàn)深隊(duì)列下隨機(jī)4K讀寫性能暴降的缺點(diǎn)做了積極的彌補(bǔ)。第二則是針對(duì)浦科特M7V同系列的SSD,容量越大其SLC Cache空間越大,在應(yīng)付SLC Cache空間爆倉時(shí)的救火能力也就越強(qiáng),因此如果預(yù)算允許的話,還是應(yīng)該盡量購買更大容量的M7V。

          三、模擬實(shí)際使用環(huán)境性能測(cè)試

          PCMARK8是目前最接近實(shí)際使用環(huán)境的模擬測(cè)試軟件,其中存儲(chǔ)設(shè)備測(cè)試部分有游戲、辦公、圖形處理等幾個(gè)項(xiàng)目,其測(cè)試成績(jī)比前面常規(guī)五項(xiàng)的幾個(gè)軟件都更能真實(shí)的反映出SSD的實(shí)戰(zhàn)性能。更確切的說,是在家用、游戲以及普通辦公情況下的SSD實(shí)際性能。在反復(fù)滿盤寫入、刪除后進(jìn)行PCMARK8測(cè)試就更能夠反映出一個(gè)SSD在長(zhǎng)時(shí)間使用后的實(shí)際性能表現(xiàn)。浦科特M7V 256G M.2的總分為4921。這個(gè)得分明顯比前面的常規(guī)五項(xiàng)更能體現(xiàn)M7V在二十幾款SSD中的性能定位。

          PCMARK8的測(cè)試數(shù)據(jù)量十分巨大,達(dá)到了幾十G,遠(yuǎn)遠(yuǎn)超過了M7V的SLC Cache空間,其測(cè)試強(qiáng)度絕非前面幾款軟件可以相提并論的。很多在常規(guī)五項(xiàng)中表現(xiàn)出色的TLC SSD,一跑PCMARK8就被打回原形。M7V在PCMARK8中的表現(xiàn)也沒有在前面的常規(guī)五項(xiàng)中那么兇猛,但依然是最強(qiáng)的TLC SSD。在和中低端MLC SSD的對(duì)比中,雖然小幅度落后于中端的MLC,但同樣可以小幅度領(lǐng)先于低端MLC SSD。對(duì)比閃迪加強(qiáng)版這種使用超低端SMI 2246XT主控的廉價(jià)MLC SSD,除了在PhotoShop重載測(cè)試中稍微落后之外,其他測(cè)試項(xiàng)目全部完勝。

          從測(cè)試結(jié)果中可以看出,依靠Marvell全新的88SS1074主控+東芝原廠15nm eTLC NAND顆粒,TLC SSD在性能上已經(jīng)獲得了不小的提高,更先進(jìn)的SLC Cache機(jī)制使得TLC SSD在性能上干掉低端MLC SSD成為現(xiàn)實(shí)。

          四、實(shí)際使用測(cè)試

          這部分測(cè)試主要從平時(shí)的實(shí)際應(yīng)用中來測(cè)試浦科特M7V的性能表現(xiàn)。Windows系統(tǒng)的啟動(dòng)時(shí)間和游戲的加載時(shí)間上,M7V已經(jīng)和很多中端MLC SSD持平。Photoshop的加載測(cè)試中,M7V落后于中端MLC SSD的幅度很小,而且依舊領(lǐng)先于TLC SSD和低端MLC SSD。

          五、配套軟件

          一個(gè)硬件的做工用料好,是物質(zhì)基礎(chǔ),而如果要用得舒心,那么配套軟件也很重要,這就是所謂的軟件附加值。軟件是用戶和硬件之間交互的橋梁。比如我測(cè)試平臺(tái)中的華碩M8F主板,之所以敢賣那么貴,除了主板本身的品質(zhì)之外,配套的軟件也有很高的附加值,非常方便的就可以在系統(tǒng)里使用超頻軟件對(duì)CPU頻率、內(nèi)存頻率和時(shí)序、風(fēng)扇轉(zhuǎn)速、各部分電壓等各個(gè)超頻參數(shù)進(jìn)行調(diào)整。

          現(xiàn)在很多知名品牌的SSD都附帶有很好的配套軟件。M7V和浦科特的高端產(chǎn)品一樣,都能夠支持PlexTurbo、PlexCompressor、PlexVault 這三款浦科特自家的SSD 應(yīng)用軟件。浦科特SSD通用的Plextool軟件就不用多介紹了,能夠監(jiān)測(cè)SSD信息、讀取SMART數(shù)據(jù)、進(jìn)行Trim優(yōu)化、SecretErase、固件升級(jí)等操作。

          PlexTurbo之前只針對(duì)浦科特的高端SSD開放,現(xiàn)在M7V也同樣能夠使用。PlexTurbo以系統(tǒng)內(nèi)存作為SSD的緩存,從而實(shí)現(xiàn)系統(tǒng)加速及減少NAND寫入量的目的。PlexTurbo軟件可以自由設(shè)定用于SSD緩存的系統(tǒng)內(nèi)存大小和內(nèi)存數(shù)據(jù)寫入SSD的間隔時(shí)間。當(dāng)交換的數(shù)據(jù)量小于內(nèi)存緩存的時(shí)候,讀寫操作其實(shí)都是在內(nèi)存內(nèi)部進(jìn)行,只有達(dá)到預(yù)定的釋放時(shí)間后數(shù)據(jù)才會(huì)被真正寫入SSD中。因此測(cè)得的SSD性能非常強(qiáng)勁(其實(shí)測(cè)的是內(nèi)存),而且這樣能夠減少NAND的寫入量,延長(zhǎng)SSD的壽命。這個(gè)功能對(duì)于系統(tǒng)內(nèi)存在16GB以上的用戶比較實(shí)用,而且用在TLC SSD上我覺得比MLC SSD更有意義。

          PlexCompressor是一套智能壓縮軟件,可以通過壓縮文件來變相增加SSD存儲(chǔ)空間。這個(gè)功能我本人基本用不到,因?yàn)槲业腟SD無論從數(shù)量和容量上都絕對(duì)夠用。PlexVault則是一個(gè)加密軟件,與之前的很多U盤加密軟件原理一樣,在SSD上劃出一部分空間作為隱藏分區(qū),平時(shí)這個(gè)分區(qū)在電腦里不會(huì)顯示出來,等到需要訪問的時(shí)候就按下快捷鍵,在彈出的對(duì)話框中輸入正確的密碼之后,“我的電腦”里就會(huì)出現(xiàn)隱藏分區(qū)的盤符。不過有兩點(diǎn)需要注意,第一是一定要用浦科特的SSD作為系統(tǒng)盤才能夠啟用這個(gè)功能,第二是容量有限制。

          總結(jié)

          一、關(guān)于性能

          1. 因?yàn)镸arvell 88SS1074是SATA主控,所以無論M7V是采用M.2接口還是采用SATA接口,其性能都是SATA級(jí)別的,只是接口不同而已。SATA接口的M7V具體型號(hào)為M7VC,M.2接口的M7V具體型號(hào)為M7VG。在性能上,M7VC=M7VG。現(xiàn)在相同容量的M7VG比M7VC稍微貴一點(diǎn),但是在性能上是沒有差別的,唯一的優(yōu)勢(shì)就是可以直接安裝在主板上,省去走線的麻煩,所以大家應(yīng)該根據(jù)自己的具體需要來購買。

          2. 從前面的各項(xiàng)測(cè)試中可以看出,浦科特M7V可以稱得上是目前為止最強(qiáng)的TLC SSD。整體性能小幅度落后于中端的MLC,但是對(duì)比低端MLC SSD和其他TLC SSD有一定的領(lǐng)先優(yōu)勢(shì)。依靠Marvell全新的88SS1074主控+東芝原廠15nm eTLC NAND顆粒,TLC SSD在性能上已經(jīng)獲得了不小的提高,更先進(jìn)的SLC Cache機(jī)制使得TLC SSD在性能上干掉低端MLC SSD成為現(xiàn)實(shí)。在PCMARK8的存儲(chǔ)子項(xiàng)目測(cè)試中,對(duì)比閃迪加強(qiáng)版這種使用超低端SMI 2246XT主控的廉價(jià)MLC SSD,浦科特M7V除了在PhotoShop重載測(cè)試中稍微落后之外,其他測(cè)試項(xiàng)目全部完勝。這一點(diǎn)也說明TLC SSD的用戶群應(yīng)該是普通的家庭用戶,在家用、游戲和小型辦公的使用中,M7V已經(jīng)接近甚至不遜于中端的MLC SSD。不過M7V依然無法完全擺脫TLC SSD在高負(fù)載下性能較弱的缺點(diǎn)。

          二、廉價(jià)SSD如何選?

          現(xiàn)在像浦科特M7V這樣的高端TLC SSD定價(jià)其實(shí)與低端MLC SSD是基本持平的。那么預(yù)算相對(duì)較少的用戶,應(yīng)該如何在兩者間進(jìn)行選擇?從性能特點(diǎn)上來看,浦科特M7V依靠Marvell 88SS1074主控+更先進(jìn)的SLC Cache機(jī)制在性能上比以往的TLC SSD提升了一個(gè)檔次,在家用情況下干掉低端MLC SSD已經(jīng)不是問題。但是使用壽命這個(gè)問題依然是TLC SSD最大的硬傷。即使采用了企業(yè)級(jí)的eTLC NAND,但是PE數(shù)也只能提升到2000,比起MLC NAND的3000-5000 PE仍有不小的差距。所以,用戶在高端TLC SSD與低端MLC SSD之間的選擇,其實(shí)就是性能與理論壽命之間的選擇。高端TLC SSD性能>低端MLC SSD,高端TLC SSD理論壽命<低端MLC SSD。而現(xiàn)在的低端MLC SSD,為了縮減成本以降低價(jià)格,很多都是采用超低端主控+正片NAND(例如某迪加強(qiáng)版),或者低端主控+白片NAND。如果要我選擇的話,我自己會(huì)選擇高端TLC SSD,因?yàn)樾阅艿膬?yōu)勢(shì)是現(xiàn)在馬上可以感受到的,而壽命問題,其實(shí)還是一個(gè)未知數(shù),eTLC NAND在理論上的壽命短于MLC NAND,而在實(shí)際使用中需要多少年才能用完2000的PE數(shù)?到時(shí)又有什么黑科技產(chǎn)品出來替代SSD都還不知道。所以我的建議是,預(yù)算充裕的話,絕對(duì)是考慮中高端名牌MLC SSD,而在預(yù)算比較有限的情況下,考慮大廠高端eTLC SSD比考慮低端MLC SSD要更實(shí)際一些。


          主站蜘蛛池模板: 亚洲精品色播一区二区| 国产一区二区三区精品视频| 日美欧韩一区二去三区| 国产在线一区二区| 人成精品视频三区二区一区 | 高清一区二区三区免费视频| 国产乱码精品一区二区三| 亚洲国模精品一区| 中文字幕一区二区三区日韩精品 | 亚洲国产成人久久综合一区 | 一区二区三区四区无限乱码| 精品国产一区二区麻豆| 在线日韩麻豆一区| 精品人妻少妇一区二区三区在线 | 亚洲日韩AV一区二区三区中文| 99久久精品日本一区二区免费| 无码国产精品一区二区免费式芒果| 老熟妇仑乱视频一区二区| 中文字幕一区二区三匹| 波多野结衣电影区一区二区三区| 一区二区三区免费视频播放器| 国产午夜精品免费一区二区三区| 亚洲一区二区久久| 免费人妻精品一区二区三区| 99精品高清视频一区二区| 国模私拍福利一区二区| 国产免费av一区二区三区| 亚洲乱码日产一区三区| 国产成人一区二区动漫精品| 国产午夜精品一区二区三区| 日本精品一区二区三本中文| 无码人妻一区二区三区免费看| 精品国产一区二区三区av片| 国产AV一区二区三区无码野战| 日韩精品一区二区三区老鸦窝| 一区二区三区日韩| 国产成人高清视频一区二区| 国产福利无码一区在线| 精品一区二区三区波多野结衣| 日韩一区二区在线观看| 精品人妻无码一区二区三区蜜桃一 |