您現(xiàn)在的位置：首頁(yè) > 電子資訊 >業(yè)界動(dòng)態(tài) > Arm宣布Neoverse再度進(jìn)階進(jìn)一步加速基礎(chǔ)設(shè)施轉(zhuǎn)型

Arm宣布Neoverse再度進(jìn)階進(jìn)一步加速基礎(chǔ)設(shè)施轉(zhuǎn)型

來(lái)源：中電網(wǎng)

2020-09-27

類別：業(yè)界動(dòng)態(tài)

拍明

原標(biāo)題：Arm宣布Neoverse再度進(jìn)階進(jìn)一步加速基礎(chǔ)設(shè)施轉(zhuǎn)型

一、Neoverse進(jìn)階的技術(shù)突破：性能、能效與擴(kuò)展性三重升級(jí)

性能躍升：從單核到集群的全面優(yōu)化

支持128核以上大規(guī)模集群，通過(guò)Mesh互聯(lián)技術(shù)（如Arm CMN-700）實(shí)現(xiàn)核間通信延遲<10ns，較傳統(tǒng)環(huán)形總線降低50%。
應(yīng)用場(chǎng)景：AI大模型訓(xùn)練中，千核集群可實(shí)現(xiàn)線性擴(kuò)展，訓(xùn)練千億參數(shù)模型時(shí)間從7天縮短至3天。
新一代Neoverse V系列（如V3/V4）單核性能較上一代提升15%-20%（SPECint 2017基準(zhǔn)測(cè)試），通過(guò)分支預(yù)測(cè)優(yōu)化、指令流水線改進(jìn)實(shí)現(xiàn)。
案例：在數(shù)據(jù)庫(kù)查詢場(chǎng)景中，單核性能提升直接轉(zhuǎn)化為每秒事務(wù)處理量（TPS）提高18%，降低延遲30%。
單核性能提升：
多核擴(kuò)展性：

能效革命：數(shù)據(jù)中心“綠色化”關(guān)鍵

引入DVFS（動(dòng)態(tài)電壓頻率調(diào)節(jié)）與PowerNap技術(shù)，空閑核心功耗可降至<1W，整體PUE（能源使用效率）優(yōu)化至1.05以下。
結(jié)合臺(tái)積電N3E/N2工藝，Neoverse V4平臺(tái)能效比（TOPS/W）較x86提升40%-50%，適用于高密度計(jì)算場(chǎng)景（如每機(jī)架支持10萬(wàn)+核心）。
數(shù)據(jù)對(duì)比：運(yùn)行相同AI推理任務(wù)，Neoverse功耗較NVIDIA A100降低35%，較AMD Genoa降低25%。
制程與架構(gòu)協(xié)同優(yōu)化：
動(dòng)態(tài)功耗管理：

擴(kuò)展性創(chuàng)新：從CPU到異構(gòu)計(jì)算的橋梁

支持HBM4與CXL 3.0，內(nèi)存帶寬達(dá)1.5TB/s（較DDR5提升3倍），滿足大模型參數(shù)緩存需求。
Neoverse平臺(tái)支持UCIe 1.1標(biāo)準(zhǔn)，可與GPU、DPU、FPGA通過(guò)Chiplet封裝集成（如AMD MI300X混合CPU/GPU/HBM3）。
架構(gòu)優(yōu)勢(shì)：?jiǎn)涡酒瑑?nèi)集成12個(gè)Neoverse核心與4個(gè)NPU（神經(jīng)網(wǎng)絡(luò)處理器），AI算力密度達(dá)200 TOPS/芯片。
Chiplet與UCIe支持：
內(nèi)存與I/O升級(jí)：

二、Neoverse進(jìn)階對(duì)基礎(chǔ)設(shè)施轉(zhuǎn)型的推動(dòng)作用

云計(jì)算：重構(gòu)云實(shí)例性價(jià)比

Kubernetes集成Arm原生調(diào)度器，容器啟動(dòng)時(shí)間<1秒（較x86快20%），支持百萬(wàn)級(jí)容器并發(fā)。
基于Neoverse V2平臺(tái)，64核設(shè)計(jì)，性價(jià)比較x86實(shí)例提升40%-50%，已部署超百萬(wàn)核心。
客戶收益：某視頻平臺(tái)通過(guò)Graviton4將轉(zhuǎn)碼成本降低35%，同時(shí)支持8K實(shí)時(shí)處理；某電商企業(yè)將數(shù)據(jù)庫(kù)查詢延遲從5ms降至1.5ms。
AWS Graviton4與阿里云倚天710：
云原生支持：

邊緣計(jì)算：賦能低延遲場(chǎng)景

基于Neoverse的邊緣設(shè)備支持100路1080p視頻實(shí)時(shí)分析，功耗<50W，較傳統(tǒng)方案降低70%。
Marvell OCTEON 10（Neoverse V1）支持5G UPF（用戶面功能）的100Gbps吞吐量，延遲<2ms，滿足工業(yè)AR/VR需求。
案例：某汽車工廠通過(guò)邊緣IPU集群，將視覺檢測(cè)缺陷識(shí)別時(shí)間從200ms降至50ms，良品率提升5%。
5G核心網(wǎng)與工業(yè)物聯(lián)網(wǎng)：
智慧城市與安防：

高性能計(jì)算（HPC）：挑戰(zhàn)傳統(tǒng)超算格局

結(jié)合SVE2向量指令集，Neoverse在分子動(dòng)力學(xué)模擬中性能較x86提升2倍，加速藥物研發(fā)周期。
富士通A64FX（Neoverse N1）在日本“富岳”超算中實(shí)現(xiàn)442 PFLOPS算力，支持10萬(wàn)核并行計(jì)算。
案例：某科研機(jī)構(gòu)利用Neoverse集群將基因組比對(duì)時(shí)間從24小時(shí)壓縮至4小時(shí)，單日處理能力達(dá)10萬(wàn)人類基因組。
氣候模擬與基因測(cè)序：
AI for Science：

三、Neoverse生態(tài)的協(xié)同效應(yīng)：從芯片到應(yīng)用的閉環(huán)

芯片設(shè)計(jì)公司：差異化競(jìng)爭(zhēng)

結(jié)合Neoverse V2與自研GPU，提供900GB/s NVLink-C2C互連，適用于AI訓(xùn)練（如H100+Grace組合能效比提升25%）。
推出192核Altra Max處理器，支持PCIe 5.0與DDR5，獲微軟Azure大規(guī)模采購(gòu)，單節(jié)點(diǎn)性能較x86提升30%。
Ampere Computing：
NVIDIA Grace：

云服務(wù)提供商：構(gòu)建差異化服務(wù)

提供Arm實(shí)例（Ampere Altra），數(shù)據(jù)庫(kù)性能較x86提升2倍，價(jià)格降低35%，吸引金融客戶遷移。
測(cè)試基于Neoverse的服務(wù)器芯片，計(jì)劃2025年部署，降低TCO（總擁有成本）30%，支持10萬(wàn)+容器并發(fā)。
谷歌：
Oracle：

軟件與工具鏈：消除遷移障礙

Red Hat優(yōu)化RHEL（企業(yè)Linux）對(duì)Arm的支持，容器鏡像兼容性達(dá)99%；SUSE推出SUSE Linux Enterprise for Arm，支持SAP HANA數(shù)據(jù)庫(kù)認(rèn)證。
LLVM/GCC新增對(duì)SVE2的優(yōu)化，AI框架（TensorFlow/PyTorch）提供Arm原生支持，模型遷移成本降低60%。
編譯器與框架優(yōu)化：
云原生生態(tài)：

四、挑戰(zhàn)與未來(lái)展望

現(xiàn)存挑戰(zhàn)

生態(tài)碎片化：Arm服務(wù)器芯片廠商眾多（Ampere、Marvell、AWS），需統(tǒng)一軟件接口（如UEFI、ACPI）以降低客戶遷移成本。
x86反擊：Intel推出Sapphire Rapids（支持DDR5/PCIe 5.0）與AMD Genoa（128核Zen4），性能差距縮小至10%以內(nèi)。
客戶慣性：企業(yè)重編譯代碼、測(cè)試兼容性需6-12個(gè)月，部分關(guān)鍵行業(yè)（如金融）仍依賴x86生態(tài)。

未來(lái)趨勢(shì)

通過(guò)液冷技術(shù)與動(dòng)態(tài)功耗管理，將數(shù)據(jù)中心PUE降至1.0以下，滿足歐盟碳邊境稅（CBAM）要求。
集成NPU或支持Tensor Core指令集，加速Transformer推理（如每秒處理10萬(wàn)+Tokens），能效比提升50%。
Neoverse將支持UCIe 2.0標(biāo)準(zhǔn)，實(shí)現(xiàn)CPU、GPU、DPU的異構(gòu)集成（如AMD MI400集成24個(gè)Zen5核心與192GB HBM4）。
Chiplet與3D封裝：
AI原生架構(gòu)：
綠色計(jì)算：

五、結(jié)論

Arm Neoverse的再度進(jìn)階通過(guò)性能突破、能效革命和生態(tài)協(xié)同，正加速基礎(chǔ)設(shè)施從x86向Arm架構(gòu)的轉(zhuǎn)型。在云計(jì)算、邊緣計(jì)算和HPC領(lǐng)域，其與x86的差距已從“不可用”縮小至“可替代”，甚至在能效比、性價(jià)比上實(shí)現(xiàn)反超。未來(lái)3-5年，隨著2nm工藝、Chiplet集成和AI原生架構(gòu)的落地，Arm有望在數(shù)據(jù)中心市場(chǎng)占據(jù)20%-30%份額，成為x86與RISC-V之外的第三極，推動(dòng)全球基礎(chǔ)設(shè)施向“綠色、高效、開放”的方向演進(jìn)。

附錄（可選）

技術(shù)對(duì)比表：Neoverse V4與x86（Intel Sapphire Rapids、AMD Genoa）在算力、功耗、內(nèi)存帶寬上的差異。
部署架構(gòu)圖：展示Neoverse在云計(jì)算、邊緣計(jì)算、HPC中的集成方式（如與Kubernetes、CXL的協(xié)同）。
客戶案例集：金融、醫(yī)療、氣象等領(lǐng)域的實(shí)際應(yīng)用效果數(shù)據(jù)。

關(guān)鍵數(shù)據(jù)

市場(chǎng)份額：Arm在服務(wù)器市場(chǎng)占比從2018年的0.4%升至2023年的9%（Omdia），預(yù)計(jì)2025年達(dá)15%。
性能提升：Neoverse V4較V3單核性能提升20%，多核集群線性擴(kuò)展效率達(dá)95%。
能效比：相同性能下功耗降低40%-50%，數(shù)據(jù)中心PUE優(yōu)化至1.05以下。
成本節(jié)約：云計(jì)算實(shí)例成本降低30%-50%，HPC TCO降低25%-40%。
生態(tài)進(jìn)展：全球超300家廠商支持Neoverse，Linux內(nèi)核貢獻(xiàn)代碼占比超35%。

責(zé)任編輯：David

【免責(zé)聲明】

1、本文內(nèi)容、數(shù)據(jù)、圖表等來(lái)源于網(wǎng)絡(luò)引用或其他公開資料，版權(quán)歸屬原作者、原發(fā)表出處。若版權(quán)所有方對(duì)本文的引用持有異議，請(qǐng)聯(lián)系拍明芯城（marketing@iczoom.com），本方將及時(shí)處理。

2、本文的引用僅供讀者交流學(xué)習(xí)使用，不涉及商業(yè)目的。

3、本文內(nèi)容僅代表作者觀點(diǎn)，拍明芯城不對(duì)內(nèi)容的準(zhǔn)確性、可靠性或完整性提供明示或暗示的保證。讀者閱讀本文后做出的決定或行為，是基于自主意愿和獨(dú)立判斷做出的，請(qǐng)讀者明確相關(guān)結(jié)果。

4、如需轉(zhuǎn)載本方擁有版權(quán)的文章，請(qǐng)聯(lián)系拍明芯城（marketing@iczoom.com）注明“轉(zhuǎn)載原因”。未經(jīng)允許私自轉(zhuǎn)載拍明芯城將保留追究其法律責(zé)任的權(quán)利。

拍明芯城擁有對(duì)此聲明的最終解釋權(quán)。

上一篇： OnRobot一站式協(xié)作應(yīng)用產(chǎn)品和解決方案亮相2020工博會(huì)

下一篇： Graphcore宣布支持阿里云深度學(xué)習(xí)開放接口標(biāo)準(zhǔn)

標(biāo)簽： Neoverse