人妻夜夜爽天天爽三区麻豆AV网站,水中色av综合,中国浓毛少妇毛茸茸,国产精品国产三级国产av剧情

您的位置：首頁(yè) > 產(chǎn)經(jīng) >

英偉達(dá)AI芯片勁敵來了！AMD推出MI300X，可運(yùn)行多達(dá)800億參數(shù)模型

來源：華爾街見聞 ? 2023-06-14 06:08:55

憑借發(fā)布的新品，AMD正式向英偉達(dá)的AI芯片王者地位發(fā)起挑戰(zhàn)。

美東時(shí)間6月13日周二，AMD舉行了新品發(fā)布會(huì)，其中最重磅的新品當(dāng)屬性用于訓(xùn)練大模型的ADM最先進(jìn)GPU Instinct MI300。

(資料圖)

AMD CEO蘇姿豐介紹，生成式AI和大語(yǔ)言模型（LLM）需要電腦的算力和內(nèi)存大幅提高。她預(yù)計(jì)，今年，數(shù)據(jù)中心AI 加速器的市場(chǎng)將達(dá)到300億美元左右，到2027 年將超過1500 億美元，復(fù)合年增長(zhǎng)率超過 50%。

蘇姿豐演示介紹，AMD的Instinct MI300A號(hào)稱全球首款針對(duì)AI和高性能計(jì)算（HPC）的加速處理器（APU）加速器。在13個(gè)小芯片中遍布1460億個(gè)晶體管。

它采用CDNA 3 GPU架構(gòu)和24個(gè)Zen 4 CPU內(nèi)核，配置128GB的HBM3內(nèi)存。相比前代MI250，MI300的性能提高八倍，效率提高五倍。AMD在發(fā)布會(huì)稍早介紹，新的Zen 4c內(nèi)核比標(biāo)準(zhǔn)的Zen 4內(nèi)核密度更高，比標(biāo)準(zhǔn)Zen 4的內(nèi)核小35%，同時(shí)保持100%的軟件兼容性。

AMD推出一款GPU專用的MI300，即MI300X，該芯片是針對(duì)LLM的優(yōu)化版，擁有192GB的HBM3內(nèi)存、5.2TB/秒的帶寬和 896GB/秒的Infinity Fabric 帶寬。AMD將1530億個(gè)晶體管集成在共12個(gè)5納米的小芯片中。

AMD稱，MI300X提供的HBM密度最高是英偉達(dá)AI芯片H100的2.4倍，其HBM帶寬最高是H100的1.6倍。這意味著，AMD的芯片可以運(yùn)行比英偉達(dá)芯片更大的模型。

蘇姿豐介紹，MI300X可以支持400億個(gè)參數(shù)的Hugging Face AI 模型運(yùn)行，并演示了讓這個(gè)LLM寫一首關(guān)于舊金山的詩(shī)。這是全球首次在單個(gè)GPU上運(yùn)行這么大的模型。單個(gè)MI300X可以運(yùn)行一個(gè)參數(shù)多達(dá)800億的模型。

LLM需要的GPU更少，給開發(fā)者帶來的直接好處就是，可以節(jié)約成本。

AMD還發(fā)布了AMD Instinct 平臺(tái)，它擁有八個(gè)MI300X，采用行業(yè)標(biāo)準(zhǔn)OCP設(shè)計(jì)，提供總計(jì)1.5TB 的HBM3 內(nèi)存。

蘇姿豐稱，適用于CPU和GPU的版本MI300A現(xiàn)在就已出樣，MI300X和八個(gè)GPU的Instinct 平臺(tái)將在今年第三季度出樣，第四季度正式推出。

亞馬遜、微軟、Meta已經(jīng)或?qū)⒁\(yùn)用AMD新品

除了AI芯片，AMD此次發(fā)布會(huì)還介紹了第四代EPYC（霄龍）處理器，特別是在全球可用的云實(shí)例方面的進(jìn)展。

AMD第四代EPYC（霄龍）在云工作負(fù)載的性能是英特爾競(jìng)品處理器的1.8倍，在企業(yè)工作負(fù)載中的處理速度是英特爾競(jìng)品的1.9倍。

AMD稱，第四代EPYC（霄龍）啟用新的Zen 4c內(nèi)核，比英特爾Xeon 8490H的效率高1.9倍。由于絕大多數(shù)AI在CPU上運(yùn)行，AMD在CPU AI領(lǐng)域具有絕對(duì)的領(lǐng)先優(yōu)勢(shì)。

亞馬遜周二宣布，在用AWS Nitro和第四代EPYC 處理器打造新的實(shí)例。亞馬遜云的EC2 M7a實(shí)例現(xiàn)已提供預(yù)覽版，性能比M6a實(shí)例高50%。

AMD也將在內(nèi)部工作中運(yùn)用EC2 M7a實(shí)例，包括芯片設(shè)計(jì)的EDA軟件。AMD還宣布，今年7月，甲骨文將推出Genoa E5實(shí)例。

AMD發(fā)布的EPYC Bergamo處理器是業(yè)界首款x86原生CPU，有128個(gè)內(nèi)核，每個(gè)插槽256個(gè)線程。這意味著一個(gè)普通的2U 4 節(jié)點(diǎn)平臺(tái)將有 2048 個(gè)線程。

Bergamo比前代Milan的性能高2.5倍，現(xiàn)在就可以向AMD的云客戶發(fā)貨。

Meta的公司代表介紹，Meta在基礎(chǔ)設(shè)施中使用EPYC處理器。Meta也對(duì)基于AMD的處理器設(shè)計(jì)開源。Meta方面稱，計(jì)劃為其基礎(chǔ)設(shè)施使用云處理器Bergamo，還要將Bergamo用于其存儲(chǔ)平臺(tái)。

AMD同時(shí)推出本周二上市的CPU Genoa-X。它將增加超過1GB 的96核L3緩存。它共有四個(gè)SKU，16到 96 個(gè)內(nèi)核。因?yàn)镾P5插槽兼容，所以它可以與現(xiàn)有的EPYC 平臺(tái)一起使用。

微軟的公司代表和AMD一道展示了微軟云Azure HPC的性能，在EPYC處理器的幫助下，Azure四年內(nèi)的性能提升四倍。

Azure宣布，搭載Genoa-X的HBv4和HX系列實(shí)例、以及新的HBv3實(shí)例全面上市。Azure還稱，性能最高可較市面基準(zhǔn)提升5.7倍。

AMD此前通過收購(gòu)Pensando獲得DPU技術(shù)。此次AMD稱，其P4 DPU架構(gòu)是世界上最智能的DPU，它能減少數(shù)據(jù)中心的網(wǎng)絡(luò)開銷，并提高了服務(wù)器的可管理性。AMD的Pensando SmartNICs是這種新數(shù)據(jù)中心架構(gòu)不可或缺的組成部分。

AMD還提到有自己的AI芯片軟件，名為ROCm。AMD總裁Victor Peng稱，在構(gòu)建強(qiáng)大的軟件堆棧方面，AMD取得了真正的巨大進(jìn)步，ROCm軟件棧可與模型、庫(kù)、框架和工具的開放生態(tài)系統(tǒng)配合使用。

風(fēng)險(xiǎn)提示及免責(zé)條款市場(chǎng)有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議，也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資，責(zé)任自負(fù)。

關(guān)鍵詞：