AI見聞日?qǐng)?bào):英偉達(dá)GH200不僅影響光模塊用量,還應(yīng)關(guān)注PCB和存儲(chǔ) | 見智研究|微頭條
今日要點(diǎn):
(相關(guān)資料圖)
1、英偉達(dá)超級(jí)計(jì)算平臺(tái)除了讓光模塊“發(fā)光”,更不能忽略存儲(chǔ)和PCB;
2、出現(xiàn)了比Meta更好的開源大模型?
3、政策鼓勵(lì)A(yù)I產(chǎn)業(yè)發(fā)展,算力將得到更合理分配,還應(yīng)關(guān)注數(shù)據(jù)中心上架率;
見聞視角
海外AI
1、英偉達(dá)GH200對(duì)光模塊用量增加已成為普遍共識(shí),更不能忽略存儲(chǔ)和PCB
昨天我們提到英偉達(dá)發(fā)布超強(qiáng)AI計(jì)算平臺(tái)DGX GH200,很多人關(guān)注該款超級(jí)計(jì)算機(jī)對(duì)光模塊需求影響的程度。
根據(jù)多家券商的測算情況,市場普遍認(rèn)為光模塊的用量還是呈現(xiàn)較大幅度的提高。新架構(gòu)全光方案GPU:800G光模塊數(shù)量比1:18,半光方案GPU:800G光模塊數(shù)量比1:9。
具體來看,每個(gè)Node單向帶寬450GB/s(900GB/s雙向帶寬),8顆Superchip累計(jì)3.6TB/s單向帶寬,800G光模塊實(shí)際傳輸能力為100GB/s,即一個(gè)Node單向傳輸需要36個(gè)800G光模塊,全系統(tǒng)共2個(gè)上行方向+2個(gè)下行方向,累計(jì)需要144個(gè)800G光模塊(對(duì)應(yīng)8顆Superchip),即800G全光方案比例關(guān)系為1:18。類似的,400G全光方案比例關(guān)系為1:36,800G半光方案比例關(guān)系為1:9。
除模塊之外,見智研究認(rèn)為:還應(yīng)關(guān)注內(nèi)存和PCB的增量價(jià)值。
GH200單顆芯片需要480GB LPDDR5內(nèi)存+96GB的HBM顯存。而上一代DGX H100服務(wù)器中,平均單顆H100芯片對(duì)應(yīng)256GB內(nèi)存,以及80GB的HBM。二者對(duì)比,GH200方案的存儲(chǔ)器價(jià)值量有顯著提升。
PCB:傳統(tǒng)服務(wù)器中,主板單價(jià)近5000元/平米;加速卡板單價(jià)更高,隨著層數(shù)、材質(zhì)、加工難度的提升,可達(dá)1w+/平米。
GH200超級(jí)芯片是CPU+GPU二合一,集成度提升可以省去部分主板PCB,但相較傳統(tǒng)加速卡面積更大,同時(shí)要在加速卡板材質(zhì)、層數(shù)、HDI等方面進(jìn)一步升級(jí)。
2、出現(xiàn)了比Meta更好的開源大模型?
一款名為FalconLM 開源語言模型說是提供了比 Meta 的 LLaMA 更好的性能,是迄今為止最強(qiáng)大的開源語言模型。
該款模型是由阿拉伯聯(lián)合酋長國阿布扎比的技術(shù)創(chuàng)新研究所 (TII) 開發(fā),F(xiàn)alconLM 最大的變體擁有400億個(gè)參數(shù),可以用于商業(yè)。但如果收入超過100萬美元,則商業(yè)用途需要繳納特許權(quán)使用費(fèi)。在總結(jié)各種基準(zhǔn)測試結(jié)果的Hugging Face OpenLLM 排行榜上,兩個(gè)最大的 FalconLM 模型(其中一個(gè)已經(jīng)用指令進(jìn)行了改進(jìn))目前以顯著優(yōu)勢占據(jù)前兩名。
見智研究認(rèn)為:開源語言模型如雨后春筍般的冒出,部分基礎(chǔ)大模型的性能也表現(xiàn)出較強(qiáng)的優(yōu)勢。FalconLM相較于其他開源模型的競爭優(yōu)勢的包括在訓(xùn)練數(shù)據(jù)的選擇,從公共爬網(wǎng)數(shù)據(jù)集中提取高質(zhì)量數(shù)據(jù)并刪除重復(fù)數(shù)據(jù)的流程。在徹底清除重復(fù)數(shù)據(jù)后,仍保留了5萬億條文本(token)——足以訓(xùn)練強(qiáng)大的語言模型。此外, FalconLM優(yōu)化后的架構(gòu)能夠很大程度提高計(jì)算能力,推理成本僅為GPT3的五分之一。
國內(nèi)AI
政策鼓勵(lì)加強(qiáng)算力的部署和分配,還應(yīng)該關(guān)注數(shù)據(jù)中心上架率
北京市政府辦公廳正式發(fā)布《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》,主要包括五大方面:1、提升算力資源統(tǒng)籌供給能力;2、提升高質(zhì)量數(shù)據(jù)要素供給能力;3、系統(tǒng)構(gòu)建大模型等通用人工智能技術(shù)體系;4、推動(dòng)通用人工智能技術(shù)創(chuàng)新場景應(yīng)用;5、探索營造包容審慎的監(jiān)管環(huán)境。
見智研究認(rèn)為:在政策的推動(dòng)下,算力、數(shù)據(jù)要素市場將會(huì)進(jìn)一步得到全面的效率優(yōu)化和監(jiān)管,會(huì)給民營企業(yè)在租用算力上來帶便捷度,從而促進(jìn)行業(yè)的良性發(fā)展。
從基礎(chǔ)設(shè)施方面來看,AI新基建主要會(huì)圍繞數(shù)據(jù)中心、超算中心的建設(shè)以及配套設(shè)備需求提高,具體包括AI服務(wù)器、高速交換機(jī)、光模塊、制冷設(shè)備、電源設(shè)備等。應(yīng)用場景方面鼓勵(lì)創(chuàng)新同樣會(huì)正向刺激算力的需求。但仍需關(guān)注數(shù)據(jù)中心目前機(jī)架上機(jī)率的情況,是否已經(jīng)達(dá)到較高水平。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: