此前,美國(guó)政府允許英偉達(dá)向中國(guó)出售的AI芯片為“閹割版”芯片H200,性能被大幅限制。因此當(dāng)“滿(mǎn)血版”芯片H200對(duì)華解禁,在中國(guó)AI產(chǎn)業(yè)界掀起了不小的波瀾――中國(guó)AI產(chǎn)業(yè)迎來(lái)的是及時(shí)雨,還是新的不確定性?
H200芯片的水平怎么樣?
H200是英偉達(dá)在2023年發(fā)布的AI芯片,作為H100芯片的升級(jí)版,H200基于其Hopper架構(gòu),擁有141GB顯存容量,帶寬速度達(dá)每秒4.8TB,F(xiàn)P8算力逼近4PFLOPS。而中國(guó)特供的H20只有96GB顯存容量,帶寬速度為每秒4.0TB,F(xiàn)P8算力則僅為0.296PFLOPS,約為H200的1/6。簡(jiǎn)單來(lái)說(shuō),相比H20,H200能更流暢地處理千億級(jí)參數(shù)大模型的訓(xùn)練與推理任務(wù),減少數(shù)據(jù)傳輸瓶頸,讓AI研發(fā)效率實(shí)打?qū)嵉靥嵘?/p>
雖然H200的性能不及英偉達(dá)在2024年發(fā)布的Blackwell系列,但相比禁令前主流訓(xùn)練芯片H100和“閹割版”的H20,其性能具有明顯優(yōu)勢(shì)。
對(duì)于飽受算力短缺困擾的中國(guó)AI企業(yè)而言,這種優(yōu)勢(shì)無(wú)疑是具有吸引力的。
國(guó)產(chǎn)芯片與英偉達(dá)的差距在哪里?
在國(guó)產(chǎn)芯片方面,過(guò)去的禁令已經(jīng)讓中國(guó)企業(yè)深刻意識(shí)到芯片供應(yīng)鏈自主可控的重要性。兩年間,百度昆侖芯、華為N騰、寒武紀(jì)、摩爾線程等國(guó)產(chǎn)AI芯片廠商快速崛起,部分產(chǎn)品在算力指標(biāo)上已經(jīng)超過(guò)“閹割版”芯片H20,也能對(duì)標(biāo)此前的H100,但英偉達(dá)的優(yōu)勢(shì)不僅在硬件算力層面。
硬件層面,差距依然肉眼可見(jiàn)。以H200為例,其FP8Tensor算力達(dá)3958TFlops,而國(guó)內(nèi)主流芯片公開(kāi)數(shù)據(jù)大多集中在數(shù)百至千級(jí)別。更關(guān)鍵的是顯存帶寬和互聯(lián)技術(shù):H200的4.8TB/s帶寬與NVLink900GB/s互連帶寬,意味著單卡就能加載更大規(guī)模的模型,多卡集群間的數(shù)據(jù)同步也更高效。這直接決定了在訓(xùn)練千億參數(shù)模型時(shí),是需要幾十張卡勉強(qiáng)拼湊,還是幾張卡就能高效協(xié)同,后者不僅節(jié)省成本,更決定了研發(fā)迭代的速度。
相較于硬件的差距,軟件生態(tài)更難在短期內(nèi)形成。CUDA生態(tài)歷經(jīng)20年積累,已經(jīng)覆蓋全球數(shù)百萬(wàn)開(kāi)發(fā)者與海量?jī)?yōu)化庫(kù),形成了從底層驅(qū)動(dòng)到上層應(yīng)用的完整體系,成為全球AI開(kāi)發(fā)者的“默認(rèn)選項(xiàng)”。相比之下,國(guó)產(chǎn)芯片雖在積極構(gòu)建生態(tài)(如華為的MindSpore、百度的PaddlePaddle),但無(wú)論從工具鏈完整性、社區(qū)活躍度還是人才儲(chǔ)備上,仍有很長(zhǎng)路要走。這種生態(tài)差距帶來(lái)的實(shí)際影響是:即便國(guó)產(chǎn)芯片硬件參數(shù)接近,企業(yè)仍可能因“用不順手”“風(fēng)險(xiǎn)不可控”而猶豫,這其實(shí)也是是全球AI廠商共同面對(duì)的問(wèn)題。
H200解禁可能有哪些影響?
對(duì)于國(guó)內(nèi)AI廠商而言,既然H200的優(yōu)勢(shì)依然存在,那短期內(nèi)它們能夠借H200緩解算力問(wèn)題,降低大模型訓(xùn)練成本,避免企業(yè)在全球競(jìng)賽中掉隊(duì)。尤其對(duì)于資金雄厚的頭部企業(yè),采購(gòu)H200意味著能快速迭代產(chǎn)品,搶占市場(chǎng)先機(jī)。但長(zhǎng)期看,政策不確定性和供應(yīng)風(fēng)險(xiǎn)同樣依然存在,加之國(guó)內(nèi)的政策導(dǎo)向,國(guó)內(nèi)廠商難以對(duì)H200做長(zhǎng)期戰(zhàn)略投入。
對(duì)于國(guó)內(nèi)芯片廠商而言,H200的進(jìn)入無(wú)疑會(huì)在中高端市場(chǎng)形成直接競(jìng)爭(zhēng),短期內(nèi)AI廠商的策略性采購(gòu)必然導(dǎo)致國(guó)產(chǎn)芯片訂單量承壓。但換個(gè)角度看,美國(guó)政策的反復(fù)讓所有人看清,核心技術(shù)是買(mǎi)不來(lái)的。過(guò)去兩年的封鎖期,華為N騰、寒武紀(jì)等產(chǎn)品已在多個(gè)場(chǎng)景完成驗(yàn)證,積累了可觀客戶(hù)基礎(chǔ),這些努力不會(huì)白費(fèi)。更重要的是,在政策引導(dǎo)和供應(yīng)鏈安全考量下,AI廠商不會(huì)徹底放棄國(guó)產(chǎn)芯片,而是將其作為戰(zhàn)略備份持續(xù)投入。這為國(guó)產(chǎn)廠商贏得了寶貴窗口期,可以趁機(jī)繼續(xù)打磨硬件性能、完善軟件生態(tài),形成差異化競(jìng)爭(zhēng)力。關(guān)鍵在于,能否抓住這個(gè)窗口期加速追趕,在硬件性能與軟件生態(tài)構(gòu)建上實(shí)現(xiàn)突破。
對(duì)于國(guó)內(nèi)AI產(chǎn)業(yè)而言,真正的產(chǎn)業(yè)拐點(diǎn),不在于能否買(mǎi)到某款芯片,而在于國(guó)產(chǎn)生態(tài)何時(shí)能成熟到讓開(kāi)發(fā)者“無(wú)感遷移”。在這條路上,H200或許只是過(guò)客,而中國(guó)芯片產(chǎn)業(yè)的自立自強(qiáng),才是終局。
]]>