2/15/2023,光纖在線訊,ChatGPT引發(fā)的算力增長(zhǎng)熱潮直接引發(fā)國(guó)內(nèi)CPO相關(guān)技術(shù)研發(fā)廠商的股價(jià)大漲。雖然以光纖在線多站在國(guó)內(nèi)光模塊廠商的角度看問(wèn)題,CPO會(huì)是對(duì)國(guó)內(nèi)光模塊公司擅長(zhǎng)的可插拔技術(shù)的顛覆性技術(shù),會(huì)顛覆中國(guó)光模塊供應(yīng)商的競(jìng)爭(zhēng)優(yōu)勢(shì)。而且可插拔技術(shù)其實(shí)一直也在進(jìn)步。所以,或許我們不應(yīng)該對(duì)CPO那么感冒。
剛剛結(jié)束的Photonic West上也有一場(chǎng)關(guān)于CPO技術(shù)的Panel討論。市場(chǎng)研究公司Lightcounting最新的研報(bào)對(duì)此進(jìn)行了報(bào)道。這場(chǎng)討論之所以有趣,首先在于提出了一個(gè)很好的問(wèn)題,既然網(wǎng)絡(luò)產(chǎn)生的功耗只占當(dāng)前數(shù)據(jù)中心總體功耗的2-3%,那么我們?yōu)槭裁催要對(duì)這個(gè)問(wèn)題這么看重呢?由此引發(fā)的就是,真的需要CPO嗎?
來(lái)自相干公司的Vipul Bhat引用兩年前科學(xué)雜志一篇文章的數(shù)據(jù)指出人們對(duì)于數(shù)據(jù)中心功耗的擔(dān)心有點(diǎn)過(guò)了(就像時(shí)下人們擔(dān)心全球變暖一樣?)。這篇文章比較了2010年和2018年的數(shù)據(jù)中心功耗,發(fā)現(xiàn)只增長(zhǎng)了8%,將這一數(shù)據(jù)外插到2022-2023年度,增速只有2-3%。而導(dǎo)致這一低增速的背后是數(shù)據(jù)中心效率的提升,包括第一,負(fù)載從企業(yè)數(shù)據(jù)中心向云數(shù)據(jù)中心的遷移;第二,占功耗90%的服務(wù)器和存儲(chǔ)器效率的穩(wěn)步提升。而直接部署光通信產(chǎn)品的網(wǎng)絡(luò)部分導(dǎo)致的功耗占比在2012年是1%,到2018年是2%,2022年大約是3%。那么問(wèn)題來(lái)了?致力于降低數(shù)據(jù)中心光傳輸功耗的CPO技術(shù)還值得這么重視嗎?
對(duì)此問(wèn)題,LightCounting給出了自己的分析。如下圖可看,縱坐標(biāo)的對(duì)數(shù)的每年數(shù)據(jù)中心功耗(不是累計(jì)的),橫坐標(biāo)是年份。這種對(duì)數(shù)坐標(biāo)下的直線增長(zhǎng)意味著指數(shù)級(jí)的增長(zhǎng)。所以,LC的結(jié)論是,對(duì)質(zhì)疑者來(lái)說(shuō),當(dāng)年發(fā)現(xiàn)功耗開(kāi)始變大時(shí),可能已經(jīng)太晚了。2018年到2022年期間,數(shù)據(jù)中心部署的光模塊的總功耗是330MW(秦山核電站總裝機(jī)容量的20分之一),或者1.2TWh(12億度電),只占到同期云數(shù)據(jù)中心總功耗的1%,但問(wèn)題是到2028年,這一比例將達(dá)到8%以上,這還考慮到可插拔模塊自身功耗效率的提升,從100G模塊的35pJ每比特到800G模塊的20pJ每比特。8%將是一個(gè)不可忽視的比例。因?yàn)閷?duì)于一直受到供電限制的數(shù)據(jù)中心運(yùn)營(yíng)商來(lái)說(shuō),光模塊增加的功耗,必須要從減少服務(wù)器和存儲(chǔ)的部署來(lái)找補(bǔ)。
一個(gè)更顯著的問(wèn)題是AI服務(wù)器如今受到光連接的功耗和成本的嚴(yán)重限制。Nvidia說(shuō),如果沒(méi)有光連接的限制,他們本可以部署的光模塊會(huì)是現(xiàn)在的32倍。人工智能的計(jì)算需要大量的GPU和帶寬支持,光連接會(huì)是最好的解決方案,如果光連接的功耗和成本能夠降低的化。
來(lái)自Ayar Labs,博通,IBM和Ranovus等公司的下一代CPO設(shè)計(jì)預(yù)計(jì)在能量效率上可以達(dá)到2-3pJ每比特。Ayar Labs共同創(chuàng)辦人Rajeev Ram教授指出,采用現(xiàn)在的技術(shù),在200G每通道下,有望實(shí)現(xiàn)0.1pJ每比特。他在MIT的團(tuán)隊(duì)正在通過(guò)低電壓調(diào)制器以及更好的探測(cè)器等手段爭(zhēng)取實(shí)現(xiàn)0.001pJ每比特的連接功耗,F(xiàn)在MIT和Ayar Labs的方案實(shí)現(xiàn)低連接功耗都是基于較低的速率,比如Ayar Labs是64G NRZ來(lái)實(shí)現(xiàn)2pJ,每比特,是否能在112G每通道以上實(shí)現(xiàn)1pJ每比特的能量效率還要觀察。
LightCounting認(rèn)為:“光通信行業(yè)正處在十字路口,我們可以堅(jiān)持可插拔逐步改善,人工智能可能因此放慢發(fā)展速度,采用受限于帶寬的優(yōu)化算法;蛘呶覀儾捎闷渌k法,冒險(xiǎn)來(lái)采用CPO技術(shù)來(lái)實(shí)現(xiàn)根本性改變。這將根本改變光模塊工業(yè)的面貌。這一路徑激動(dòng)人心,但是充滿挑戰(zhàn)。無(wú)論如何,錯(cuò)過(guò)這個(gè)機(jī)會(huì)都是一個(gè)錯(cuò)誤。”