長期以來,電子垃圾(e-waste)一直是數(shù)據(jù)中心運營商在環(huán)境可持續(xù)性和社會責任方面面臨的一項挑戰(zhàn)。然而,圍繞人工智能的持續(xù)熱潮可能會使數(shù)據(jù)中心的電子垃圾問題變得更加嚴重。
因此,現(xiàn)在數(shù)據(jù)中心運營商以及在數(shù)據(jù)中心內(nèi)部署人工智能工作負載的企業(yè)應該開始考慮電子垃圾管理策略了。若能未雨綢繆,他們就可以減少人工智能基礎設施造成的電子垃圾數(shù)量。
數(shù)據(jù)中心電子垃圾:基礎知識
電子垃圾是指任何類型的不再使用并可能對環(huán)境造成危害的電子產(chǎn)品。數(shù)據(jù)中心的設備(如服務器、網(wǎng)絡交換機和電源裝置)可能含有鉛和汞等化學物質(zhì)。這意味著這些設備不再使用后有可能成為電子垃圾。
從環(huán)境可持續(xù)發(fā)展的角度來看,電子垃圾是有害的,因為數(shù)據(jù)中心設備中的危險化合物會滲入自然環(huán)境,對植物、動物和人類造成潛在危害。它還會對發(fā)展中國家的人民造成負面影響,因為這些國家往往是廢棄IT設備的最終歸宿。
人工智能會讓電子垃圾問題變得更糟糕嗎?
和很多技術行業(yè)一樣,幾十年來,數(shù)據(jù)中心一直在在助長電子垃圾的產(chǎn)生。但隨著越來越多的企業(yè)尋求利用人工智能,尤其是生成式人工智能,這一問題可能會越來越嚴峻。
因為生成式人工智能應用和服務必須經(jīng)過一個名為訓練的過程,這個過程需要解析大量數(shù)據(jù)以識別模式。訓練通常使用配備了圖形處理器(GPU)的服務器進行。GPU的訓練速度比傳統(tǒng)CPU快得多,因為GPU具有更高的并行計算能力,這意味著它們可以同時處理更多數(shù)據(jù)。
在大多數(shù)情況下,人工智能訓練是一個臨時或一次性的過程。人工智能模型一旦完成訓練,就不需要再次訓練,除非開發(fā)人員想“教”它新的信息。這意味著,要想訓練生成式人工智能模型很可能就要部署配備GPU的服務器,而對這些服務器的需求并不持續(xù)。
換句話說,在訓練結束后,企業(yè)啟動并運行了人工智能模型,對這些硬件的需求就會減少,因為除了訓練人工智能模型之外,數(shù)據(jù)中心里GPU的用例并不多,而絕大多數(shù)組織都不需要經(jīng)常重新進行訓練。
從電子垃圾的角度來看,這有可能導致一些GPU或配備GPU的整個服務器的壽命明顯縮短。它們?nèi)阅苷9ぷ?,但可能會因需求不足而被淘汰?
類似的故事已經(jīng)在加密貨幣挖礦領域上演過了——GPU和其他專用硬件也很重要,因為它們經(jīng)常被用于挖礦。由于為加密貨幣挖礦而制造的設備幾乎沒有其他有用的用途,因此很多設備也都成了電子垃圾。
減少人工智能造成的數(shù)據(jù)中心電子垃圾
好消息是,有一些方法可以避免人工智能訓練造成數(shù)據(jù)中心電子垃圾的大量增加。
其中一個關鍵步驟就是企業(yè)共享人工智能訓練服務器。企業(yè)可以選擇“GPU 即服務”(GPU-as-a-Service)產(chǎn)品,這實際上是租用 GPU,而不是自己購買配備 GPU 的服務器進行訓練。當他們完成訓練后,這些GPU就可以被其他需要訓練模型的企業(yè)使用。這比擁有無需持續(xù)使用的GPU服務器更具可持續(xù)性,更不用說成本效益了。
選擇使用預先訓練好的模型,而不是從頭開始構建模型,是幫助降低人工智能電子垃圾風險的另一種方法。越來越多的模型可以從開源項目中獲得,這些模型已經(jīng)過訓練,無需任何類型的專用數(shù)據(jù)中心基礎設施。
當然,企業(yè)還應該確保在不再需要人工智能服務器時對其進行適當?shù)幕厥栈蛱幚怼5诶硐肭闆r下,他們首先應該盡量減少部署的服務器數(shù)量,因為這些服務器有可能在短時間內(nèi)成為人工智能電子垃圾。