作者:Doug Petkanics,Livepeer CEO;翻譯:0xxz@喜來順財經(jīng)
當人們發(fā)現(xiàn) Livepeer 網(wǎng)絡(luò)有數(shù)千個 GPU 活躍地用于每周轉(zhuǎn)碼數(shù)百萬分鐘的視頻時,最常見的問題之一是這些 GPU 是否可以用于執(zhí)行其他類型的計算。特別是,隨著 2023 年人工智能的興起,以及對 GPU(用于執(zhí)行人工智能訓(xùn)練和推理的硬件)需求的相關(guān)增長,人們自然會認為 Livepeer 網(wǎng)絡(luò)可以利用其算力進軍到人工智能基礎(chǔ)設(shè)施上,人工智能基礎(chǔ)設(shè)施花費數(shù)十億美元。NVidia 的數(shù)據(jù)中心業(yè)務(wù)為 AI 計算提供 GPU,僅上個季度就實現(xiàn)了 140 億美元的收入增長,高于去年同期的 40 億美元。

資料來源:NVidia 季度報告,來自 X 上的@Thomas_Woodside
那些做出這些假設(shè)的人是正確的——Livepeer 網(wǎng)絡(luò)當然可以被那些尋求具有顛覆性成本的人工智能處理的人使用。隨著近幾個月通過Livepeer Studi實現(xiàn)的 Livepeer 視頻使用量的增長以及新社區(qū)管理的 Livepeer 金庫的推出,奠定了基礎(chǔ),現(xiàn)在是時候?qū)?AI 視頻計算功能引入Livepeer了。
本文下面部分將闡述如何在Livepeer網(wǎng)絡(luò)上引入人工智能視頻計算,以及使其成為現(xiàn)實的計劃、策略和時間表。
Livepeer 始終致力于其使命:構(gòu)建世界開放視頻基礎(chǔ)設(shè)施。其他計算平臺試圖成為通用的“區(qū)塊鏈上的 AWS”或“運行任何類型的計算任務(wù)”類型的市場,但由于缺乏針對行業(yè)的解決方案的能力,這給市場進入帶來了挑戰(zhàn)部分。相反,Livepeer 通過轉(zhuǎn)碼專注于視頻計算,并能夠為特定行業(yè)(超過1000億美元的視頻流市場)構(gòu)建有針對性的產(chǎn)品和 GTM,以解決實際用例并挖掘現(xiàn)有需求,而不是營銷沒有人想要的通用的抽象解決方案。
對視頻的關(guān)注意味著 Livepeer 避免過度反應(yīng)并轉(zhuǎn)向 ICO、NFT 或 DeFi 等最新熱門趨勢,而是始終詢問這些創(chuàng)新如何應(yīng)用于視頻。高點沒有那么高,但更重要的是,低點也沒有那么低。這也吸引了一個以任務(wù)為中心的團隊和社區(qū),擁有深厚的視頻專業(yè)知識,他們對我們在很長一段時間內(nèi)所做的事情感到興奮,而不是當本月的趨勢失去動力時離去的社區(qū)。
目前,沒有什么趨勢比人工智能的快速崛起更熱門了。但與許多加密貨幣團隊和項目不同的是,Livepeer 并沒有放棄其使命并“轉(zhuǎn)向人工智能”。相反,我們提出了這樣的問題:人工智能將如何影響視頻的未來。人工智能在很多方面降低了視頻創(chuàng)作者的門檻。兩個重要的因素是首先減少創(chuàng)作的時間和成本,以及減少高質(zhì)量視頻制作和輸出的時間、成本和專業(yè)知識。
在創(chuàng)作方面,生成式人工智能可用于根據(jù)文本或圖像提示創(chuàng)建視頻剪輯。過去,設(shè)置場景需要攝制組、布景、攝像機、腳本、演員、編輯等,現(xiàn)在可能只需要用戶在鍵盤上輸入文本提示,然后等待幾分鐘,讓 GPU 生成樣本潛在的結(jié)果。生成視頻不會取代高質(zhì)量的作品,但它可以在流程的各個階段節(jié)省大量成本。
在制作方面,無論是由人工智能創(chuàng)建還是由創(chuàng)作者提交,諸如升級、幀插值、字幕生成等功能都可以快速提高視頻內(nèi)容的質(zhì)量和可訪問性。視頻中的交互性等高級功能可以通過自動對象檢測、屏蔽和場景類型分類來啟用。
Livepeer 利用這一 AI 功能集的時機令人興奮,因為最近發(fā)布了開源基礎(chǔ)模型,包括?Stable Video Diffusion、ESRGAN、FAST 等,這些模型都與閉源專有模型保持同步。其目標是讓世界上的開放視頻基礎(chǔ)設(shè)施支持運行所有人都可以訪問的開源模型,這些模型現(xiàn)在已經(jīng)存在,并且由于開源人工智能社區(qū)的創(chuàng)新而快速變得更好。
人工智能生命周期有很多階段,但通常需要大量計算能力的三個階段是訓(xùn)練、微調(diào)和推理。簡而言之:
訓(xùn)練需要創(chuàng)建模型并在非常大的數(shù)據(jù)集上運行計算。有時,這需要在訓(xùn)練基礎(chǔ)模型(例如通過 OpenAI 或 Google 訓(xùn)練的模型)時進行價值數(shù)千或數(shù)億美元的計算。
微調(diào)更具成本效益,并且采用現(xiàn)有的基礎(chǔ)模型,但根據(jù)特定任務(wù)的一組特定輸入來調(diào)整權(quán)重。
推理是采用已經(jīng)訓(xùn)練和調(diào)整的模型,并讓它產(chǎn)生輸出或根據(jù)輸入集進行預(yù)測的行為。對于一個推理作業(yè),相對于前兩個階段,這在計算方面通常很便宜,但通常會一遍又一遍地執(zhí)行數(shù)百萬次,因此推理的花費超過了訓(xùn)練的成本,因此證明訓(xùn)練投資的合理性。
訓(xùn)練和微調(diào)需要訪問大型數(shù)據(jù)集和密集聯(lián)網(wǎng)的 GPU,以便它們能夠相互通信并快速共享信息。像 Livepeer 這樣的網(wǎng)絡(luò)不太適合開箱即用的訓(xùn)練,并且需要進行重大更新才能完成任務(wù)。雖然去中心化網(wǎng)絡(luò)作為專有大型技術(shù)訓(xùn)練云的替代品對于訓(xùn)練來說很有吸引力,但由于網(wǎng)絡(luò)開銷和訓(xùn)練基礎(chǔ)模型時的低效率,從成本角度來看,去中心化網(wǎng)絡(luò)是否具有競爭力是值得懷疑的。
另一方面,推理是像 Livepeer 這樣的去中心化網(wǎng)絡(luò)可以發(fā)揮作用的地方。每個節(jié)點運營商都可以選擇將給定模型加載到其 GPU 上,并且可以在成本上進行競爭,以根據(jù)用戶輸入執(zhí)行推理作業(yè)。就像在 Livepeer 轉(zhuǎn)碼網(wǎng)絡(luò)中一樣,用戶可以向 Livepeer 網(wǎng)絡(luò)提交作業(yè)來執(zhí)行 AI 推理,并且應(yīng)該獲得公開市場競爭定價的好處,可以利用當前閑置的 GPU 功率,從而看到成本效益。
GPU 是人工智能熱潮的命脈。NVidia 的數(shù)據(jù)中心業(yè)務(wù)以 GPU 需求為基礎(chǔ),在過去一年呈指數(shù)級增長。埃隆·馬斯克 (Elon Musk) 開玩笑地表示,GPU 比毒品更難買到。然而,像 Livepeer 這樣的 DePIN 網(wǎng)絡(luò)已經(jīng)表明,通過其開放的市場動態(tài),以及通過通脹代幣獎勵來引導(dǎo)激勵,它們可以在需求之前吸引全球 GPU 供應(yīng),從而可以彈性地支持新用戶和應(yīng)用程序的增長。近乎無限的即用即付容量。開發(fā)人員不再需要以高價提前預(yù)留不使用時閑置的硬件,而是可以按盡可能低的市場價格付費。這是去中心化網(wǎng)絡(luò)推動人工智能繁榮的巨大機會。

讓連接到 Livepeer 的1000個GPU 發(fā)揮作用
GCP 或 AWS 等云提供商允許你在其企業(yè)云上“預(yù)留 GPU 服務(wù)器”。像 Akash 這樣的開放網(wǎng)絡(luò)更進一步,讓你可以從世界各地的眾多去中心化提供商之一按需租用服務(wù)器。但無論上述選擇如何,你都必須管理租用的服務(wù)器來運行模型并執(zhí)行任務(wù)。如果你想構(gòu)建一個可以同時執(zhí)行多個任務(wù)的應(yīng)用程序,則必須對其進行擴展。你必須將工作流程鏈接在一起。
Livepeer 將事物抽象為“工作”,你可以將其提交到網(wǎng)絡(luò)并相信它會完成。Livepeer 已經(jīng)通過視頻轉(zhuǎn)碼實現(xiàn)了這一點,其工作是提交一段 2 秒的視頻片段進行轉(zhuǎn)碼。你只需將作業(yè)發(fā)送到網(wǎng)絡(luò),并且可以確信你的廣播節(jié)點將可靠地完成該作業(yè),并負責工作節(jié)點選擇、故障轉(zhuǎn)移和冗余。
對于人工智能視頻計算任務(wù),它可以以同樣的方式工作。可能有一個“從文本生成視頻”的工作。你可以相信你的節(jié)點將完成此任務(wù),并且你可以將其擴展到你想要通過單個節(jié)點同時提交的任意數(shù)量的作業(yè),該節(jié)點可以利用數(shù)千個 GPU 的網(wǎng)絡(luò)來執(zhí)行實際計算。向前邁出一步 - 這仍然處于設(shè)計階段 - 你可以提交整個工作流程,例如
從文本生成視頻
升高一級
進行幀插值使其播放流暢
網(wǎng)絡(luò)可以為你做到這一點,而你無需將單獨的模型部署到單獨的機器、管理 IO、共享存儲等。不再需要管理服務(wù)器、擴展服務(wù)器、進行故障轉(zhuǎn)移等。Livepeer 是一個可擴展的基礎(chǔ)設(shè)施,具有最大的成本效益且高度可靠。如果網(wǎng)絡(luò)能夠兌現(xiàn)人工智能視頻計算的這些承諾,就像它在視頻轉(zhuǎn)碼工作中所做的那樣,它將提供新水平的開發(fā)人員體驗和成本降低,這是開放人工智能世界中尚未見過的。
與Livepeer過去7年的歷程一致,該項目將致力于展示真實的、可用的、功能性的、開源的軟件和網(wǎng)絡(luò)能力,然后再進行“Livepeer有這個”的宣傳。以下是實現(xiàn)這一目標的計劃的簡短版本:
為其他作業(yè)類型選擇特定的初始用例,而不僅僅是視頻轉(zhuǎn)碼:基于 AI 的生成視頻,由 AI 升級和幀插值支持。偉大的開放模型,例如Stable Video Diffusion,在這個領(lǐng)域每天都在不斷發(fā)展。
通過在節(jié)點軟件的分叉/尖峰內(nèi)構(gòu)建來快速行動,將這些功能添加到我們的協(xié)調(diào)器(供應(yīng)方)節(jié)點和廣播器(需求方)節(jié)點。Livepeer 的開放媒體服務(wù)器 Catalyst 應(yīng)支持用于請求和使用這些生成視頻任務(wù)的接口。
運行此峰值的用戶將在 Livepeer 上形成某種子網(wǎng)絡(luò),但他們將使用 Livepeer 協(xié)議來發(fā)現(xiàn)并向通過 Livepeer 主網(wǎng)運行此新功能的節(jié)點付款。
與面向消費者的前端應(yīng)用程序合作,利用 Livepeer 極具成本效益的開放計算網(wǎng)絡(luò),并捕獲和展示驗證 Livepeer 相對于公共云的成本效益的數(shù)據(jù)。
在我們驗證這一點后,合并到核心 Livepeer 客戶端,添加其他工作類型,并圍繞利用其他形式的基于 AI 的視頻計算來發(fā)展生態(tài)系統(tǒng)。

AI 視頻子網(wǎng)絡(luò)節(jié)點與轉(zhuǎn)碼節(jié)點一起運行,同時使用 Livepeer 主網(wǎng)支付。
Livepeer 最近通過其Delta 升級向該協(xié)議引入了一個由鏈上金庫管理的社區(qū),并且?guī)讉€月來一直在使用 LPT 來資助公共產(chǎn)品計劃。目前已經(jīng)有一項預(yù)提案正在討論中并接近投票,該提案旨在資助一個特殊目的實體(或 SPE),該實體致力于使人工智能視頻計算前景成為現(xiàn)實。第一個提案旨在實現(xiàn)核心開發(fā),以完成上面列出的前 4 項任務(wù),包括:
將這些 AI 功能開發(fā)為 Livepeer 節(jié)點分叉
節(jié)點運營商可以形成一個子網(wǎng)絡(luò),通過在 Livepeer 主網(wǎng)上支付來執(zhí)行這些任務(wù)。
一個向消費者展示這些功能的前端應(yīng)用程序。
基準和數(shù)據(jù)的集合,顯示 Livepeer 網(wǎng)絡(luò)大規(guī)模執(zhí)行人工智能推理的成本效益。
它還提出了未來潛在的融資里程碑,即從金庫提供基礎(chǔ)設(shè)施信貸,以支付該數(shù)據(jù)收集期間消費者使用的初始成本。
Livepeer Discord 中的 #ai-video 頻道已成為圍繞該計劃進行討論和合作的熱點,任何相信開放 AI 基礎(chǔ)設(shè)施和視頻 AI 計算未來的人都應(yīng)該過來打個招呼并參與其中。節(jié)點運營商已經(jīng)開始對不同的硬件進行基準測試,熟悉運行這些開放視頻模型,并解決從視頻轉(zhuǎn)碼專業(yè)轉(zhuǎn)向其他視頻特定作業(yè)類型的挑戰(zhàn)。成為一個快速發(fā)展的項目團隊的一員是一段有趣的時光。
雖然這個最初的里程碑可以表明 Livepeer 對于支持的特定形式的 AI 視頻計算具有成本效益,但真正的終極力量在于 AI 開發(fā)人員能夠 BYO 模型、BYO 權(quán)重、BYO 微調(diào)或部署自定義LoRA 建立在網(wǎng)絡(luò)現(xiàn)有基礎(chǔ)模型之上。
支持這些初始功能,跨越一組不同的模型和計算形式,將導(dǎo)致節(jié)點操作、GPU 上的模型加載/卸載、節(jié)點發(fā)現(xiàn)和協(xié)商、故障轉(zhuǎn)移、支付、驗證等領(lǐng)域的快速學(xué)習當談到人工智能視頻計算時。從那里,我們可以評估 Livepeer 網(wǎng)絡(luò)上生產(chǎn)和支持任意 AI 視頻計算作業(yè)類型的未來里程碑。
早期,視頻特定平臺(例如 Livepeer Studio)可以為視頻開發(fā)人員構(gòu)建 API 和產(chǎn)品,以利用支持的模型。消費者應(yīng)用程序(例如 AI Video SPE 中提出的應(yīng)用程序)可以通過 Catalyst 節(jié)點直接在 Livepeer 網(wǎng)絡(luò)上使用這些功能。但隨著這些功能的擴展,以創(chuàng)作者為中心的新人工智能業(yè)務(wù)可以形成,并利用 Livepeer 的全球 GPU 網(wǎng)絡(luò),以經(jīng)濟高效的方式構(gòu)建定制體驗,而無需依賴昂貴的大型技術(shù)云及其專有模型作為業(yè)務(wù)支柱。
這是一條令人興奮的道路,需要跑才能到達那里。毫無疑問,人工智能將在未來幾年以超乎我們想象的速度改變視頻世界,我們期待世界的開放視頻基礎(chǔ)設(shè)施成為未來實現(xiàn)這一大膽新技術(shù)所需的所有計算的最具成本效益、可擴展性和可靠的骨干網(wǎng)。