Q&A:OpenLedger聯合創辦人Ram Kumar2025.09.22
全文共1287字,讀完約需5分鐘

人工智能(AI)快速發展的當下,面臨著高質量數據不足的瓶頸。區塊鏈公司OpenLedger在2024年成立,設計一套AI結合區塊鏈的激勵機制,吸引用戶貢獻數據、訓練AI模型。該公司在成立之初已得到共1500萬美元的融資,其中種子輪由Polychain、Borderless Capital、HashKey Capital投資。《彭博商業周刊∕中文版》記者與OpenLedger聯合創辦人Ram Kumar進行採訪,了解公司的營運策略及發展優勢。

你成立公司的初衷是什麼?

我在前公司工作時,發現通用AI模型上搭建的應用程式不足以應付企業客戶在專業領域的工作需求,要搭建專有模型便需要對應的數據集,可它在市場上十分稀缺。

我們受到研究論文DATAINF的啟發。它是由史丹福大學生物醫學科技副教授James Zou等人撰寫的,說明了數據對AI模型的輸出結果的影響。我們在此之上建立了資料歸因協議,吸引用戶提供數據予開發者搭建及訓練AI模型。這個協議會按用戶的數據貢獻量及其對AI模型的推斷影響力給予報酬,讓AI模型開發人員與數據提供者分享部分利潤。這一切都運行在智能合約上,記錄在可驗證的分類賬。

平台現已有多款產品上線,例如開發者搭建AI模型的AI Studio、提供數據的Datanet、訓練AI模型的平台Model Factory。現時有12組開發團隊在我們的平台上搭建AI模型,涉及網絡數據使用、Solidity、健康、占星等領域。我們正在與不同的企業合作。

專有AI模型對高質量的數據有一定要求,需要人手反覆地清洗和標注數據,正如Scale.Ai等數據公司會高薪聘請醫學和律師等專業人士清洗數據。OpenLedger如何確保數據是高品質,並在商業上是可用的?又如何吸引用戶貢獻特定數據?

OpenLedger提供工具予開發者清洗數據。而大多數AI模型的開發團體都會有相應的專家團隊驗證數據,例如由醫療從業者開發的醫療AI模型,會有自己的醫生網絡。這種模式與AI模型開發平台HuggingFace相似,而最大的差別在於,我們會提供報酬激勵數據提供者,以確保數據品質。而HuggingFace其中99%的數據集都是沒用的。

相比起市場上的數據公司,他們往往是一次性買斷數據集的所有權。而在OpenLedger,數據提供者的數據擁有權被記錄在鏈上,每當有人使用你的數據,你就能得到對應的報酬。

我們的另一優勢在於能夠幫助企業客戶搭建更可解釋的AI模型。當企業用自己的數據集訓練AI模型時,可以使用我們的資料歸因工具,從而得知哪些數據實際上導致了AI模型的輸出。這種可追溯性能夠檢測訓練問題,讓他們刪除有問題的數據。市場上有大量的公司提供AI模型微調服務,但沒有一間公司像我們一樣提供AI模型的可解釋性。

你們的營收模式是怎樣的?

這有點像循環經濟。只有當用戶訓練的AI模型產生收入時,才會產生作報酬的加密貨幣。所以數據品質必須要好,必須有人在平台上構建好的AI模型,吸引更多人為了使用它而兌換貨幣,幣價隨著用量上升,從而產生更多報酬,為平台吸引更多的開發者、數據貢獻者和AI模型用戶。這種做法就像YouTube一樣:你有好的影片,有人看,拍片者得到了報酬,從而吸引更多人製作更好的影片,吸引更多用戶。

請問公司未來的發展目標是什麼?

主要目標是形成這種循環經濟。我們期望在今年內平台會有100個AI模型,並有相應的高品質數據集,為用戶提供實現訓練所需的工具和解決方案,並使這些AI模型能夠持續發展。長遠而言,我們希望擁有比HackingFace更大的影響力,取代它作為高品質數據集和構建AI模型的主要平台。──黃舜煬