李開復(攝影:Hollie Adams/Bloomberg)
電腦科學家李開復創立的一間中國初創公司,在不到八個月的時間里就躋身獨角獸行列,依靠的是一種新的開源人工智能模型,至少在某些指標上,已經領先於矽谷表現最頂尖的模型。
李開復在接受採訪時表示,這間名叫零一萬物(01.AI)的公司在完成一輪融資後,估值已經超過10億美元,阿里巴巴集團旗下雲計算部門也參與了此輪融資。擔任風險投資公司創新工場(Sinovation Ventures)行政總裁的李開復也將兼任這間新初創公司的行政總裁。他在今年3月開始為零一萬物組建團隊,於6月開始營運。
這間初創公司位於北京,其開源基礎大型語言模型Yi-34B現在面向世界各地的開發人員提供中文和英文版本,大型語言模型(LLM)是基於大量數據進行訓練的電腦算法,用於閱讀、理解和生成類似人類的文本、圖像和代碼。
在關鍵指標上,Yi-34B的表現優於市場上已有的領先開源模型,包括Meta備受好評的Llama 2。Hugging Face評選各類表現最佳的大型語言模型,該公司上周末發布的評估結果顯示,在所謂的預訓練基礎大型語言模型中,Yi-34B模型排名首位。
「Llama 2一直是黃金標準,對開源社區做出了巨大貢獻,」現年61歲的李開復通過Zoom接受採訪時說,「我們希望不僅為中國,也為全球市場提供更出色的選擇方案。」
總部位於三藩市的OpenAI在去年推出ChatGPT聊天機器人後,引發了各界對人工智能的狂熱興趣。Alphabet、微軟公司(Microsoft)和Meta已經在研發上投入了數十億美元,尋求在生成式人工智能等新興領域佔據領先地位。而馬斯克(Elon Musk)剛剛發布了一款名為「Grok」的聊天機器人。
在中國,科技巨頭和企業家也紛紛涉足這一領域,搜索領域的領軍企業百度公司發布了大型語言模型聊天機器人Ernie的4.0版本,聲稱該版本與OpenAI的技術不相上下。阿里巴巴在這個領域至少投資了三間企業,其中包括零一萬物。中美兩國的人工智能公司在很大程度上不會相互競爭,因為中國無法獲取美國的技術。
儘管如此,美國和中國之間日益緊張的政治關係,還是讓人工智能的發展變得更加複雜。去年,美國總統拜登(Joe Biden)的政府禁止向中國客戶出售輝達公司最先進的人工智能半導體,理由是國家安全方面的顧慮,擔憂這項技術可能被用來訓練用於軍事用途的人工智能模型。上個月,美國進一步收緊了這些限制,禁止輝達銷售專門為中國市場設計性能略次的晶片。
李開復稱這種情況「令人遺憾」,但表示零一萬物備足了在可預見的未來所需的晶片。這間初創公司今年早些時候開始囤積半導體,甚至向創新工場借錢進行採購。
「我們基本上押上了全部身家,透支了我們原有的銀行賬戶,」他說,「我們覺得我們必須這麼做。」
在投身風險投資行業前,李開復曾經在Google、微軟和Apple公司工作過,他在零一萬物組建了一支超過100人的團隊,招攬了他原先美國企業的前同事和一直在海外工作的中國人。他表示,這個團隊不僅包括人工智能專家,還有經驗豐富的商業人才,他們可以協助從併購到首次公開招股等各種事務。
零一萬物已經在謀劃剛剛推出的開源模型之外的商業戰略。這間初創公司將與客戶合作,開發針對特定行業或競爭形勢量身定制的專屬方案。例如,Yi-34B因訓練中使用的340億個參數而得名,但這間初創公司已經在研究使用超過1000億個參數的模型。
「我們的專有模型將以GPT-4為基準,」李開復說,他指的是OpenAI的大型語言模型。
他說,提供中英文系統將為銀行、保險公司和貿易公司等全球性公司帶來優勢。這間初創公司計劃在未來增加更多的語言。
李開復在人工智能方面的工作可以追溯到幾十年前。1982年,他在卡尼基美隆大學(Carnegie Mellon University)碩士的申請書中寫道,他想把自己的一生獻給人工智能研究,因為這項技術能幫助人類更好地瞭解自己。他後來寫了兩本暢銷書:《AI.未來》(AI Superpowers: China, Silicon Valley and the New World Order)和《AI未來進行式》(AI 2041: Ten Visions for Our Future)。
「這是人類最大的突破,」李開復說,「這也是瞭解我們自己的最後一步。」
李開復說,他經常想知道這項技術的前景能否在他有生之年實現——直到他看到了最新一代大型語言模型的實力。由於這項技術前景良好,有機會把他作為電腦科學家、作家和高管的身份聯繫起來,他決定拋開風險投資人的慣常角色,成為一名創業公司的行政總裁。
零一萬物之所以選擇建構一個開源模型,是因為絕大多數人工智能開發人員負擔不起或者不需要規模最大、最昂貴的模型。開源人工智能系統就像開源軟件一樣,源代碼可以修改和增強。
剛剛推出的人工智能系統的規模(340億個參數)經過了精心選擇,這樣就可以在價格不太昂貴的電腦上運行。該公司還將發布一個60億參數規模的模型,以吸引更廣泛的開發人員。「這是一個經過深思熟慮的決定,」李開復說,「世界不需要另一種任意的模式,世界需要我們。」
李開復說,他所在的風險投資公司的有限合夥人向他提出了一些問題,問他將如何平衡自己擔任的雙重行政總裁角色。他指出,如果每周花40個小時在創新工場,那麼每周還有128個小時。「我還有86個小時投入零一萬物的工作,同時也不會忽視我在創新工場的職責,」李開復說,暗示他可能每天花6個小時來睡覺和做生活中的其他事情。
—— 翻譯 孟潔冰