在極端天氣日益惡化、美國和其他地方資金削減威脅到科學研究的當下,人工智能(AI)正在為一些氣候研究項目提供急需的助力。
儘管生成式AI因訓練和運行複雜模型期間消耗大量電力而備受批評,但這項技術也有望推動科學進步。
「這是向前邁出的一大步,」西班牙北部AZTI海洋研究中心的生物學家博爾雅(Ángel Borja)表示,「這將使我們能更快地處理數據並獲得結果,從而讓做決策的人也能更快地採取行動。」
研究人員正在訓練現有的AI模型,並創建新的模型來執行那些本需要數人花費數周甚至數月時間才能完成的常規任務。將從海底到南極洲最偏遠角落的科學考察所收集的數據分類,現在只需幾小時就能完成。
當然,一些科學家已警告說,生成式AI的使用存在風險。Project Drawdown的執行董事福利(Jonathan Foley)表示,機器學習技術只是工具,永遠不應取代人類的思考、寫作和分析。這個組織利用科學數據為氣候解決方案提供指導,它們目前AI助手的用途僅限於檢查語法、格式化文檔和從分散來源抓取資訊等簡單任務。
福利說:「從定義上說,生成式AI依賴於抄襲(儘管是在統計意義上),並且經常捏造資訊、引文、數據和創意內容。」
但這並沒有阻止其他研究人員繼續進取地開拓。以下是三個例子。
AI幫助海洋研究人員「更快得出結論」
博爾雅回憶說,在45年前他剛開始從事科學工作時,需要人手收集數據,將數百個測量數據錄入資料庫。後來電腦和互聯網的興起加快了部分工作進程。但他表示,過去三四年間AI的發展感覺完全不同,也更具變革性。
「我的年輕同事擔心AI會搶走他們的工作,讓我們變得多餘,」他說,「但事實恰好相反:正是因為AI在處理那些耗費我們大量時間的常規工作,我們才能專注於數據的解讀,從而取得巨大的進展。」
博爾雅表示,AI將極大提升該研究中心為政策制定者提供的支援,使他們能夠做出更明智的決策。AZTI的科學家與決策者緊密合作,其中包括制定捕撈配額和設立海洋保護區等事項。
尖吻鱸在水下游動。攝影:Linh Pham/Bloomberg
AZTI的研究人員已開始將過去三十年內收集的數百萬個數據點輸入一個AI模型。這些數據涵蓋水質、不同種類魚類及浮遊生物的存在情況等等。該模型隨後將生成研究筆記,向科學家們說明資料庫中有哪些資訊以及其結構,從而讓研究人員能更輕鬆地決定在調查中使用哪些數據集。
該中心還利用研究考察期間拍攝的影片和圖片來訓練另一組模型,以識別不同種類的魚類和海洋生物。目前,這項任務需要科學家們觀看數百小時的水下錄影片段,並手動記錄出現的物種、出現地點、出現頻率以及數量。
「這將使我們能夠更快地得出某些地區海洋環境狀況的結論,」博爾雅說,「我預計在未來五年內,將看到AI在科學領域上的應用以我們現在無法想像的方式呈現爆炸式增長。」
天氣預報變得更準確
一些AI驅動的模型已經比傳統的天氣預報系統表現更出色。微軟公司(Microsoft)的Aurora模型已經使用超過100萬小時的多樣化地球物理數據進行了訓練。在其開發者設定的91%的目標中,該模型的準確度超過了歐洲中期天氣預報中心的傳統模型以及Google DeepMind的AI模型GraphCast。
根據微軟研究院員工在《自然》雜誌(Nature)五月刊上發表的一篇研究論文所述,Aurora模型能夠預測空氣品質、海浪和熱帶氣旋路徑等。他們表示,與傳統模型相比,Aurora在執行這些任務所需的計算成本大幅降低。
「像Aurora這樣的AI模型可以幫助氣候科學家探索比目前多數百倍的場景,有助於大規模發掘新的見解,」微軟研究院的一位發言人表示。
與傳統的氣候模型相比,AI模型有些像個「黑盒」,這讓一些天氣預報員感到擔憂。但高品質的天氣資訊是建立預警系統的第一步,能夠在極端天氣事件發生時為人們提供足夠時間尋找避難所。
公民科學家獲得AI助力
根據去年發表在《公民科學:理論與實踐》(Citizen Science: Theory and Practice)的一篇論文指出,人類與AI相結合能夠為科學研究帶來最佳成果。該論文的主要作者、英國開放大學電腦科學家夏爾馬(Nirwan Sharma)於2010年起就在一個公民科學項目中使用自然語言生成技術(即如今所稱的生成式AI)。
夏爾馬及其研究團隊鼓勵大眾向他們發送在林間散步或在花園勞作時拍攝的大黃蜂照片。其後,AI會識別出他們發現的是22種英國蜜蜂中的哪一種,研究人員會隨即驗證AI的識別結果。最後,公民科學家會收到一封自動生成的電郵,以感謝他們的貢獻,並告知他們所拍攝的蜜蜂種類。
一隻大黃蜂和一隻蜜蜂。攝影:David Paul Morris/Bloomberg
該模型是亞伯丁大學和大黃蜂保護信託基金會的合作項目,大約有一半的時間能正確識別蜂種,這一準確率與未經訓練的人類用戶相當。最初,大約需要10個人參與才能正確識別蜂種。隨著模型不斷深入學習,所需人數減少到了三人。
研究人員利用多年來收集的大量圖片,訓練這個模型識別蜜蜂被拍攝時所處植物的種類,從而根據公民科學家想要吸引的蜜蜂種類提供種植建議。
「許多有關如何識別物種的知識都隱藏在科學期刊或人們難以獲取的地方,」夏爾馬說,「AI是提高我們學習能力的另一工具,同時也是一種與這些知識進行對話的方法。」——Akshat Rathi對本文亦有貢獻;譯 孟潔冰
