數據太多,沒機器玩不轉
過去幾年裡,天文領域的大多數方向都在嘗試使用人工智能。考慮到天文學要處理的數據之多,這是一個很自然的思路。讓機器練習去分析蛛絲馬跡,不如此,未來的天文學將無法運轉。
不久前舉辦的2019年GPU技術大會吸引了全世界的人工智能學者。大會請來加州大學聖克魯茲分校的天文學家布蘭特⋅羅伯特森演講,他指出:“天文學正在一場新的數據革命的風口”。羅伯特森認為,新一代天文儀器必須配合由深度學習驅動的新一代軟件。
比如預計在3年後運行的大口徑全天巡視望遠鏡(LSST)。它巡視南天那一半宇宙中的370億個星系,生成一部時長十年的不間斷視頻。LSST配備的是32億像素的相機,每晚產生25TB的數據,相當於現在先進天文望遠鏡一生貢獻的所有數據。
再比如平方公里陣列射電望遠鏡(SKA)。它遍布全球,一部分天線在非洲南部8國部署,還有100多萬天線位於澳大利亞和新西蘭。它的原始數據每天達到5千個PB,處理後也有50個PB左右。
“暗能量巡天”編制幾億個星系的星圖;“蓋亞”衛星測繪銀河系數十億恒星;“茲威基”項目每小時能夠掃描3750平方度的天區。在中國,FAST每天的數據量將達150TB;郭守敬望遠鏡觀測了901萬條光譜,是世界上最大的天體光譜庫……
捕捉人類看不出的模式
數據越來越多,科學家試圖聚合它們。但在GPU大會上,羅伯特森說,未來幾個大型天文望遠鏡一起產生大量數據,聚合之後複雜到人類無法直接利用。而加州大學聖克魯斯分校的科學家試圖解決這個問題。計算機科學系一名博士生創建的Morpheus深度學習框架,可以基於望遠鏡的原始數據,逐像素地分類天體。
加州大學聖克魯茲分校的科學家們還用AI更好地研究星系的形成。在他們2019年初發表的一項研究中,科學家用計算機模擬的星系訓練計算機,讓它學習星系演化的三個關鍵階段。後來計算機分析來自哈勃太空望遠鏡的星系圖像,表現出奇好。
人工智能應用於人臉識別,在海量數據訓練後,可以根據一張照片,認出這個人化妝和年老時候的樣子。而宇宙中很多圖像也可用同樣的方法來歸類。
“深度學習可以尋找模式,機器能看到非常複雜的模式,而人類看不到。”參與研究的科學家大衛⋅庫說,“我們希望進一步測試這種方法。在概念驗證研究中,機器似乎成功地在數據中找到了模擬中確定的星系演化的不同階段。”
幫天文學家找到另一個太陽系
2018年底的一篇報道顯示,谷歌人工智能發力,從開普勒系外行星觀測數據庫裡找到了新的行星。行星是很難尋找的。位於太空的開普勒衛星觀察145000顆類似太陽的恒星,從恒星亮度微弱變化來發現行星。記錄4年的數據中,包括大約35000個疑似的行星記錄。天文學家用機器結合人眼來識別,但最暗最弱的信號常被忽略。
在谷歌AI的幫助下,我們發現了開普勒90i和開普勒80g兩顆新行星。也讓開普勒90被確認為第一個至少擁有8顆行星的外星系。
神經網絡和機器學習處理了140億個數據點,之後成功篩選出了候選者。
NASA和谷歌說,未來新技術將找到更多系外行星。NASA還表示不用擔心天文學家失業。NASA的科學家傑西⋅道特森解釋表示,數據提供給神經網絡之前,需要天文學家進行分類,以便人工智能可以從中學習分析出新的信息。
道特森說:“AI以後絕對會和天文學家一起工作,成為必不可少的工具。”
當然,機器學習也帶來“黑盒子”風險:我們得到了答案,但我們不知道機器為何如此判斷,或許答案是錯的。機器也會犯錯。天文學家將繼續訓練和適應它。
延伸閱讀
|