研究人員利用人工智能的深度學習方法,發現了38個新的強引力透鏡候選體,為研究天體物理學問題提供了新的“宇宙探針”候選體。
近年來,隨著技術日益進步,天文學研究中產生了海量數據。天文學家要想從郭守敬望遠鏡、“中國天眼”FAST、LSST大型綜合巡天望遠鏡等遍布世界的大型望遠鏡捕獲的海量數據中找出有價值的信息以資研究,無異於大海撈針。
如何高效地處理這些數據,已成為現代天文學面臨的一項重要挑戰。由於人工智能在海量數據分析和處理方面所具有的突出優勢,它也很自然地走入了天文學家的視野。
日前,中國科學院雲南天文台麗江天文觀測站龍潛研究員與雲南大學中國西南天文研究所宇宙學研究組爾欣中教授團隊合作,利用人工智能深度學習的方法,發現了38個新的強引力透鏡候選體,為研究天體物理學問題提供了新的可靠的“宇宙探針”候選體。英國《皇家天文學會月刊》發表了這項研究成果。
天文觀測產生海量數據 用機器學習給天體分類已十分普遍
隨著下一代大規模測光巡天項目的開展,人們期待發現數以萬計的強引力透鏡系統。但如何在海量天體圖像中快速地找到強引力透鏡候選體?近年來,人工智能的快速發展,給人類提供了一種新的可能。
以2009年發射升空的世界首個用於探測太陽系外類地行星的飛行器開普勒太空望遠鏡為例,僅在起初3年半的任務期內,就監控了超過15萬個恆星系統,同時也產生了海量數據。這些數據通常要經由計算機處理,但當計算機識別出一定的信號時,又必須依靠人類分析,判斷其是否是行星軌道所產生的,這項巨大的篩查工作單靠美國國家航空航天局(NASA)的科學家或科學小組,是無法有效完成的。
“如此大的數據量,人工分析在很多時候已經達不到所需要的速度。借助人工智能的優勢,我們可以極大地提升對數據的分析速率。”龍潛向科技日報記者介紹,人工智能展現出來的效率和准確性遠高於傳統方法。
龍潛研究員長期從事人工智能深度學習方面的研究。近期,他與爾欣中教授團隊合作,構建並訓練了一個卷積神經網絡,用來尋找強引力透鏡系統。他們把這個網絡應用到歐洲南方天文台2.6米巡天望遠鏡(VST)千平方度巡天數據,並找到了38個新的強引力透鏡候選體。此次構建的神經網絡,也可應用於其他大型望遠鏡的巡天數據。
“在這項工作中,我們用計算機分別模擬了強引力透鏡圖像和非強引力透鏡圖像,從而來訓練計算機。我們發現,在准備訓練計算機的圖像時,非強引力透鏡圖像比強引力透鏡更加重要。”爾欣中說,開始的分析中,他們使用簡單的規則星系圖像作為非強引力透鏡訓練樣本,發現結果正確率非常低。隻有把各種可能的非引力透鏡圖像都考慮進來之后,才能得到比較好的結果。
“這就像在教電腦認識什麼是狗的時候,還要告訴它貓、羊、牛等都不是狗。而如果你隻告訴它貓不是狗,電腦有非常大的概率把羊、牛認成狗。”龍潛說,目前利用機器學習來對天文學中各種天體分類已經非常普遍,最簡單的是把恆星和星系分開,或者把不同行態的星系進行分類,以及利用星系的多重顏色來估計星系的距離等。
每秒可識別上萬張照片 新型神經網絡便於實時修改、訓練和測試
人眼看強引力透鏡系統的圖像,最快就是每秒鐘看一張圖。而計算機每秒鐘可以識別成千上萬張圖片。
龍潛研究員和爾欣中教授團隊此番訓練的這個卷積神經網絡,可以充分利用GPU進行並行加速,通過裝備更多或更強的GPU,系統可以根據實際需要極大提升搜索速度和效率。
“這個神經網絡的訓練,主要使用模擬數據,隻使用了很少的人工標注數據,由於模擬數據可以任意生成,因此多樣性遠大於人工標注數據,進一步根據數據的特點調節訓練參數和訓練算法,使神經網絡的泛化能力得到了極大的提高。”龍潛說,此外,研究人員使用新型科學計算語言Julia完全自定義網絡結構,由於Julia語言兼具速度和靈活性,使得神經網絡在CPU和GPU上都有良好的性能,並且可以任意切換,因此非常有利於研究人員實時修改、訓練和測試。
“我們還通過對引力透鏡數據的研究,定制了有針對性的小型網絡,有效地抑制了過擬合現象,同時實驗証明該網絡具有與大型網絡相似的准確率。相比大型網絡,小型網絡在普通計算機終端就可以訓練和測試,不需要依賴大型GPU集群,這為天文工作者使用和改進網絡提供了便利。”龍潛說。
目前,隨著技術與裝備水平快速發展,人工智能在天文學上的應用還會越來越多。“我們計劃對一些變源的多波段光變曲線來進行機器的快速分類,這樣在實施大樣本巡天的時候,電腦可以自動對所發現的變源進行篩選,並對我們感興趣的天體做出提示,以便進一步開展后續研究工作。”爾欣中說,正因為人工智能的幫助,天文研究者得以從耗時單調的數據篩查分析中解脫出來,當人力“大海撈針”難以招架之日,正是人工智能大顯身手之時。(趙漢斌 通訊員 陳艷)