? ? ? ? 香港中文大學(xué)(深圳)理工學(xué)院學(xué)生梁杰淳的論文Phillips-Inspired Machine Learning for Band Gap and Exciton Binding Energy Prediction?于2019年9月發(fā)表在國際學(xué)術(shù)期刊The Journal of Physical Chemistry Letters (JPCL)上,并獲邀進行在線演講。梁杰淳同學(xué)是理工學(xué)院新能源科學(xué)與工程專業(yè)大四學(xué)生,是該論文的第一作者,通訊作者為我校朱熹教授。

? ? ?? The Journal of Physical Chemistry Letters (JPCL) 由American Chemistry Society 出版,是相關(guān)領(lǐng)域最頂級的期刊之一。2018年該雜志收錄文章共1070篇,影響因子(IF)為7.392,2018年總引用量為45404。

?

?????? 論文介紹

?????? 論文題目: Phillips-Inspired Machine Learning for Band Gap and Exciton Binding Energy Prediction

?????? 論文摘要:近年來,人工智能逐漸成熟,在各領(lǐng)域中的地位不斷上升,但是仍存在諸多問題,比如由于數(shù)據(jù)集過少而產(chǎn)生的“few-shot problem”將導(dǎo)致訓(xùn)練結(jié)果只能應(yīng)用在用于訓(xùn)練的數(shù)據(jù)庫中。這是因為訓(xùn)練過程只是對數(shù)據(jù)進行了計算(數(shù)據(jù)理解,primary understanding),而沒有對理論進行學(xué)習(xí)(理論理解,secondary understanding),即人工智能的結(jié)果應(yīng)當(dāng)是可用理論解釋的。

?????? 在此文中,受 Phillips's ionicity theory 啟發(fā),我們運用套索算法(least absolute shrinkage and selection operator)進行數(shù)據(jù)擬合和并對輸出模型進行解釋。理論學(xué)習(xí)不僅能夠提升預(yù)測精度,還大大降低了對訓(xùn)練量的需求,并且使模型能夠應(yīng)用在除訓(xùn)練集、測試集所在數(shù)據(jù)庫以外的其他數(shù)據(jù)庫中,是“few-shot problem”的合理解決方案。同時,理論學(xué)習(xí)本身也能夠幫助研究者合理地使用人工智能進行科學(xué)領(lǐng)域研究。

?

論文中的輸出模型分析圖

?

?????? 點擊閱讀原文或下方標(biāo)題,瀏覽論文

?????? Phillips-Inspired Machine Learning for Band Gap and Exciton Binding Energy Prediction

?

?

?

?????? 作者檔案

梁杰淳

2016級理工學(xué)院、思廷書院學(xué)生

新能源科學(xué)與工程專業(yè)

高中畢業(yè)于福州市第一中學(xué)

?

?????? 梁杰淳同學(xué)自大一下學(xué)期加入機器人與人工智能實驗室至今,長期進行機器學(xué)習(xí)和數(shù)據(jù)庫研究。梁杰淳同學(xué)已有4篇論文在國際期刊上發(fā)表,其中2篇為第一作者。

?

?????? 導(dǎo)師簡介

朱熹教授

理工學(xué)院助理教授

?

?????? 朱熹教授于2006年從中國科學(xué)技術(shù)大學(xué)少年班學(xué)院和合肥微尺度物質(zhì)科學(xué)國家實驗室(籌)獲得物理學(xué)學(xué)士學(xué)位,并于2011年在新加坡南洋理工大學(xué)獲得博士學(xué)位。他曾擔(dān)任南洋理工大學(xué)博士后研究員。朱熹教授于2017年加入香港中文大學(xué)(深圳)理工學(xué)院,于2019年加入深圳市人工智能與機器人研究院(AIRS)進行相關(guān)研究。其研究領(lǐng)域為化學(xué)機器人和機器學(xué)習(xí)。

?

?????? 對話

?????? Q1:這篇論文提出了現(xiàn)有機器學(xué)習(xí)問題的解決方案,并展示了多個成功案例。你是怎么發(fā)現(xiàn)這個問題的?

?????? 梁:大一時,我就對計算機和人工智能產(chǎn)生了興趣,所以加入了機器人與人工智能實驗室。同時,在完成課程內(nèi)容的學(xué)習(xí)以外,我學(xué)習(xí)了相關(guān)的機器學(xué)習(xí)算法、微分流形和李代數(shù),也閱讀了很多關(guān)于人工智能的論文。盡管人工智能是非常強大的工具,但仍存在不少問題,比如自同構(gòu)問題和“few-shot problem”。傳統(tǒng)數(shù)據(jù)驅(qū)動的模型甚至無法預(yù)測一個簡單的單擺運動,這是因為沒有正確的數(shù)學(xué)結(jié)構(gòu)做支撐。

?????? 我發(fā)現(xiàn)有些論文中的機器學(xué)習(xí)結(jié)果雖然精度很高,但是沒有對輸出模型進行合理地解釋,甚至產(chǎn)生了一些不合常理的結(jié)果,比如我在論文中提到的共價化合物中“溫度”與“帶隙”的反比關(guān)系。在這種一味以數(shù)據(jù)精度驅(qū)動的模型框架下,人工智能不僅沒有促進科學(xué)的發(fā)展,反而正在使其倒退,因為對理論的研究可能因此停滯不前,而對科學(xué)來說,理論才是基石。我覺得問題出在了機器學(xué)習(xí)的使用方式上。所以,理論的學(xué)習(xí)是人工智能發(fā)展必不可少的一個環(huán)節(jié)。

?

?????? Q2:作為新能源專業(yè)的學(xué)生,進行跨多學(xué)科的學(xué)習(xí)和研究會遇到許多問題,你是怎么解決的?

?????? 梁:做研究和大學(xué)生的課堂學(xué)習(xí)稍有不同。學(xué)習(xí)上的問題,一般能通過書本或者提問解決。但是研究不同,除物理、計算機和統(tǒng)計方面的問題,我還遇到了哲學(xué)方面的問題,也就是我的文章的背景:人工智能的使用。遇到這種問題,肯定要多思考,多閱讀經(jīng)典的文章,切勿在當(dāng)前火熱的領(lǐng)域中迷失。比如,啟發(fā)我的Phillips's ionicity theory 出自一篇于1970年發(fā)表的經(jīng)典理論文章。問題不一定是要完全解決的,有可能解決部分問題就會達到最好的結(jié)果,甚至是繞開問題。獲得了足夠的科學(xué)知識,確定哲學(xué)問題的性質(zhì)后,再返回來進行以解決為目的的探索,同時要與教授進行討論。

?????? 朱熹教授始終支持我對人工智能的哲學(xué)性思考。他曾和我討論了著名哲學(xué)家Carl Hempel 在幾十年前發(fā)表的關(guān)于科學(xué),哲學(xué),和數(shù)據(jù)之間相互關(guān)系的理解和定義。長期以來,朱熹的指導(dǎo)對我完成本篇論文有非常大的幫助。

?

梁杰淳(右一)和學(xué)長合影

?

?????? Q3:你加入實驗室的初衷是什么?能談?wù)剬嶒炇疑畹母形騿幔?/strong>

?????? 梁:在大一下的時候收到了機器人與人工智能實驗室的招新郵件,我想做出自己的科研成果,我希望自己可以發(fā)散性地思考、自由地進行探索和學(xué)習(xí),就參加了面試。很感謝錢輝環(huán)教授給我加入實驗室的機會。

?????? 加入實驗室之后,我的大學(xué)生活跟以前相比,有了很大的不同。因為探索新能源這個領(lǐng)域和做出自己的研究成果需要花費修讀課程以外的大量私人的時間。所以,每天除了上課、休息和討論,其余時間我一般都是在實驗室里度過的。實驗室的組合更像是探險隊,個個隊員都是人才,都有自己的長處,大家在一起討論的感覺非常愉快。