全書分為三個主要部分,第一部分在比較狹義的角度考察人工智能尤其是機器學習在科學發(fā)現中的作用,給出機器學習能夠達到的科學發(fā)現的層級,并提出一個在當前的技術條件下可能的發(fā)現新概念和新思想的路徑。第二部分是在更加廣義上從科學哲學的角度去看機器學習與科學活動,基于對科學發(fā)現邏輯的分析和科學理論結構的分析,嘗試從一種基于數學認知的科學實踐哲學的角度回答自動科學發(fā)現是否可能。第三部分是案例研究,主要用機器學習模型和科學史上兩個經典的科學革命的案例——與相對論相關的以太漂移問題以及與量子力學相關的黑體輻射問題——的歷史數據,來模擬機器學習是否能夠在真實的科學發(fā)現場景給人類帶來新的概念和思想,并給第一部分的結論作為支撐。
王東的近著《人工智能與科學發(fā)現:一種哲學探究》即將付梓。人工智能和科學發(fā)現都是當下最熱的課題,但把這兩者結合起來討論,還是一件別開生面的事情,有助于引出許多更深的思考。對這本著作的出版,我很樂意表示支持和祝賀。
歷經數次起伏,人工智能在2012年以深度學習為標志再次崛起,借助數據、算法和算力快速發(fā)展,并迅速商業(yè)落地,在眾多領域展現出驚人的能力。在深度學習崛起的十年后,2022年12月,人工智能企業(yè)OpenAI發(fā)布了現象級的聊天對話模型ChatGPTChatGPT在短短2個月內累積到1億用戶,并打破歷史紀錄。,再次點燃了人們對通用人工智能的激情。像GPT-4這樣理解人類語言并具有一定邏輯推理能力的大規(guī)模語言模型的問世,預示著通用人工智能時代的到來。人工智能,就像當初的電力、計算機及其網絡一樣,將成為人類社會新的基礎設施。
人工智能與科學發(fā)現,這兩個領域在這十年間也產生了越來越多的交集。可以期待,我們將走向一種基于數據和智能的、更加快速和自動化的科學發(fā)現和技術創(chuàng)新。人工智能現在可以精準預測蛋白質折疊甚至幫助創(chuàng)造新蛋白質,發(fā)現新的化學結構,幫助解決量子多體問題。從隨處可見的人臉識別,到已經上路的自動駕駛汽車,人工智能已經廣泛且深度地滲透到人類社會的各個角落并快速改變我們的生活。隨著科研活動中實驗儀器的不斷智能化,數據的產生和分析也在不斷地自動化,在可預見的未來,大部分科學實踐流程中的工作都會有人工智能輔助甚至被人工智能代替。
同時,科學發(fā)現活動作為近現代人類文明發(fā)展的重要驅動力,也在與人工智能的交融中展現出新的活力和可能性。從幫助科學家在大型粒子對撞機的海量數據中找尋上帝粒子,到參與可控核聚變裝置的設計和調控,人工智能正在深刻地改變科學研究和技術創(chuàng)新的方式。人工智能不僅可以加速科學計算、分析科學數據和模擬復雜系統,甚至可以基于數據自動地做出科學發(fā)現。種種人工智能科學家也被構造出來重新發(fā)現歷史上的重要科學理論,同時被期待著有一天能夠發(fā)現新的重大理論甚至獲得諾貝爾獎。
《人工智能與科學發(fā)現:一種哲學探究》一書正是在這樣的背景下應運而生,為我們提供了一個科學哲學的視角去審視這些問題。作者梳理和分析了人工智能應用于科學發(fā)現的各類研究,提出科學發(fā)現可以分為現象、經驗定律、構造性理論和原理性理論這四個層級。作者雖然認為當前人工智能只能發(fā)現新現象和經驗定律,科學再發(fā)現研究因為其數據來源問題無法說明人工智能有發(fā)現科學理論的能力,但不同于大多數科學哲學家認為機器學習在理論上也無法發(fā)現新理論,作者提出在特定的科學情景下,機器學習可以發(fā)現新的構造性理論甚至是原理性理論。為此,基于科學史上著名的測量以太風案例,作者構建了AI-Einstein模型,試圖用經驗的方法論證其觀點。
本書可分為三個部分。第一部分從經驗的角度考察人工智能尤其是機器學習在科學發(fā)現中的作用,分析機器學習當前能夠達到的科學發(fā)現的層級,提出一個在當前的技術條件下用機器學習發(fā)現新概念和新思想的路徑。第二部分對科學哲學中的科學理論結構研究進行綜述和分析,嘗試從一種基于具身數學認知的科學實踐哲學的角度,分析機器的科學發(fā)現與人類的科學發(fā)現之間的關系。第三部分是案例研究,用科學史上的經典案例——相對論相關的以太漂移——的歷史數據作為訓練數據,看機器學習能否在真實的科學發(fā)現場景中帶來新的概念和思想,為第一部分提出的設想提供實證支持。
本書是作者近幾年跟隨人工智能以及數據和智能驅動科學發(fā)展的一個研究集合。雖然書名為“人工智能與科學發(fā)現”,但并不涉及人工智能的所有領域,而主要關注人工智能中的機器學習與科學發(fā)現之間的關系?茖W是近代以來人類發(fā)展中最重要的活動,科學發(fā)現被看作是對知識甚至是對“真理”的最有效的生產方法。人工智能與科學發(fā)現的哲學研究是一個廣闊的話題,本書僅僅涉及其中的一小部分,自然不可能企圖做一個大而全的刻畫。
人工智能在科學活動中的新應用不僅在技術層面上產生了深遠的影響,也在理論層面上提出了一系列新的問題和挑戰(zhàn)。對于人類最引以為傲的科學,人工智能究竟能夠扮演什么角色,能否替代人類科學家?機器的科學發(fā)現是否與人類的科學發(fā)現一樣,還是能夠超越人類的認知達到我們無法理解的層級?人工智能能否理解科學理論,能否發(fā)現新理論甚至帶來新一輪科學革命?這些問題引發(fā)了一系列的爭論,有人樂觀有人悲觀,更多人持審慎態(tài)度。而對于哲學來說,基于傳統的科學實踐活動發(fā)展出來的各種科學哲學理論,以及諸如科學的本質、科學理論的結構、科學發(fā)現的邏輯、理論與經驗的關系等話題,在當前智能驅動科學發(fā)現的大背景下也都需要重新去思考。作者認為,尤其是在我們還未徹底破解人工智能模型的黑箱之時,對智能驅動的科學發(fā)現不能盲目樂觀并不加限制地使用,而需要在了解其具體機制的前提下進行多維度的審度。
人工智能與科學發(fā)現的關系是當代非常重要的話題,作者王東曾在我名下攻讀博士,我很高興他不斷進取,畢業(yè)后又做了許多有益的嘗試和探究。隨著人工智能的發(fā)展,相關的應用和問題會不斷涌現,我期待看到更多關于這個主題的研究,也期待人工智能賦予人類科學發(fā)現更多的可能性。
劉大椿
2023年夏于中國人民大學宜園
王東,哲學博士,北京工商大學馬克思主義學院講師。主要研究方向為人工智能哲學和認知科學哲學。在《哲學動態(tài)》《自然辯證法研究》《自然辯證法通訊》《科學技術哲學研究》等期刊發(fā)表多篇論文。
第1部分機器學習與科學發(fā)現的層級
第1章智能驅動的科學發(fā)現
1.1智能驅動的科學新發(fā)現
1.1.1天文學、宇宙學
1.1.2物理學
1.1.3生物學與醫(yī)學
1.1.4數學
1.2基于人工智能的科學再發(fā)現研究
1.2.1早期自動科學再發(fā)現研究
1.2.2發(fā)現科學概念
1.2.3發(fā)現科學公式
1.3當前智能驅動科學發(fā)現的局限
第2章機器學習
2.1機器學習簡介
2.2人工神經網絡
2.2.1從人工神經元到感知機
2.2.2前饋多層神經網絡及其通用性
2.3降維與自編碼器
2.4符號回歸
2.5人工智能的可解釋性
第3章人工智能與科學發(fā)現的層級
3.1科學發(fā)現、科學知識及其種類
3.2科學發(fā)現的種類和層級
3.3智能驅動科學發(fā)現的層級
3.3.1當前人工智能能夠達到的發(fā)現的層次
3.3.2一種特殊科學發(fā)現情形下的機器學習
第4章數據與智能驅動科學發(fā)現相關的爭論
4.1數據密集型科學發(fā)現及其哲學討論
4.1.1問題的提出與爭議
4.1.2爭論中存在的問題
4.1.3從認知的角度考察數據在科學活動中的作用
4.2智能驅動科學發(fā)現與自動科學發(fā)現的哲學討論
4.2.1方法論相關爭議
4.2.2方法論爭論的原因分析
第1部分的問題討論
第2部分機器學習與科學發(fā)現的關系
第5章科學理論的結構和內容
5.1何為科學理論
5.2形式化重構的觀點
5.2.1語法的觀點
5.2.2語義的觀點
5.2.3通過范疇提升對語法與語義的同構
5.3語用——實踐的觀點及其認知進路
第6章科學與數學認知
6.1數學在自然科學中不可思議的有效性
6.2數學認知
6.3基于認知語言學的具身數學認知
6.3.1理論
6.3.2具身數學認知的哲學觀——自然主義的
反實在論
6.3.3數學作為同構的認知過程及其問題
6.4應用——自由落體定律的負數解
6.4.1為何二次方程會有兩個解
6.4.2為何在應用到自由落體中時要舍去負數解
第7章機器學習與科學發(fā)現過程
7.1科學實踐過程的同構
7.2機器學習與發(fā)現的邏輯
7.3認知同構理論的問題
第3部分案例研究
第8章語言模型與科學發(fā)現
8.1預訓練大規(guī)模語言模型及其能力
8.2大語言模型與自動科學發(fā)現
8.2.1大語言模型與智能驅動科學發(fā)現
8.2.2大語言模型與自動科學發(fā)現
8.2.3大語言模型實現科學發(fā)現的具體路徑
第9章科學史案例建模研究
9.1以太相關現象與理論
9.1.1光行差
9.1.2斐索流水實驗
9.1.3邁克爾遜莫雷實驗
9.2機器學習建模
9.2.1模型1.0(帶預設)
9.2.2AI-Einstein 2.0——無預設
后記
參考文獻