(1)故事化講解:以故事為線索,跟主角一起輕松掌握機器學習精髓。
(2)階梯式學習:從傳統(tǒng)機器學習到Transformer架構,助力穩(wěn)步掌握關鍵知識與技能。
(3)場景化教學:緊密貼合實際,聚焦生活案例,讓算法原理在真實場景中落地。
(4)智能體開發(fā)指南:教你運用現(xiàn)有工具創(chuàng)建智能體,快速搭建個性化AI智能體。
前言開始旅程
首先,感謝大家翻開本書。本書中,我們將會跟著主人公大學生村官小 L開啟一次有趣的旅程。在本次的旅程中,小 L 將使用各種人工智能技術,包括經典的機器學習、深度學習、生成式模型、多模態(tài)模型等,幫助他所任職的地區(qū)完成一個又一個任務。跟隨他的腳步,我們會學習到什么是機器學習、神經網絡與卷積神經網絡、變分自編碼器、自回歸模型、標準化流模型、Transformer 模型,以及如何用 Transformers 庫調用不同的預訓練模型等。
需要說明的是,本書的實操部分使用的是 Python 語言,因此需要讀者有一定的 Python 編碼能力?紤]到不是所有的讀者都有圖形處理器(GPU)算力環(huán)境,這里我們給大家推薦兩個可以在云端進行實驗的平臺,分別是 Google 的 Colab 和數(shù)據(jù)科學競賽平臺 Kaggle。截至 2025 年 1 月,這兩個平臺都給用戶提供了一定限額的免費 GPU 算力,可以讓讀者以最小的成本開始進行實驗。
接下來,我們看一下如何使用這兩個平臺。
Colab
登錄 Colab 平臺,在菜單欄中選擇文件菜單中的在云端硬盤中新建筆記本命令,如圖 1 所示。
圖 1 使用 Colab 新建筆記本
然后,就可以在新建的空白筆記本的單元格中運行代碼了,如圖 2 所示。
圖 2 在 Colab 的筆記本中運行代碼
在 Colab 的筆記本中編寫和運行代碼的方式與在本地計算機的 Jupyter Notebook中操作大體是一樣的。如果我們要把本地的數(shù)據(jù)上傳到 Colab 上用于模型訓練,只要單擊左邊菜單欄中的文件夾圖標,并在展開的菜單中單擊上傳到會話存儲空間按鈕即可,如圖 3 所示。
圖 3 上傳本地數(shù)據(jù)到 Colab
我們在自己的計算機上寫好的代碼,也可以上傳到 Colab 平臺,使用免費的 GPU 來進行模型訓練。要上傳編輯好的筆記本文件,只要在 Colab 的歡迎界面中,選擇文件菜單中的上傳筆記本
命令即可,如圖 4 所示。
圖 4 上傳編寫好的筆記本文件到 Colab
在本書附贈的資源包中,如果看到 .ipynb 文件標有run on colab,就說明這個文件可以上傳到 Colab 中進行實驗。
Kaggle
登錄 Kaggle 平臺之后,就可以單擊左邊菜單欄中的Create按鈕新建一個筆記本文件,如圖5 所示。
圖 5 在 Kaggle 平臺新建筆記本文件
單擊Create按鈕后,選擇New Notebook命令,就可以看到我們新創(chuàng)建的筆記本文件。這個時候,我們仍然可以上傳自己本地的筆記本文件。只需要選擇File菜單中的ImportNotebook命令就可以了,如圖 6 所示。
同樣地,大家如果下載了隨書贈送的資源包,看到筆記本文件標有run on kaggle的字樣,就說明這個文件可以在 Kaggle 平臺中運行。當然,Kaggle 也支持我們上傳自己的數(shù)據(jù)集和模型,只要在右側菜單欄中單擊Upload按鈕就可以,如圖 7 所示。
圖 6 將本地的筆記本文件導入 Kaggle 中圖 7 在 Kaggle 平臺上傳數(shù)據(jù)集或模型
除了以上基本操作,Colab 和 Kaggle 還有很多實用的功能,如選擇不同的 GPU 加速等,這些留給讀者朋友們自己探索。
還要跟大家強調一下,本書中涉及的人物、地名、事件以及用于說明原理的數(shù)據(jù),均為虛構,僅僅是為了演示技術原理,與現(xiàn)實世界沒有任何關聯(lián),請大家一定不要對號入座。
注意:如果讀者在訪問 Colab 時遇到障礙,請向你所在的學校或單位申請專用網絡,確保自己在遵守相關法律法規(guī)的前提下進行實驗。
到這里,相信大家已經做好了啟程的準備,讓我們出發(fā)吧!
溫馨提示:
本書贈送資源已上傳至百度網盤,供讀者下載。讀者可用微信掃一掃功能掃描封底二維碼,關注微信公眾號,輸入本書 77 頁資源下載碼,根據(jù)提示獲取下載地址及密碼。
段小手,曾供職于百度、敦煌網、慧聰網、方正集團等知名IT企業(yè)。有多年的科技項目管理及開發(fā)經驗。2019年至今,與云南省公安廳合作數(shù)據(jù)挖掘項目,使用機器學習技術協(xié)助云南警方打擊違法犯罪活動。
其負責的項目曾獲得國家發(fā)改委電子商務示范項目中關村現(xiàn)代服務業(yè)試點項目北京市信息化基礎設施提升專項北京市外貿公共服務平臺等多項政策支持。著有《深度學習與大模型基礎》《巧用AI大模型輕松學會Python金融數(shù)據(jù)分析》等著作,在與云南省公安廳合作期間,使用機器學習算法有效將某類案件發(fā)案率大幅降低。