![]() ![]() |
大模型核心原理與企業(yè)落地實(shí)踐
本書分兩大篇。第1篇原理篇 (第1、2章); 嘗試引導(dǎo)讀者共同探索和揭秘研發(fā)領(lǐng)域大模型背后的核心原理, 以使讀者“既知其然, 又知其所以然”, 并為后續(xù)章節(jié)的學(xué)習(xí)打下堅(jiān)實(shí)的基礎(chǔ)。從概率、最優(yōu)化等基礎(chǔ)理論入手, 進(jìn)而深入淺出地闡述Transformer、神經(jīng)元等大模型的核心組成元素, 以及評(píng)估方法、數(shù)據(jù)工程建設(shè)等通用能力的建設(shè)。針對(duì)技術(shù)細(xì)節(jié), 采用通俗易懂的行文風(fēng)格, 并輔以大量的圖表和數(shù)據(jù), “零基礎(chǔ)”的讀者也可以高效地學(xué)習(xí)。第2篇應(yīng)用實(shí)踐篇 (第3-8章), 產(chǎn)業(yè)界最新實(shí)踐成果的總結(jié)。選取代碼生成、代碼轉(zhuǎn)換、知識(shí)問答、推理加速、運(yùn)維運(yùn)營等研發(fā)大模型領(lǐng)域的高頻業(yè)務(wù)作為剖析對(duì)象, 詳細(xì)展示作者在針對(duì)這些問題時(shí)的端到端思考, 包括設(shè)計(jì)理念、關(guān)鍵技術(shù)瓶頸、解決方案及落地結(jié)果等。
你還可能感興趣
我要評(píng)論
|