書(shū)單推薦
更多
新書(shū)推薦
更多

實(shí)體消解指南:使用Python進(jìn)行數(shù)據(jù)匹配 [英]邁克爾·希勒

 實(shí)體消解指南:使用Python進(jìn)行數(shù)據(jù)匹配 [英]邁克爾·希勒

定  價(jià):69 元

        

  • 作者:[英]邁克爾·希勒
  • 出版時(shí)間:2025/6/1
  • ISBN:9787111783299
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類(lèi): 
  • 頁(yè)碼:
  • 紙張:膠版紙
  • 版次:
  • 開(kāi)本:16開(kāi)
9
7
7
8
8
7
3
1
2
1
9
1
9
在數(shù)據(jù)驅(qū)動(dòng)時(shí)代,實(shí)體消解技術(shù)是打通數(shù)據(jù)孤島的核心利器。本書(shū)以Python為工具,系統(tǒng)講解從數(shù)據(jù)清洗到云端大規(guī)模部署的全流程技術(shù):·基礎(chǔ)原理:解析實(shí)體消解5大步驟(數(shù)據(jù)標(biāo)準(zhǔn)化、分塊、屬性比較、匹配分類(lèi)、聚類(lèi)),直面姓名模糊、數(shù)據(jù)缺失、跨源匹配等實(shí)戰(zhàn)難題;·算法攻堅(jiān):詳解編輯距離、Jaro-Winkler相似度等文本匹配技術(shù),結(jié)合貝葉斯定理、期望zui大化算法構(gòu)建概率匹配模型;·工具實(shí)戰(zhàn):基于Splink實(shí)現(xiàn)企業(yè)級(jí)數(shù)據(jù)消解,通過(guò)谷歌云平臺(tái)擴(kuò)展至百萬(wàn)級(jí)數(shù)據(jù)集;·前沿拓展:引入隱私增強(qiáng)技術(shù)(PSI),平衡數(shù)據(jù)利用與合規(guī)風(fēng)險(xiǎn)。全書(shū)配套GitHub代碼庫(kù),以英國(guó)公司注冊(cè)署、海事署等真實(shí)數(shù)據(jù)演示跨領(lǐng)域(金融風(fēng)控、供應(yīng)鏈管理)場(chǎng)景應(yīng)用,助力讀者構(gòu)建可復(fù)用的數(shù)據(jù)資產(chǎn)整合方案。
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容