本書全面系統(tǒng)地介紹了計算機視覺與圖像處理在智能建造與土木工程領(lǐng)域的核心理論與關(guān)鍵技術(shù),結(jié)合豐富的實際案例和開源代碼,為讀者提供從基礎(chǔ)到應(yīng)用的全方位學習資源。全書共9章,涵蓋計算機視覺的基礎(chǔ)知識、核心技術(shù)與實際應(yīng)用。本書適用于土木工程和智能建造領(lǐng)域的學生、研究人員及工程師。
本書的特點包括全面性、虛擬視覺空間、開源算法和實用性,使讀者能夠全面學習計算機視覺的理論和實際應(yīng)用,特別是在土木工程和智能建造領(lǐng)域。它提供了廣泛的知識和實際應(yīng)用示例,幫助學生理解和應(yīng)用計算機視覺技術(shù),以解決智能建造領(lǐng)域的實際問題
在智能建造與土木工程的快速發(fā)展中,計算機視覺與圖像處理技術(shù)已成為解決復(fù)雜工 程問題的關(guān)鍵工具。無論是自動化檢測、結(jié)構(gòu)健康監(jiān)測,還是無人機和機器人輔助施工,計 算機視覺正在提升建筑領(lǐng)域的效率與安全,為精細化建造和管理提供全新手段。 全書共9章,涵蓋計算機視覺的基礎(chǔ)知識、核心技術(shù)與實際應(yīng)用。第1章介紹計算機視覺的歷史背景與發(fā)展現(xiàn)狀,探討其在建筑規(guī)劃、設(shè)計、施工和運營中的應(yīng)用場景,Python與MATLAB環(huán)境配置指南及 OpenCV 核心模塊解析;第2章解析射影幾何與圖像形成的原理,涵蓋二維/三維幾何變換、相機投影模型及透鏡畸變校正原理,結(jié)合數(shù)碼 相 機 的 光 學 采樣、色彩空間轉(zhuǎn)換與壓縮編碼技術(shù),構(gòu)建從物理成像到數(shù)字信號轉(zhuǎn)化的完整知識體系;第3章講解圖像處理技術(shù),涵蓋圖像金字塔、色彩空間轉(zhuǎn)換、傅里葉變換等,幫助讀者掌握圖像操作流程;第4章介紹視頻處理技術(shù),包括視頻讀取、攝像機調(diào)用和壓縮編碼,為目標識別、追蹤和三維重建打基礎(chǔ);第5章重點討論目標識別與追蹤技術(shù),涵蓋顏色的分割、輪廓特征分析與矩計算、特征點檢測與運動估計算法等,廣泛應(yīng)用于施工場景中構(gòu)件定位、位移監(jiān)測與異常行為預(yù)警;第6章探討單目、雙目和多目視覺系統(tǒng),講解立體視覺的物體定位與姿態(tài)估計;第7章介紹計算攝影技術(shù),包括高動態(tài)范圍、超分辨率和去模糊技術(shù),為高質(zhì)量視覺數(shù)據(jù)采集提供支持;第8章闡述三維重建技術(shù),如運動恢復(fù)結(jié)構(gòu)(SfM)和多視圖立體(MVS),提升建筑模型數(shù)字化和可視化效率;第9章探討機器學習與深度學習在計算機視覺中的應(yīng)用,賦予建筑智能化更多可能性。
本書旨在為土木工程和智能建造領(lǐng)域的學生、研究人員及工程師提供一份簡明易懂的 入門教材。通過介紹基礎(chǔ)理論、算法和實際應(yīng)用,讀者將學習如何將計算機視覺技術(shù)應(yīng)用于 如圖形處理、結(jié)構(gòu)跟蹤、三維重建、裂縫識別等實際問題。無論是初學者還是有經(jīng)驗的工程 師,都能通過本書掌握前沿技術(shù),應(yīng)對智能建造領(lǐng)域的挑戰(zhàn)。
計算機視覺技術(shù)自20世紀60年代興起,早期研究集中在圖像的邊緣檢測、形狀識別等 基礎(chǔ)算法。如今,隨著人工智能的發(fā)展,計算機視覺已在各行業(yè)廣泛應(yīng)用,并不斷推進數(shù)字 化和智能化進程。
作者在英國訪學期間接觸到計算機視覺在結(jié)構(gòu)振動監(jiān)測中的應(yīng)用,發(fā)現(xiàn)這一技術(shù)在國 內(nèi)土木工程中的應(yīng)用尚不充分,更多的研究和應(yīng)用集中在其他行業(yè)。近年來,隨著市場需求 的變化,土木工程專業(yè)逐漸向智能化、數(shù)字化和網(wǎng)絡(luò)化轉(zhuǎn)型升級,重勞動力的需求顯著減少, 工程行業(yè)亟須解放勞動力、提高效率。智能建造的理念應(yīng)運而生,計算機視覺作為智能建造 中的重要新質(zhì)生產(chǎn)力,發(fā)揮著不可或缺的作用。 土木工程的轉(zhuǎn)型不僅是技術(shù)層面的革新,更是生產(chǎn)力的提升與社會需求的適應(yīng)。因此,土木工程專業(yè)的培養(yǎng)目標應(yīng)當充分考慮當前行業(yè)的發(fā)展需求與未來的職業(yè)挑戰(zhàn),除了扎實的土木工程基礎(chǔ)知識和技能,學生還需要培養(yǎng)跨專業(yè)能力與創(chuàng)新能力,以應(yīng)對智能建造和結(jié)
Ⅱ 計算機視覺與圖像處理
構(gòu)智慧運維帶來的新要求,同時推動自身的綜合素質(zhì)提升。
當前計算機視覺教材多集中于數(shù)學或計算機科學領(lǐng)域,缺乏針對土木工程的應(yīng)用指導(dǎo)。 為填補這一空白,本書側(cè)重于實際算法和代碼實現(xiàn),幫助讀者快速上手,并將技術(shù)應(yīng)用于智 能建造和結(jié)構(gòu)智慧運維中。通過本書,讀者不僅能掌握計算機視覺與圖像處理的基礎(chǔ)知識, 還能推動土木工程的智能化轉(zhuǎn)型和可持續(xù)發(fā)展。
課程安排建議
本書為土木工程、智能建造或其他工程專業(yè)提供一個學期的計算機視覺與圖形處理的 入門課程。根據(jù)本書的內(nèi)容,本課程可以規(guī)劃為32學時或64學時。以下是建議的兩種不 同學時規(guī)劃的課程表。
章 節(jié) 章 節(jié) 內(nèi) 容 32學時分配 64學時分配
第1章 計算機視覺概論 2 4
第2章 射影幾何與圖像形成 2 4
第3章 圖像處理 6 10
第4章 視頻形成與處理 2 4
第5章 識別與追蹤 4 8
第6章 立體視覺與標定 4 6
第7章 計算攝影 2 4
第8章 三維重建 4 8
第9章 機器學習 4 10
大作業(yè) 授課老師自行布置 2 6
配套與開源 本書在編寫過程中,注重理論與實踐的結(jié)合,力求為讀者提供系統(tǒng)化的學習路徑。本書 的所有示例代碼都已開源,并托管在清華大學出版社平臺和Github平臺上。讀者可以通過 資源文件 訪問Github平臺、具體章節(jié)的二維碼,獲取的代碼以及配套資源!百Y源文件”二維碼
中的內(nèi)容為例題所需資源文件,運行例題代碼前請先下載資源文件。
致謝
Anaconda
本書得以順利完成并呈現(xiàn)于讀者面前,離不開各方的支持與協(xié)作。在此,向所有在本書
清華大學 創(chuàng)作與出版過程中貢獻智慧與力量的個人及機構(gòu)致以誠摯的感謝。開源軟件
鏡像站
Github平臺
本書由蘭州理工大
朱前坤:男,博士(后),蘭州理工大學土木工程學院教授,負責蘭州理工大學本科生《結(jié)構(gòu)力學》、《高層建筑結(jié)構(gòu)設(shè)計》;碩士研究生《試驗結(jié)構(gòu)動力學》;博士研究生《工程結(jié)構(gòu)可靠度》的教學。同時任職于國際減震學會理事、中國工程建設(shè)標準化協(xié)會結(jié)構(gòu)設(shè)計基礎(chǔ)專委會委員、中國地震學會工程隔震與減振控制專委會委員、國際華人計算力學協(xié)會理事、中國振動工程學會會員。兼任《Structural Engineering and Mechanics》、《Engineering Structures》《Structures》、《建筑結(jié)構(gòu)學報》、《中國公路學報》、《振動工程學報》、《工程力學》、《振動與沖擊》等期刊論文審稿人;國家自然科學通訊評審人。主編學術(shù)專著《行人-結(jié)構(gòu)動力相互作用及振動控制》;作為副主編參與編寫《高層建筑結(jié)構(gòu)設(shè)計理論》教材。研究方向包括工程結(jié)構(gòu)減震與隔震控制、計算機視覺、橋梁智慧監(jiān)測與運維、結(jié)構(gòu)人致振動、人群緊急疏散等。
第1章計算機視覺概論
1.1計算機視覺歷史發(fā)展與現(xiàn)狀
1.1.1計算機視覺的起源
1.1.2計算機視覺的發(fā)展
1.1.3計算機視覺的現(xiàn)狀
1.2計算機視覺的經(jīng)典問題
1.2.1場景重建
1.2.2識別與理解
1.2.3運動分析
1.2.4生成與恢復(fù)
1.3計算機視覺在智能建造中的應(yīng)用
1.3.1規(guī)劃階段
1.3.2設(shè)計階段
1.3.3施工階段
1.3.4運營階段
1.4計算機視覺編程語言——Python與MATLAB
1.4.1Python語言簡介與安裝
1.4.2MATLAB語言簡介與安裝
1.4.3其他計算機視覺編程語言簡介
1.5計算機視覺開源庫——OpenCV
1.5.1OpenCV簡介與安裝
1.5.2OpenCV模塊功能
1.5.3計算機視覺其他相關(guān)開源庫
本章總結(jié)
思考題與練習題
第2章射影幾何與圖像形成
2.1光與圖像
2.1.1光源
2.1.2生物成像
2.1.3光學成像
2.2射影幾何與轉(zhuǎn)換
2.2.1射影幾何基礎(chǔ)
2.2.2二維變換
2.2.3三維變換
2.2.4三維旋轉(zhuǎn)
2.2.5三維到二維投影
2.2.6透鏡畸變
2.3數(shù)碼相機
2.3.1采樣
2.3.2顏色
2.3.3壓縮
本章總結(jié)
思考題與練習題
第3章圖像處理
3.1圖像基本操作
3.1.1圖像讀取
3.1.2圖像顯示
3.1.3圖像保存
3.2圖像結(jié)構(gòu)與色彩空間
3.2.1圖像結(jié)構(gòu)與閾值處理
3.2.2顏色空間
3.2.3圖像通道操作
3.3像素操作與圖像運算
3.3.1像素統(tǒng)計
3.3.2像素修改
3.3.3感興趣區(qū)域
3.3.4圖像繪制
3.3.5圖像數(shù)值運算
3.3.6圖像加法運算
3.3.7圖像比較運算
3.3.8圖像按位邏輯運算
3.3.9掩碼
3.4圖像變換
3.4.1尺寸變換
3.4.2翻轉(zhuǎn)變換
3.4.3圖像連接
3.4.4仿射變換
3.4.5透視變換
3.4.6極坐標變換
3.5圖像金字塔
3.5.1高斯金字塔
3.5.2拉普拉斯金字塔
3.6圖像直方圖
3.6.1直方圖計算
3.6.2直方圖繪制
3.6.3歸一化直方圖
3.6.4直方圖均衡化
3.6.5直方圖比較
3.6.6直方圖反向投影
3.7空間域與頻域處理
3.7.1噪聲種類與生成
3.7.2卷積
3.7.3線性濾波
3.7.4非線性濾波
3.7.5邊緣檢測
3.7.6傅里葉變換
3.7.7傅里葉變換中的卷積
3.7.8傅里葉變換中的濾波
3.8圖像形態(tài)學
3.8.1像素距離與連通域
3.8.2腐蝕
3.8.3膨脹
3.8.4形態(tài)學高級操作
本章總結(jié)
思考題與練習題
第4章視頻形成與處理
4.1視頻形成簡介
4.1.1視頻的定義與歷史發(fā)展
4.1.2攝像機系統(tǒng)組成
4.1.3視頻壓縮與編碼
4.2視頻讀取與保存
4.2.1視頻讀取
4.2.2攝像機調(diào)用
4.2.3視頻保存
4.3視頻處理
4.3.1視頻幀提取與序列重組
4.3.2幀處理與增強
4.3.3視頻合成
本章總結(jié)
思考題與練習題
第5章識別與追蹤
5.1目標識別
5.1.1顏色檢測
5.1.2輪廓檢測
5.1.3形狀檢測
5.1.4矩計算
5.1.5點集擬合
5.1.6模板匹配
5.2特征點檢測與匹配
5.2.1關(guān)鍵點與繪制
5.2.2角點檢測
5.2.3特征點檢測
5.2.4特征點匹配
5.3運動估計
5.3.1運動估計概述
5.3.2亞像素
5.3.3基于特征顏色的運動估計
5.3.4基于特征點的運動估計
5.3.5基于模板匹配的運動估計
5.3.6基于光流法的運動估計
本章總結(jié)
思考題與練習題
第6章立體視覺與標定
6.1單目視覺
6.1.1單目模型概述
6.1.2單目標定
6.1.3單目校正
6.1.4單目投影
6.1.5單目反投影
6.1.6單目姿態(tài)估計
6.2雙目視覺
6.2.1雙目模型概述
6.2.2雙目標定
6.2.3雙目校正
6.2.4雙目投影
6.2.5雙目姿態(tài)估計
6.3多目視覺
6.3.1多目視覺概述
6.3.2多目視覺中的關(guān)鍵技術(shù)
本章總結(jié)
思考題與練習題
第7章計算攝影
7.1計算攝影基礎(chǔ)
7.1.1計算攝影發(fā)展史
7.1.2相機攝影與手機攝影
7.2計算攝影應(yīng)用
7.2.1高動態(tài)范圍成像
7.2.2超分辨率成像
7.2.3圖像背景虛化
7.2.4圖像去模糊
7.2.5長曝光成像
7.2.6圖像背景提取
7.2.7圖像合成與風格渲染
本章總結(jié)
思考題與練習題
第8章三維重建
8.1三維重建基礎(chǔ)
8.1.1基于圖像的三維重建方法分類
8.1.2基于圖像的三維重建方法流程
8.1.3運動恢復(fù)結(jié)構(gòu)的基本概念
8.1.4基于多視圖立體的基本概念
8.1.5三維重建相關(guān)的數(shù)據(jù)格式
8.1.6三維重建相關(guān)的數(shù)據(jù)集
8.2運動恢復(fù)結(jié)構(gòu)算法的原理及應(yīng)用
8.2.1COLMAP算法介紹
8.2.2對極幾何
8.2.3捆綁調(diào)整
8.2.4運動恢復(fù)結(jié)構(gòu)的應(yīng)用
8.3多視圖立體算法的原理及應(yīng)用
8.3.1鄰域幀選擇
8.3.2深度圖計算
8.3.3多視圖立體的應(yīng)用
8.4曲面重建原理及應(yīng)用
8.4.1曲面重建原理
8.4.2曲面重建的應(yīng)用
8.5紋理貼圖原理及應(yīng)用
8.5.1紋理貼圖原理
8.5.2紋理貼圖的應(yīng)用
8.6三維重建延展應(yīng)用
8.6.1SLAM基本概念與歷史發(fā)展
8.6.2SLAM技術(shù)應(yīng)用現(xiàn)狀
8.6.3增強現(xiàn)實基本概念與歷史發(fā)展
8.6.4增強現(xiàn)實技術(shù)應(yīng)用現(xiàn)狀
8.6.5虛擬現(xiàn)實基本概念與歷史發(fā)展
8.6.6虛擬現(xiàn)實技術(shù)應(yīng)用現(xiàn)狀
本章總結(jié)
思考題與練習題
第9章機器學習
9.1機器學習基礎(chǔ)
9.1.1機器學習簡介
9.1.2機器學習的發(fā)展
9.1.3監(jiān)督學習與無監(jiān)督學習
9.1.4機器學習相關(guān)類庫
9.2計算機視覺與機器學習
9.2.1K-均值聚類算法
9.2.2K-近鄰算法
9.2.3決策樹算法
9.2.4隨機森林算法
9.2.5支持向量機
9.3深度學習基礎(chǔ)
9.3.1深度學習簡介
9.3.2深度學習的發(fā)展
9.3.3深度學習模型
9.3.4神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
9.3.5卷積神經(jīng)網(wǎng)絡(luò)
9.4計算機視覺與深度學習
9.4.1圖像分類
9.4.2目標檢測
9.4.3實例分割
9.4.4圖像生成
本章總結(jié)
思考題與練習題
參考文獻