本書共分為9章,主要內(nèi)容包括數(shù)字圖像與機器視覺概述、數(shù)字圖像工具與軟件實現(xiàn)、圖像與視覺基礎(chǔ)知識、機器視覺系統(tǒng)硬件、圖像變換與圖像運算、圖像增強與復(fù)原、圖像分割、圖像識別與神經(jīng)網(wǎng)絡(luò)及數(shù)字圖像與機器視覺應(yīng)用實例等內(nèi)容。本書中部分示例來源于實際工業(yè)、農(nóng)業(yè)數(shù)字圖像及機器視覺應(yīng)用領(lǐng)域,其技術(shù)手段先進、適用范圍廣。本書既可作為高等學校機械電子、機器人工程、智能制造工程、自動化、計算機、電子信息、測控等專業(yè)的教材,也可作為相關(guān)科研和工程技術(shù)人員參考書籍。
第1章 緒論1
1.1 數(shù)字圖像概念與特征 1
1.1.1 數(shù)字信號與模擬信號 1
1.1.2 數(shù)字圖像基本概念 1
1.1.3 數(shù)字圖像基本特點 2
1.2 數(shù)字圖像處理的主要范疇 3
1.2.1 圖像檢測與數(shù)字圖像處理 3
1.2.2 數(shù)字圖像處理的主要研究內(nèi)容 3
1.3 機器視覺的概念與組成 4
1.3.1 機器視覺的基本單元 4
1.3.2 機器視覺與圖像處理 5
1.3.3 數(shù)字圖像與機器視覺相關(guān)科學領(lǐng)域 6
1.4 數(shù)字圖像與機器視覺應(yīng)用 7
1.4.1 數(shù)字圖像與機器視覺應(yīng)用領(lǐng)域 7
1.4.2 數(shù)字圖像處理面臨的挑戰(zhàn) 7
1.4.3 數(shù)字圖像與機器視覺發(fā)展方向 8
第2章 數(shù)字圖像工具與軟件實現(xiàn)9
2.1 數(shù)字圖像處理相關(guān)工具軟件概述 9
2.1.1 數(shù)字圖像處理對軟件的要求 9
2.1.2 數(shù)字圖像處理常用軟件 10
2.2 Python-OpenCV圖像處理環(huán)境 10
2.2.1 Python和Open CV概述 10
2.2.2 下載和安裝 11
2.3 圖像處理基本操作 19
2.3.1 讀取圖像 19
2.3.2 顯示圖像 19
2.3.3 保存圖像 20
2.3.4 獲取圖像屬性 20
2.3.5 綜合訓(xùn)練 20
第3章 圖像與視覺基礎(chǔ)知識24
3.1 視覺感知要素 24
3.1.1 人眼的結(jié)構(gòu) 24
3.1.2 眼睛中圖像的形成 26
3.1.3 亮度適應(yīng)和識別 27
3.2 圖像感知和獲取 28
3.2.1 視覺傳感器 28
3.2.2 簡易圖像成像模型 30
3.3 圖像的數(shù)字化過程 33
3.3.1 采樣過程 34
3.3.2 量化過程 36
3.3.3 編碼 37
3.4 圖像數(shù)據(jù)結(jié)構(gòu) 37
3.4.1 圖像模式 37
3.4.2 色彩空間 40
3.5 圖像質(zhì)量評價方法 42
3.5.1 主觀評價方法 43
3.5.2 客觀評價方法 43
3.6 圖像數(shù)字化OpenCV實現(xiàn) 44
3.6.1 NumPy模塊使用基礎(chǔ) 44
3.6.2 像素操作與色彩空間操作 50
3.6.3 綜合訓(xùn)練 51
第4章 機器視覺系統(tǒng)硬件53
4.1 光源 53
4.1.1 光源的選擇 53
4.1.2 光源的種類 53
4.2 鏡頭 54
4.2.1 鏡頭的主要參數(shù) 54
4.2.2 普通鏡頭和遠心鏡頭 55
4.2.3 鏡頭的選擇 56
4.3 工業(yè)相機 57
4.3.1 相機的分類 57
4.3.2 面陣相機和線陣相機 57
4.3.3 黑白相機和彩色相機 57
4.3.4 CCD和CMOS 59
4.3.5 相機的主要接口類型 59
4.3.6 相機的主要參數(shù) 60
4.3.7 工業(yè)相機選型 61
第5章 圖像變換與圖像運算63
5.1 圖像的幾何變換 63
5.1.1 縮放 63
5.1.2 翻轉(zhuǎn) 64
5.1.3 仿射變換 64
5.1.4 透視變換 65
5.2 圖像的運算 67
5.2.1 掩模運算 68
5.2.2 加法運算 68
5.2.3 位運算 69
5.3 圖像的頻域變換 71
5.3.1 數(shù)字信號基礎(chǔ)知識 71
5.3.2 傅里葉變換 71
5.3.3 離散余弦變換 76
5.4 圖像變換OpenCV實現(xiàn) 78
5.4.1 圖像的幾何變換實現(xiàn) 78
5.4.2 圖像的運算實現(xiàn) 82
5.4.3 圖像的頻域變換實現(xiàn) 84
5.4.4 圖像的卷積運算實現(xiàn) 87
第6章 圖像增強與復(fù)原89
6.1 圖像增強與圖像復(fù)原技術(shù)概述 89
6.1.1 圖像增強的體系結(jié)構(gòu) 89
6.1.2 圖像復(fù)原的體系結(jié)構(gòu) 91
6.2 灰度變換 91
6.2.1 灰度線性變換 91
6.2.2 灰度非線性變換 93
6.3 直方圖修正 94
6.3.1 直方圖的定義與性質(zhì) 95
6.3.2 直方圖的計算 97
6.3.3 直方圖的均衡化 98
6.4 圖像平滑 99
6.4.1 濾波原理與分類 100
6.4.2 空域低通濾波 102
6.4.3 頻域低通濾波 103
6.5 圖像銳化 104
6.5.1 空域高通濾波 104
6.5.2 頻域高通濾波 105
6.5.3 同態(tài)濾波器圖像增強的方法 106
6.6 偽彩色增強 107
6.6.1 灰度分層法偽彩色處理 108
6.6.2 灰度變換法偽彩色處理 108
6.6.3 頻域偽彩色處理 109
6.7 圖像復(fù)原 110
6.7.1 圖像退化模型 110
6.7.2 圖像復(fù)原的基本方法 111
6.7.3 運動模糊圖像的復(fù)原 111
6.8 圖像增強OpenCV實現(xiàn) 112
6.8.1 直方圖修正實現(xiàn) 112
6.8.2 圖像平滑與銳化實現(xiàn) 117
第7章 圖像分割121
7.1 圖像分割概述 121
7.1.1 圖像分割的概念 121
7.1.2 圖像分割的基本思路 121
7.1.3 圖像分割技術(shù)的特征 122
7.2 閾值分割 122
7.2.1 閾值分割的原理 122
7.2.2 閾值的選取 123
7.3 邊緣檢測 125
7.3.1 梯度算子 126
7.3.2 拉普拉斯算子 127
7.3.3 Canny算子 128
7.4 區(qū)域分割 130
7.4.1 區(qū)域生長 130
7.4.2 區(qū)域分裂與合并 131
7.4.3 水域分割 132
7.5 Hough變換 132
7.5.1 Hough變換的原理 133
7.5.2 廣義 Hough變換 136
7.6 圖像分割的OpenCV實現(xiàn) 137
7.6.1 圖像閾值分割方法 137
7.6.2 圖像梯度運算與微分算子 139
7.6.3 圖像邊緣提取與 Hough變換 142
第8章 圖像識別與神經(jīng)網(wǎng)絡(luò)147
8.1 模板匹配方法 147
8.1.1 圖像匹配的定義 147
8.1.2 基于區(qū)域的匹配 149
8.1.3 基于特征的匹配 150
8.2 基于級聯(lián)分類方法的圖像識別 151
8.2.1 級聯(lián)分類器 151
8.2.2 基于Adaboost算法的人臉檢測 152
8.2.3 級聯(lián)分類器的訓(xùn)練 158
8.3 基于神經(jīng)網(wǎng)絡(luò)的圖像識別 163
8.3.1 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu) 164
8.3.2 卷積神經(jīng)網(wǎng)絡(luò)的工作原理 166
8.3.3 卷積神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)的應(yīng)用 168
8.3.4 基于神經(jīng)網(wǎng)絡(luò)圖像的樣本生成及信息標注 169
8.4 圖像識別的OpenCV實現(xiàn) 176
8.4.1 基于模板匹配的圖像識別 176
8.4.2 基于級聯(lián)分類器的圖像檢測 177
8.4.3 基于人臉識別器的人臉識別 180
8.5 圖像識別的YOLO實現(xiàn) 184
8.5.1 理論基礎(chǔ) 184
8.5.2 YOLOv5環(huán)境搭建 185
第9章 數(shù)字圖像與機器視覺應(yīng)用實例187
9.1 七段數(shù)碼管 187
9.1.1 案例背景 187
9.1.2 理論基礎(chǔ) 187
9.1.3 程序?qū)崿F(xiàn) 187
9.2 車牌識別 192
9.2.1 案例背景 192
9.2.2 理論基礎(chǔ) 192
9.2.3 程序?qū)崿F(xiàn) 193
9.3 基于YOLOv5的圖像處理實戰(zhàn) 200
9.3.1 案例背景 200
9.3.2 數(shù)據(jù)集分析 200
9.3.3 程序?qū)崿F(xiàn) 201
9.4 嵌入式機器視覺系統(tǒng)應(yīng)用 202
9.4.1 嵌入式機器視覺系統(tǒng)簡介 202
9.4.2 樹莓派嵌入式機器視覺系統(tǒng)搭建 204
參考文獻211