本書著重機(jī)器機(jī)視覺的基本理論和技術(shù),介紹各種智能圖像處理與機(jī)器視覺技術(shù)的相關(guān)應(yīng)用;具備解決智能化檢測與識別、控制等應(yīng)用問題的初步能力,為以后從事模式識別與智能控制、機(jī)器人技術(shù)、智能制造等領(lǐng)域的研究與開發(fā)工作打下扎實的基礎(chǔ)。
機(jī)器視覺是一項綜合技術(shù),其內(nèi)容涉及數(shù)字信號處理、機(jī)械工程技術(shù)、控制與光源照明技術(shù)、傳感器技術(shù)、計算機(jī)軟件技術(shù)和人機(jī)接口技術(shù)等。典型的機(jī)器視覺應(yīng)用系統(tǒng)包括圖像捕捉模塊、光源模塊、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機(jī)械控制執(zhí)行模塊。因此,機(jī)器視覺就是為智能設(shè)備安裝的眼睛。機(jī)器視覺系統(tǒng)的魯棒性、實時性、高速度和高精度是其實用性的重要指標(biāo)。近年來,計算機(jī)的運算速度逐年提高,人們的生活消費方式、生產(chǎn)制造方式有了很大的變化,這給機(jī)器視覺應(yīng)用技術(shù)帶來了新的需求和挑戰(zhàn)。
上海交通大學(xué)的機(jī)器視覺與應(yīng)用課程開始于2001年,早是面向該校機(jī)械工程學(xué)院機(jī)械電子工程專業(yè)研究生開設(shè)的選修課,是作為機(jī)器人學(xué)配套課程出現(xiàn)的。該課程主要在圖像處理的基礎(chǔ)上重點介紹機(jī)器視覺理論與算法,如圖像預(yù)處理、立體視覺建模、運動視覺(或稱為序列圖像分析)、由圖像灰度恢復(fù)三維物體形狀、物體建模與識別方法,以及距離圖像分析方法等。本書規(guī)避了圖像處理涉及的大量數(shù)學(xué)公式,而是從應(yīng)用案例入手,幫助讀者掌握機(jī)器視覺技術(shù)并解決實際問題。
20年來,機(jī)器視覺應(yīng)用技術(shù)一直在向更深、更高層次發(fā)展,特別是2010年以來深度學(xué)習(xí)解決了圖像識別的一系列瓶頸問題,機(jī)器視覺應(yīng)用也從單一視覺檢測走向視覺定位、環(huán)境建模和對象識別的實用化方向。由于非電類專業(yè)出身的工程技術(shù)人員迫切希望掌握機(jī)器視覺技術(shù)并期待能靈活應(yīng)用該項技術(shù)提高機(jī)器人和裝備的智能化性能,因此,本書在系統(tǒng)地描述機(jī)器視覺的基本理論與方法時,重點介紹機(jī)器視覺應(yīng)用系統(tǒng)涉及的新技術(shù)、新方法、新器件以及機(jī)器視覺的典型應(yīng)用實例。本書內(nèi)容包含計算機(jī)視覺與機(jī)器視覺的基本概念、光源技術(shù)、鏡頭技術(shù)、攝像機(jī)技術(shù)和典型接口技術(shù),以及構(gòu)成機(jī)器視覺系統(tǒng)的標(biāo)定技術(shù)。同時,結(jié)合Matlab圖像處理工具和OpenCV開源代碼平臺,繞開了煩瑣的公式,介紹了機(jī)器視覺涉及的圖像處理和模式識別技術(shù)。書中的主要應(yīng)用案例分別來自作者指導(dǎo)過的張昊若、林敏捷、楊理欣幾位研究生的學(xué)位論文,研究生倪培遠(yuǎn)和張悅也參與了本書的整理和編輯工作,在此表示感謝!
由于作者的水平有限,書中難免存在不足之處,請大家就如何完善本書提出寶貴意見,我們的聯(lián)系方式是:qxcao@sjtu.edu.cn。
曹其新,上海交通大學(xué)機(jī)械與動力工程學(xué)院教授,博士生導(dǎo)師。主要研究方向為機(jī)器視覺、機(jī)器人控制技術(shù)。曾發(fā)表EI&SCI論文150多篇,獲得國家發(fā)明專利90多項、國家科技進(jìn)步二等獎1項、吳文俊人工智能科學(xué)技術(shù)獎一等獎1項、省部級科技獎項5項。
莊春剛,上海交通大學(xué)機(jī)械與動力工程學(xué)院副研究員,博士生導(dǎo)師。主要研究方向為機(jī)器視覺與控制。曾發(fā)表EI&SCI論文30多篇,獲得國家發(fā)明專利10多項、上海市技術(shù)發(fā)明一等獎1項。
前言
第1章緒論1
11機(jī)器視覺的發(fā)展及系統(tǒng)構(gòu)成1
111機(jī)器視覺的發(fā)展1
112機(jī)器視覺系統(tǒng)的構(gòu)成2
12Marr的視覺理論框架4
121視覺系統(tǒng)研究的3個層次4
122視覺信息處理的3個階段5
13機(jī)器視覺任務(wù)和機(jī)器視覺與其他領(lǐng)域的關(guān)系7
131機(jī)器視覺任務(wù)7
132機(jī)器視覺與其他領(lǐng)域的關(guān)系8
14參考文獻(xiàn)9
第2章成像與圖像采集10
21亮度與成像10
211光度學(xué)10
212亮度成像模型12
22鏡頭13
221針孔成像模型13
222鏡頭畸變16
223遠(yuǎn)心與景深17
23攝像機(jī)19
231CCD傳感器19
232CMOS傳感器20
233彩色成像22
234攝像機(jī)性能28
235深度攝像機(jī)30
24攝像機(jī)計算機(jī)接口31
25參考文獻(xiàn)32
第3章圖像預(yù)處理基礎(chǔ)33
31數(shù)據(jù)結(jié)構(gòu)33
311傳統(tǒng)的圖像數(shù)據(jù)結(jié)構(gòu)33
312分層數(shù)據(jù)結(jié)構(gòu)38
32圖像預(yù)處理41
321灰度值變換41
322幾何變換44
323圖像濾波器53
324形態(tài)學(xué)操作65
33參考文獻(xiàn)70
第4章圖像分割和特征匹配71
41圖像分割71
411閾值分割71
412連通域與邊緣提取77
413亞像素精度閾值分割86
414基于區(qū)域的分割87
415基于3D圖的圖像分割98
42特征匹配103
421區(qū)域特征103
422幾何元素的提取110
423輪廓特征112
424特征檢測子115
425特征描述子122
426匹配優(yōu)化算法125
427模板匹配132
43參考文獻(xiàn)136
第5章立體視覺與三維重建140
51立體視覺概述140
52立體視覺的基本原理142
53三維重建146
531攝像機(jī)標(biāo)定146
532機(jī)器人手眼標(biāo)定150
533射影幾何152
534多視圖重建場景158
535雙目攝像機(jī)與多目攝像機(jī)164
536深度圖168
54參考文獻(xiàn)169
第6章模式識別算法171
61支持向量機(jī)171
62貝葉斯分類器173
63聚類算法175
64神經(jīng)網(wǎng)絡(luò)基礎(chǔ)177
641感知機(jī)與神經(jīng)網(wǎng)絡(luò)基礎(chǔ)177
642參數(shù)學(xué)習(xí)方法179
643GPU并行技術(shù)179
65深度卷積神經(jīng)網(wǎng)絡(luò)181
651LeNet182
652GoogLeNet183
653ResNet185
66參考文獻(xiàn)187
第7章機(jī)器視覺在物體識別與測量中的應(yīng)用188
71檢測物體的特征提取188
711區(qū)域特征188
712灰度值特征189
713輪廓特征191
72模式分類與識別191
73機(jī)器視覺中形狀大小的測量194
731長度測量194
732線段測量196
733面積測量196
734圓測量197
74機(jī)器視覺表面缺陷檢測198
741印刷檢測199
742封裝檢測200
743鋸齒檢測201
75參考文獻(xiàn)203
第8章視覺伺服的基礎(chǔ)205
81視覺伺服控制簡介205
82概念說明與標(biāo)定技術(shù)206
821坐標(biāo)變換與剛體運動206
822攝像機(jī)模型與標(biāo)定208
823手眼標(biāo)定技術(shù)212
83視覺伺服控制理論213
831基于位置的視覺伺服213
832基于圖像的視覺伺服215
84應(yīng)用案例232
85參考文獻(xiàn)238
第9章機(jī)器視覺從容器中抓取零件的應(yīng)用240
91散亂零件識別的基本方法240
92抓取操作的機(jī)器人技術(shù)243
93散亂零件的識別與操作應(yīng)用246
94參考文獻(xiàn)251
第10章機(jī)器視覺在無源導(dǎo)航與定位中的應(yīng)用255
101移動機(jī)器人與導(dǎo)航255
102定位與地圖構(gòu)建256
103各類傳感器的初始化與預(yù)處理263
104即時定位與地圖構(gòu)建272
1041使用魚眼攝像機(jī)的視覺SLAM系統(tǒng)277
1042基于多攝像機(jī)系統(tǒng)的視覺SLAM系統(tǒng)277
105參考文獻(xiàn)278