《計算機視覺中的多視圖幾何(原書第2版)》是專著《Multiple View Geometry in Conputer Vision(Second Edition)》的中譯本。給定多幅未標定視圖,此書給出由圖像點對應(yīng)估計多焦點張量(特別是基本矩陣和三焦點張量)和由這些張量恢復(fù)攝像機矩陣并實現(xiàn)射影重構(gòu)的理論和算法(第二版提供了更有效的搜索和匹配算法)。作者提供了綜合性的背景材料,讀者只要熟悉線性代數(shù)和基本的數(shù)值方法就能夠理解書中給出的射影幾何和算法,并能直接依據(jù)《計算機視覺中的多視圖幾何(原書第2版)》來實現(xiàn)有關(guān)算法。
《計算機視覺中的多視圖幾何(原書第2版)》可作為研究生教材,可供從事計算機視覺的科研人員參考。
★總的來說,這本書提供了對晦澀概念的清晰解釋,并介紹了使用它們所需的數(shù)學(xué)方程,它以一種易于理解和實現(xiàn)的方式介紹了相關(guān)理論和算法。本書編排恰當(dāng),便于參考,并提供了很好的例子(豐富的例子對理解內(nèi)容更有幫助),且在每一章的結(jié)尾給出了有用的注釋和練習(xí).本書以其清晰的方法和解釋見長,是該領(lǐng)域研究人員教學(xué)和參考的理想工具。
——BMVA新聞
★“我對這本書非常認可.作者以清晰一致的方式成功地介紹了主流多視圖幾何中的主要技術(shù),包括經(jīng)照的和現(xiàn)代的……我真誠地向?qū)Χ嘁晥D幾何中傳統(tǒng)和現(xiàn)代技術(shù)的理論基礎(chǔ)感興趣的人推薦這本書!
——計算評論
讓計算機具有視覺,科學(xué)家與工程師們做出了近40年的不懈努力。應(yīng)該說,40年的努力,進展是顯著的,主要有兩個方面:
已經(jīng)形成一些計算視覺的基本理論框架,如20世紀80年代初形成的以Marr為代表的視覺計算理論(有些學(xué)者稱之為三維重建框架)和以后出現(xiàn)的基于模型的視覺(Model Based Vision)、主動視覺(Active Vision)等,F(xiàn)在看來,雖然我們?nèi)匀徊磺宄@些計算理論框架能否最終成為最理想的計算機視覺系統(tǒng)的基礎(chǔ),但有幾點幾乎是可以肯定的:一是迄今為止提出的各種理論框架雖然有方法論上的差異,有些甚至具有科學(xué)哲學(xué)思想的差異,但并沒有本質(zhì)上的相互排斥,而是互補的。二是這些已有的視覺系統(tǒng)理論框架可以作為具有一定程度視覺功能的實用視覺系統(tǒng)的基礎(chǔ)。隨著計算機性能價格比的指數(shù)增長,以現(xiàn)有視覺系統(tǒng)理論框架為基礎(chǔ)的、針對特定任務(wù)的實用視覺系統(tǒng),將會廣泛應(yīng)用于現(xiàn)實生活中。三是與人工智能的其他許多領(lǐng)域類似,真正的突破要比當(dāng)初想像的要困難得多,這里,“真正的突破”是指:當(dāng)我們將當(dāng)前的人工智能系統(tǒng)與人相比時,人的智能系統(tǒng)具有更強的通用性、自學(xué)習(xí)能力、自適應(yīng)性和對噪聲的魯棒性,計算機視覺另一方面的重要進展是,提出了大量的計算方法。尤其是20世紀90年代以來,為適應(yīng)不同計算理論框架和為改進計算機視覺系統(tǒng)對噪聲的魯棒性,引進了許多數(shù)學(xué)方法和與之相對應(yīng)的計算方法,幾乎所有的數(shù)學(xué)分支,尤其是應(yīng)用數(shù)學(xué)分支都要到計算機視覺領(lǐng)域來一顯身手,使許多初學(xué)者,甚至進行了多年研究的學(xué)者都感到困惑。人們不禁要問,難道我們真需要這么多的復(fù)雜數(shù)學(xué)分支和計算方法來解決計算機視覺問題嗎?事實上,這確實反映了當(dāng)前的許多數(shù)學(xué)工具還不能有效解決“更強的通用性、自學(xué)習(xí)能力、自適應(yīng)性和對噪聲的魯棒性”的問題。另一方面,現(xiàn)在的許多數(shù)學(xué)方法,本質(zhì)上是相通的。而我們?nèi)鄙偌葘@些方法都精通,又對計算機視覺中所面臨的實際問題有深入理解的理論工作者來對各種方法加以融會貫通。
在上述視覺計算方法的研究中,基于幾何的視覺計算方法,在20世紀90年代發(fā)展到了幾乎完美的程度,本書的作者既是這方面的先驅(qū)者,也在本書中做出了很好的總結(jié)與系統(tǒng)論述;趲缀蔚囊曈X計算方法,之所以引起很大關(guān)注是因為:
。1)計算機視覺的研究目標是使計算機具有通過二維圖像認知三維環(huán)境信息的能力,這種能力將不僅使機器能感知三維環(huán)境中物體的幾何信息,包括它的形狀、位置、姿態(tài)、運動等,而且能對它們進行識別與理解。事實上,20世紀80年代形成的Marr的計算理論框架和其他計算理論框架中,絕大部分內(nèi)容都涉及利用幾何方法計算環(huán)境中的三維物體的形狀、位置、姿態(tài)和運動。
中譯本序
原書序
原書前言
第1章 概論——多視圖幾何之旅
1.1 引言——無處不在的射影幾何
1.2 攝像機投影
1.3 由一幅以上的視圖重構(gòu)
1.4 三視圖幾何
1.5 四視圖幾何和n視圖重構(gòu)
1.6 轉(zhuǎn)移
1.7 歐氏重構(gòu)
1.8 自標定
1.9 收獲I:3D圖形模型
1.10 收獲Ⅱ:視頻增強
第0篇 基礎(chǔ)知識:射影幾何、變換和估計
本篇大綱
第2章 2D射影幾何與變換
2.1 平面幾何
2.2 2D射影平面
2.3 射影變換
2.4 變換的層次
2.5 1D射影幾何
2.6 射影平面的拓撲
2.7 從圖像恢復(fù)仿射和度量性質(zhì)
2.8 二次曲線的其他性質(zhì)
2.9 不動點與直線
2.10 結(jié)束語
第3章 3D射影幾何與變換
3.1 點和射影變換
3.2 平面、直線和二次曲面的表示和變換
3.3 三次繞線
3.4 變換的層次
3.5 無窮遠平面
3.6 絕對二次曲線
3.7 絕對對偶二次曲面
3.8 結(jié)束語
第4章 估計——2D射影變換
4.1 直接線性變換(DLT)算法
4.2 不同的代價函數(shù)
4.3 統(tǒng)計代價函數(shù)和最大似然估計
4.4 變換不變性和歸一化
4.5 迭代最小化方法
4.6 算法的實驗比較
4.7 魯棒估計
4.8 單應(yīng)的自動計算
4.9 結(jié)束語
第5章 算法評價和誤差分析
5.1 性能的上下界
5.2 估計變換的協(xié)方差
5.3 協(xié)方差估計的蒙特卡洛法
5.4 結(jié)束語
第1篇 攝像機幾何和單視圖幾何
本篇大綱
第6章 攝像機模型
6.1 有限攝像機
6.2 射影攝像機
6.3 無窮遠攝像機
6.4 其他攝像機模型
6.5 結(jié)束語
第7章 攝像機矩陣P的計算
7.1 基本方程
7.2 幾何誤差
7.3 受限攝像機的估計
7.4 徑向失真
7.5 結(jié)束語
第8章 進一步討論單視圖幾何
8.1 射影攝像機對平面、直線和二次曲線的作用
8.2 光滑曲面的圖像
8.3 射影攝像機對二次曲面的作用
8.4 攝像機中心的重要性
8.5 攝像機標定與絕對二次曲線的圖像
8.6 消影點與消影線
8.7 仿射3D測量和重構(gòu)
8.8 由單視圖確定攝像機標定K
8.9 單視圖重構(gòu)
8.10 標定二次曲線
8.11 結(jié)束語
第2篇 兩視圖幾何
本篇大綱
第9章 對極幾何和基本矩陣
9.1 對極幾何
9.2 基本矩陣F
9.3 由特殊運動產(chǎn)生的基本矩陣
9.4 基本矩陣的幾何表示
9.5 恢復(fù)攝像機矩陣
9.6 本質(zhì)矩陣
9.7 結(jié)束語
第10章 攝像機和結(jié)構(gòu)的3D重構(gòu)
10.1 重構(gòu)方法概述
10.2 重構(gòu)的多義性
10.3 射影重構(gòu)定理
10.4 分層重構(gòu)
10.5 直接重構(gòu)——利用地面知識
10.6 結(jié)束語
第11章 基本矩陣F的計算
11.1 基本方程
11.2 歸一化8點算法
11.3 代數(shù)最小化算法
11.4 幾何距離
11.5 算法的實驗評估
11.6 F的自動計算
11.7 計算F的特殊情形
11.8 其他元素的對應(yīng)
11.9 退化
11.10 計算F的幾何解釋
11.11 對極線的包絡(luò)
11.12 圖像矯正
11.13 結(jié)束語
第12章 結(jié)構(gòu)計算
12.1 問題陳述
12.2 線性三角測量法
12.3 幾何誤差代價函數(shù)
12.4 Sampon近似(一階幾何矯正)
12.5 最優(yōu)解
12.6 估計3D點的概率分布
12.7 直線重構(gòu)
12.8 結(jié)束語
第13章 場景平面和單應(yīng)
13.1 給定平面的單應(yīng)和逆問題
13.2 給定F和圖像對應(yīng)下平面誘導(dǎo)的單應(yīng)
13.3 由平面誘導(dǎo)的單應(yīng)計算F
13.4 無窮單應(yīng)H∞
13.5 結(jié)束語
第14章 仿射對極幾何
14.1 仿射對極幾何
14.2 仿射基本矩陣
14.3 由圖像點對應(yīng)估計FA
14.4 三角測量
14.5 仿射重構(gòu)
14.6 Necker反轉(zhuǎn)和淺浮雕多義性
14.7 計算運動
14.8 結(jié)束語
第3篇 三視圖幾何
本篇大綱
第15章 三焦點張量
15.1 三焦點張量的幾何基礎(chǔ)
15.2 三焦點張量和張量記號
15.3 轉(zhuǎn)移
15.4 三幅視圖的基本矩陣
15.5 結(jié)束語
第16章 三焦點張量T的計算
16.1 基本方程組
16.2 歸一化線性算法
16.3 代數(shù)最小化算法
16.4 幾何距離
16.5 算法的實驗評價
16.6 T的自動計算
16.7 計算T的特殊情形
16.8 結(jié)束語
第4篇 N視圖幾何
本篇大綱
第17章 N線性和多視圖張量
17.1 雙線性關(guān)系
17.2 三線性關(guān)系
17.3 四線性關(guān)系
17.4 四張平面的交
17.5 計數(shù)討論
17.6 獨立方程數(shù)
17.7 選取方程
17.8 結(jié)束語
第18章 N視圖計算方法
18.1 射影重構(gòu)——捆集調(diào)整
18.2 仿射重構(gòu)——分解算法
18.3 非剛性分解
18.4 射影分解
18.5 利用平面的射影重構(gòu)
18.6 由序列重構(gòu)
18.7 結(jié)束語
第19章 自標定
19.1 引言
19.2 代數(shù)框架和問題陳述
19.3 利用絕對對偶二次曲面標定
19.4 Kruppa方程
19.5 分層解法
19.6 由旋轉(zhuǎn)攝像機標定
19.7 由平面自標定
19.8 平面運動
19.9 單軸旋轉(zhuǎn)——轉(zhuǎn)臺運動
19.10 雙眼裝置的自標定
19.11 結(jié)束語
第20章 對偶
20.1 Carlsson-Weinshall對偶
20.2 簡化重構(gòu)
20.3 結(jié)束語
第21章 正負性
21.1 準仿射變換
21.2 攝像機的前面和后面
21.3 3維點集合
21.4 獲得一個準仿射重構(gòu)
21.5 變換正負性的效果
21.6 定向
21.7 正負性不等式
21.8 哪些點在第三幅視圖中可見
21.9 哪些點在前面
21.10 結(jié)束語
第22章 退化配置
22.1 計算攝像機投影矩陣
22.2 兩視圖中的退化特性
22.3 Carlsson-Weinshall對偶
22.4 三視圖臨界配置
22.5 結(jié)束語
第5篇 附錄
附錄1 張量記號
附錄2 高斯(正態(tài))分布與卡方分布
附錄3 參數(shù)估計
附錄4 矩陣性質(zhì)和分解
附錄5 最小二乘最小化
附錄6 迭代估計方法
附錄7 某些特殊的平面射影變換
參考文獻
后記