本書從初學者的視角出發(fā), 使用通俗易懂的語言比較系統(tǒng)地介紹了基于深度學習的計算機視覺解決方案開發(fā)技術(shù), 以循序漸進的方式詳細討論了VGG16、AlexNet、R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD、DeepFace和FaceNet等多種典型神經(jīng)網(wǎng)絡模型的基本結(jié)構(gòu)和訓練方法, 結(jié)合具體應用案例生動形象地介紹了圖像樣本數(shù)據(jù)集的獲取與處理、深度學習模型的設計與優(yōu)化、應用系統(tǒng)的開發(fā)與部署的基本過程, 逐步消除使用深度學習技術(shù)開發(fā)計算機視覺應用的認知盲點, 廣大讀者通過自己的努力就可以不太困難地掌握全書主要內(nèi)容, 建立強大的應用技術(shù)基礎。
第1章 計算機視覺和深度學習簡介
1.1 使用OpenCV處理圖像
1.1.1 使用OpenCV檢測顏色
1.1.2 使用OpenCV檢測形狀
1.1.3 使用OpenCV檢測人臉
1.2 深度學習的基礎知識
1.2.1 神經(jīng)網(wǎng)絡背后的動力
1.2.2 神經(jīng)網(wǎng)絡中的層
1.2.3 神經(jīng)元
1.2.4 超參數(shù)
1.2.5 ANN的連接與權(quán)重
1.2.6 偏置項
1.2.7 激活函數(shù)
1.2.8 學習率
1.2.9 反向傳播
1.2.10 過度擬合
1.2.11 梯度下降算法
1.2.12 損失函數(shù)
1.3 深度學習的工作原理
1.3.1 深度學習過程
1.3.2 流行的深度學習程序庫
1.4 小結(jié)
習題
拓展閱讀
第2章 面向計算機視覺的深度學習
2.1 使用TensorFlow和Keras進行深度學習
2.2 張量
2.3 卷積神經(jīng)網(wǎng)絡
2.3.1 卷積
2.3.2 池化層
2.3.3 全連接層
2.4 開發(fā)基于CNN的深度學習解決方案
2.5 小結(jié)
習題
拓展閱讀
第3章 使用LeNet進行圖像分類
3.1 深度學習的網(wǎng)絡架構(gòu)
3.2 LeNet架構(gòu)
3.2.1 LeNet-1架構(gòu)
3.2.2 LeNet-4架構(gòu)
3.2.3 LeNet-5架構(gòu)
3.2.4 增強LeNet-4架構(gòu)
3.3 使用LeNet創(chuàng)建圖像分類模型
3.3.1 使用LeNet進行MNIST分類
3.3.2 使用LeNet進行德國交通標志分類
3.4 小結(jié)
習題
拓展閱讀
第4章 VGG和 AlexNet 網(wǎng)絡
4.1 AlexNet和VGG神經(jīng)網(wǎng)絡模型
4.1.1 AlexNet模型架構(gòu)
4.1.2 VGG模型架構(gòu)
4.2 使用AlexNet和VGG開發(fā)應用案例
4.2.1 CIFAR數(shù)據(jù)集
4.2.2 使用AlexNet模型處理CIFAR-10數(shù)據(jù)集
4.2.3 使用VGG模型處理CIFAR-10數(shù)據(jù)集
4.3 AlexNet模型和VGG模型的比較
4.4 使用CIFAR-100數(shù)據(jù)集
4.5 小結(jié)
習題
拓展閱讀
第5章 使用深度學習進行目標檢測
5.1 目標檢測
5.1.1 目標分類、目標定位與目標檢測
5.1.2 目標檢測的應用案例
5.2 目標檢測方法
5.3 目標檢測的深度學習框架
5.3.1 目標檢測的滑窗法
5.3.2 邊界框方法
5.3.3 重疊度指標
5.3.4 非極大性抑制
5.3.5 錨盒
5.4 深度學習網(wǎng)絡架構(gòu)
5.4.1 基于區(qū)域的CNN
5.4.2 Fast R-CNN
5.4.3 Faster R-CNN
5.4.4 YOLO算法
5.4.5 單階段多框檢測器
5.5 遷移學習
5.6 實時的目標檢測Python實現(xiàn)
5.7 小結(jié)
習題
拓展閱讀
第6章 人臉識別與手勢識別
6.1 人臉識別
6.1.1 人臉識別的應用
6.1.2 人臉識別的過程
6.2 人臉識別的深度學習模式
6.2.1 Facebook的DeepFace解決方案
6.2.2 FaceNet的人臉識別
6.3 FaceNet的Python實現(xiàn)
6.4 手勢識別Python解決方案
6.5 小結(jié)
習題
拓展閱讀
第7章 基于深度學習的視頻分析
7.1 視頻處理
7.2 視頻分析的應用
7.3 梯度消失和梯度爆炸
7.3.1 梯度消失
7.3.2 梯度爆炸
7.4 ResNet架構(gòu)
7.5 Inception網(wǎng)絡
7.5.1 1×1卷積
7.5.2 GoogLeNet架構(gòu)
7.5.3 Inception v2中的改進
7.5.4 Inception v3模型
7.6 視頻分析
7.7 使用Inception v3和ResNet創(chuàng)建Python解決方案
7.8 小結(jié)
習題
拓展閱讀
第8章 端到端的網(wǎng)絡模型開發(fā)
8.1 深度學習項目需求
8.2 深度學習項目的開發(fā)過程
8.2.1 業(yè)務問題的定義
8.2.2 源數(shù)據(jù)或數(shù)據(jù)收集階段
8.2.3 數(shù)據(jù)存儲與管理
8.2.4 數(shù)據(jù)準備和擴充
8.2.5 圖像樣本增強
8.3 深度學習的建模過程
8.3.1 遷移學習
8.3.2 常見錯誤/挑戰(zhàn)和模型性能提高
8.3.3 模型的部署與維護
8.4 小結(jié)
習題
拓展閱讀
附錄A
A1 CNN中的主要激活函數(shù)與網(wǎng)絡層
A2 Google Colab