可以很好地理解每種算法及具體思路,對于有python基礎(chǔ)的人來說是很好的計算機視覺入門書籍,介紹怎樣通過Python進行圖形圖像處理的一本書,里面包含了很多Python庫的介紹和用法,非常好!《Python計算機視覺編程》是計算機視覺編程的權(quán)威實踐指南,依賴Python語言講解了基礎(chǔ)理論與算法,并通過大量示例細致分析了對象識別、基于內(nèi)容的圖像搜索、光學(xué)字符識別、光流法、跟蹤、三維重建、立體成像、增強現(xiàn)實、姿態(tài)估計、全景創(chuàng)建、圖像分割、降噪、圖像分組等技術(shù)。另外,書中附帶的練習(xí)還能讓讀者鞏固并學(xué)會應(yīng)用編程知識。
Python計算機視覺編程目錄
第1章 基本的圖像操作和處理
1.1 PIL:Python圖像處理類庫
1.1.1 轉(zhuǎn)換圖像格式
1.1.2 創(chuàng)建縮略圖
1.1.3 復(fù)制和粘貼圖像區(qū)域
1.1.4 調(diào)整尺寸和旋轉(zhuǎn)
1.2 Matplotlib
1.2.1 繪制圖像、點和線
1.2.2 圖像輪廓和直方圖
1.2.3 交互式標(biāo)注
1.3 NumPy
1.3.1 圖像數(shù)組表示
1.3.2 灰度變換
1.3.3 圖像縮放
1.3.4 直方圖均衡化
1.3.5 圖像平均
1.3.6 圖像的主成分分析(PCA)
1.3.7 使用pickle模塊
1.4 SciPy
1.4.1 圖像模糊
1.4.2 圖像導(dǎo)數(shù)
1.4.3 形態(tài)學(xué):對象計數(shù)
1.4.4 一些有用的SciPy模塊
1.5 高級示例:圖像去噪
練習(xí)
代碼示例約定
第2章 局部圖像描述子
2.1 Harris角點檢測器
2.2 SIFT(尺度不變特征變換)
2.2.1 興趣點
2.2.2 描述子
2.2.3 檢測興趣點
2.2.4 匹配描述子
2.3 匹配地理標(biāo)記圖像
2.3.1 從Panoramio下載地理標(biāo)記圖像
2.3.2 使用局部描述子匹配
2.3.3 可視化連接的圖像
練習(xí)
第3章 圖像到圖像的映射
3.1 單應(yīng)性變換
3.1.1 直接線性變換算法
3.1.2 仿射變換
3.2 圖像扭曲
3.2.1 圖像中的圖像
3.2.2 分段仿射扭曲
3.2.3 圖像配準(zhǔn)
3.3 創(chuàng)建全景圖
3.3.1 RANSAC
3.3.2 穩(wěn)健的單應(yīng)性矩陣估計
3.3.3 拼接圖像
練習(xí)
第4章 照相機模型與增強現(xiàn)實
4.1 針孔照相機模型
4.1.1 照相機矩陣
4.1.2 三維點的投影
4.1.3 照相機矩陣的分解
4.1.4 計算照相機中心
4.2 照相機標(biāo)定
4.3 以平面和標(biāo)記物進行姿態(tài)估計
4.4 增強現(xiàn)實
4.4.1 PyGame和PyOpenGL
4.4.2 從照相機矩陣到OpenGL格式
4.4.3 在圖像中放置虛擬物體
4.4.4 綜合集成
4.4.5 載入模型
練習(xí)
第5章 多視圖幾何
5.1 外極幾何
5.1.1 一個簡單的數(shù)據(jù)集
5.1.2 用Matplotlib繪制三維數(shù)據(jù)
5.1.3 計算F:八點法
5.1.4 外極點和外極線
5.2 照相機和三維結(jié)構(gòu)的計算
5.2.1 三角剖分
5.2.2 由三維點計算照相機矩陣
5.2.3 由基礎(chǔ)矩陣計算照相機矩陣
5.3 多視圖重建
5.3.1 穩(wěn)健估計基礎(chǔ)矩陣
5.3.2 三維重建示例
5.3.3 多視圖的擴展示例
5.4 立體圖像
練習(xí)
第6章 圖像聚類
6.1 K-means聚類
6.1.1 SciPy聚類包
6.1.2 圖像聚類
6.1.3 在主成分上可視化圖像
6.1.4 像素聚類
6.2 層次聚類
6.3 譜聚類
練習(xí)
第7章 圖像搜索
7.1 基于內(nèi)容的圖像檢索
7.2 視覺單詞
7.3 圖像索引
7.3.1 建立數(shù)據(jù)庫
7.3.2 添加圖像
7.4 在數(shù)據(jù)庫中搜索圖像
7.4.1 利用索引獲取候選圖像
7.4.2 用一幅圖像進行查詢
7.4.3 確定對比基準(zhǔn)并繪制結(jié)果
7.5 使用幾何特性對結(jié)果排序
7.6 建立演示程序及Web應(yīng)用
7.6.1 用CherryPy創(chuàng)建Web應(yīng)用
7.6.2 圖像搜索演示程序
練習(xí)
第8章 圖像內(nèi)容分類
8.1 K鄰近分類法(KNN)
8.1.1 一個簡單的二維示例
8.1.2 用稠密SIFT作為圖像特征
8.1.3 圖像分類:手勢識別
8.2 貝葉斯分類器
8.3 支持向量機
8.3.1 使用LibSVM
8.3.2 再論手勢識別
8.4 光學(xué)字符識別
8.4.1 訓(xùn)練分類器
8.4.2 選取特征
8.4.3 多類支持向量機
8.4.4 提取單元格并識別字符
8.4.5 圖像校正
練習(xí)
第9章 圖像分割
9.1 圖割(Graph Cut)
9.1.1 從圖像創(chuàng)建圖
9.1.2 用戶交互式分割
9.2 利用聚類進行分割
9.3 變分法
練習(xí)
第10章 OpenCV
10.1 OpenCV的Python接口
10.2 OpenCV基礎(chǔ)知識
10.2.1 讀取和寫入圖像
10.2.2 顏色空間
10.2.3 顯示圖像及結(jié)果
10.3 處理視頻
10.3.1 視頻輸入
10.3.2 將視頻讀取到NumPy數(shù)組中
10.4 跟蹤
10.4.1 光流
10.4.2 Lucas-Kanade算法
10.5 更多示例
10.5.1 圖像修復(fù)
10.5.2 利用分水嶺變換進行分割
10.5.3 利用霍夫變換檢測直線
練習(xí)
附錄A 安裝軟件包
A.1 NumPy和SciPy
A.1.1 Windows
A.1.2 Mac OS X
A.1.3 Linux
A.2 Matplotlib
A.3 PIL
A.4 LibSVM
A.5 OpenCV
A.5.1 Windows和Unix
A.5.2 Mac OS X
A.5.3 Linux
A.6 VLFeat
A.7 PyGame
A.8 PyOpenGL
A.9 Pydot
A.10 Python-graph
A.11 Simplejson
A.12 PySQLite
A.13 CherryPy
附錄B 圖像集
B.1 Flickr
B.2 Panoramio
B.3 牛津大學(xué)視覺幾何組
B.4 肯塔基大學(xué)識別基準(zhǔn)圖像
B.5 其他
B.5.1 Prague Texture Segmentation Datagenerator與基準(zhǔn)
B.5.2 微軟研究院Grab Cut數(shù)據(jù)集
B.5.3 Caltech 101
B.5.4 靜態(tài)手勢數(shù)據(jù)庫
B.5.5 Middlebury Stereo數(shù)據(jù)集
附錄C 圖片來源
C.1 來自Flickr的圖像
C.2 其他圖像
C.3 插圖
參考文獻
索引
- PC官方版
- 安卓官方手機版
- IOS官方手機版