以深度學(xué)習(xí)為基礎(chǔ)的文本檢測(cè)算法有基于回歸的模型和基于分割的模型,目前這兩種模型的應(yīng)用效果各有優(yōu)劣。為解決回歸模型對(duì)訓(xùn)練數(shù)據(jù)的依賴(lài),以及分割模型受目標(biāo)尺寸影響的問(wèn)題,本書(shū)提出了兩種新的算法:TSFnet和Mnet。 全書(shū)分為5章,概述了自然場(chǎng)景下文本檢測(cè)的研究現(xiàn)狀,陳述了相關(guān)算法的問(wèn)題、數(shù)據(jù)集與存在的挑戰(zhàn),并通過(guò)實(shí)驗(yàn),對(duì)基于融合網(wǎng)絡(luò)的TSFnet模型及結(jié)合區(qū)域網(wǎng)絡(luò)與注意力網(wǎng)絡(luò)的Mnet模型進(jìn)行了詳細(xì)的介紹,最后對(duì)相關(guān)的應(yīng)用進(jìn)行了簡(jiǎn)介。
本書(shū)結(jié)構(gòu)清晰,文字流暢,圖文并茂,適合從事場(chǎng)景文本檢測(cè)與識(shí)別研究的相關(guān)讀者閱讀,也適合作為高校相關(guān)專(zhuān)業(yè)學(xué)生的參考書(shū)。
豐富的圖文講解
先進(jìn)的文本識(shí)別算法
有效的檢測(cè)模型
擁有高F測(cè)度值
展示了自然場(chǎng)景文本識(shí)別的新研究成果
展示了自然場(chǎng)景文本識(shí)別的新研究成果
主編:
趙雪專(zhuān),男,1986年7月出生,講師,博士,博士畢業(yè)于中國(guó)科學(xué)院大學(xué),主要研究方向?yàn)闄C(jī)器學(xué)習(xí)與模式識(shí)別,研究成果主要應(yīng)用有于計(jì)算機(jī)視覺(jué)領(lǐng)域。近年來(lái),主持或參與多項(xiàng)國(guó)家和省部級(jí)科研項(xiàng)目,發(fā)表相關(guān)學(xué)術(shù)論文20余篇。申請(qǐng)專(zhuān)利24項(xiàng),其中授權(quán)13項(xiàng)。主持完成多項(xiàng)橫向項(xiàng)目,如探地雷達(dá)定位系統(tǒng)、視頻摘要系統(tǒng)、智能視頻監(jiān)控系統(tǒng)、DSP無(wú)線車(chē)型識(shí)別系統(tǒng)、疲勞檢測(cè)系統(tǒng)等。
副主編:
李玲玲,女,1973年1月出生,教授,博士后,鄭州航空工業(yè)管理學(xué)院智能工程學(xué)院院長(zhǎng),多模信息感知河南省工程實(shí)驗(yàn)室主任、河南省航空物流大數(shù)據(jù)工程研究中心主任。博士畢業(yè)于華中科技大學(xué)圖像識(shí)別與人工智能研究所,廈門(mén)大學(xué)博士后流動(dòng)站出站。研究方向?yàn)橛?jì)算機(jī)視覺(jué)。河南省創(chuàng)新人才杰出青年,河南省學(xué)術(shù)技術(shù)帶頭人,河南省“創(chuàng)新型科技團(tuán)隊(duì)”帶頭人、河南省高?萍紕(chuàng)新團(tuán)隊(duì)帶頭人、鄭州市科技創(chuàng)新團(tuán)隊(duì)帶頭人,河南省高等學(xué)校青年骨干教師,河南省教育廳學(xué)術(shù)帶頭人,河南省計(jì)算機(jī)教育學(xué)會(huì)常務(wù)理事。國(guó)家自然科學(xué)基金評(píng)審,通信學(xué)報(bào)、中國(guó)圖像圖形學(xué)報(bào)、武漢大學(xué)學(xué)報(bào)等評(píng)審。主持國(guó)家自然科學(xué)基金面上項(xiàng)目、人才支持計(jì)劃、河南省科技創(chuàng)新杰出青年基金、航空科學(xué)基金、河南省科技攻關(guān)項(xiàng)目等科研項(xiàng)目16項(xiàng);完成省級(jí)項(xiàng)目鑒定9項(xiàng);出版科研5部;先后獲得河南省科學(xué)技術(shù)進(jìn)步三等獎(jiǎng)等獎(jiǎng)項(xiàng)15項(xiàng)。
羅向陽(yáng),男,1978年生,戰(zhàn)略支援部隊(duì)信息工程大學(xué)教授、博導(dǎo),河南省網(wǎng)絡(luò)空間態(tài)勢(shì)感知重點(diǎn)實(shí)驗(yàn)室主任,國(guó)防科技青年基金獲得者,先后入選河南省科技創(chuàng)新杰出青年和杰出人才、中原科技創(chuàng)新領(lǐng)軍人才。先后主持國(guó)家自然科學(xué)基金5項(xiàng)(其中重點(diǎn)項(xiàng)目2項(xiàng)),國(guó)家863項(xiàng)目軍口課題、國(guó)家重點(diǎn)研發(fā)計(jì)劃課題、裝發(fā)預(yù)研重點(diǎn)項(xiàng)目等國(guó)家、軍隊(duì)和省部級(jí)科研項(xiàng)目30余項(xiàng),在IEEE JSAC、TIFS、TDSC、TII、TMM、TCSVT、TCC、TCSS、ACM TIOT、ACM TIOS、ACM TOMM、IEEE/ACM TNET、《中國(guó)科學(xué)》、《計(jì)算機(jī)學(xué)報(bào)》、《軟件學(xué)報(bào)》、《計(jì)算機(jī)研究與發(fā)展》和IJCAI、WWW、INFOCOM、ACM MM、IH、IH&MMSec等國(guó)內(nèi)外重要學(xué)術(shù)期刊/會(huì)議發(fā)表論文200余篇,其中被SCI檢索120余篇,5篇論文入選ESI高被引論文。在科學(xué)出版社出版《網(wǎng)絡(luò)空間測(cè)繪》專(zhuān)著1部,獲發(fā)明專(zhuān)利授權(quán)30余項(xiàng)。先后獲百篇優(yōu)博提名獎(jiǎng)和全軍博士學(xué)位論文獎(jiǎng),獲技術(shù)發(fā)明一等獎(jiǎng)和中國(guó)電子學(xué)會(huì)技術(shù)發(fā)明一等獎(jiǎng)各1項(xiàng)、軍隊(duì)和河南省科技進(jìn)步二等獎(jiǎng)4項(xiàng),軍隊(duì)教學(xué)成果二等獎(jiǎng)1項(xiàng),指導(dǎo)研究生獲全軍和河南省學(xué)位論文4篇。
目 錄
第 1章 緒論 1
1.1研究背景 1
1.2 問(wèn)題與挑戰(zhàn) 3
1.3主要研究?jī)?nèi)容 5
1.4 本文的組織結(jié)構(gòu) 5
第 2章 場(chǎng)景文本檢測(cè)算法綜述 7
2.1簡(jiǎn)介 7
2.2場(chǎng)景文本檢測(cè)和識(shí)別過(guò)程概述 8
2.3場(chǎng)景文本檢測(cè)和識(shí)別算法分類(lèi) 10
2.3.1基于傳統(tǒng)機(jī)器學(xué)習(xí)的場(chǎng)景文本檢測(cè)和識(shí)別算法 10
2.3.2基于深度學(xué)習(xí)的場(chǎng)景文本檢測(cè)和識(shí)別算法 28
2.4文本檢測(cè)和識(shí)別的評(píng)價(jià)指標(biāo) 41
2.5文本檢測(cè)和識(shí)別的數(shù)據(jù)集 42
2.5.1 ICDAR數(shù)據(jù)集 42
2.5.2 SVT數(shù)據(jù)集 44
2.5.3 IIIT數(shù)據(jù)集 45
2.5.4 KAIST數(shù)據(jù)集 46
2.5.5 CTW數(shù)據(jù)集 46
2.5.6 RCTW-17數(shù)據(jù)集 47
2.5.7 ICPR MWI 2018數(shù)據(jù)集 48
2.5.8 Total-Text數(shù)據(jù)集 48
2.5.9 Google FSNS數(shù)據(jù)集 49
2.5.10 COCO-TEXT數(shù)據(jù)集 49
2.5.11 Synthetic數(shù)據(jù)集 50
2.6 總結(jié) 50
第3章 基于融合網(wǎng)絡(luò)的TSFnet模型 52
3.1 問(wèn)題形成 52
3.2 相關(guān)研究 52
3.2.1基于回歸的模型 53
3.2.2 基于分割的模型 53
3.3 TSFnet 54
3.4實(shí)驗(yàn) 60
3.4.1評(píng)價(jià)指標(biāo) 60
3.4.2 參數(shù)設(shè)置 60
3.4.3 結(jié)果與分析 61
3.5 本章小結(jié) 64
第4章 結(jié)合區(qū)域建議網(wǎng)絡(luò)與注意力網(wǎng)絡(luò)的Mnet算法 66
4.1 問(wèn)題形成 66
4.2 相關(guān)研究 66
4.2.1基于回歸的模型 66
4.2.2 基于分割的模型 67
4.2.3 兩階段檢測(cè)模型 67
4.3 Mnet 68
4.3.1 Scale-RPN 69
4.3.2回歸網(wǎng)絡(luò) 70
4.3.3 分割網(wǎng)絡(luò) 70
4.3.4 注意力網(wǎng)絡(luò) 71
4.4 實(shí)驗(yàn) 72
4.4.1評(píng)價(jià)指標(biāo) 72
4.4.2參數(shù)設(shè)置 72
4.4.3實(shí)驗(yàn)對(duì)比與分析 73
4.5 本章小結(jié) 75
第5章 場(chǎng)景文本檢測(cè)與識(shí)別應(yīng)用 77
5.1卡證文字檢測(cè)與識(shí)別 77
5.1.1證件文字檢測(cè)與識(shí)別 77
5.1.2 銀行卡文字檢測(cè)與識(shí)別 79
5.1.3 名片文字檢測(cè)與識(shí)別 79
5.1.4 營(yíng)業(yè)執(zhí)照文字檢測(cè)與識(shí)別 80
5.2票據(jù)文字檢測(cè)與識(shí)別 80
5.3汽車(chē)場(chǎng)景文字檢測(cè)與識(shí)別 81
5.3.1 車(chē)牌檢測(cè)與識(shí)別 81
5.3.2 汽車(chē)VIN碼檢測(cè)與識(shí)別 83
5.4 文檔文字檢測(cè)與識(shí)別 83
5.5 自然場(chǎng)景文字檢測(cè)識(shí)別 84
第6章 總結(jié)與展望 86
6.1 總結(jié) 86
6.2展望 86
參考文獻(xiàn) 88