本書以高校和企業(yè)合作的人工智能大數(shù)據(jù)標注基地的實際運作經(jīng)驗為基礎, 將自己在AI大數(shù)據(jù)標注工廠中所領悟到的管理方法和所使用的技術平臺進行詳細闡述, 并結合實際案例進行講解, 在兼顧初學者的同時, 更偏重于如何以數(shù)據(jù)標注工廠的層面從管理方法和技術手段上提高AI大數(shù)據(jù)標注生產(chǎn)能力的探討。
第1部分 數(shù)據(jù)標注的緣起
第1章 人工智能的歷程回顧與展望
1.1 混沌初開——數(shù)學模型(1900—1956)
1.1.1 開天之問
1.1.2 創(chuàng)世神器
1.1.3 武林秘籍
1.1.4 宗師問世
1.2 江湖論道——達特茅斯會議(1956—1980)
1.2.1 華山論劍
1.2.2 江湖紛爭
1.2.3 停滯不前
1.2.4 門派初成
1.3 武林中興——深度學習(1981年至今)
1.3.1 盟主問道——機器學習
1.3.2 神兵現(xiàn)世——神經(jīng)網(wǎng)絡
1.3.3 后起之秀——深度學習
1.3.4 前提要素——數(shù)據(jù)標注
思考題
第2章 數(shù)據(jù)標注的崛起
2.1 數(shù)據(jù)標注的演變
2.1.1 數(shù)據(jù)標注的起源
2.1.2 數(shù)據(jù)標注在人工智能中的地位
2.1.3 數(shù)據(jù)標注團隊面臨的挑戰(zhàn)
2.2 數(shù)據(jù)標注行業(yè)發(fā)展趨勢
2.2.1 數(shù)據(jù)標注公司簡介
2.2.2 數(shù)據(jù)標注行業(yè)的現(xiàn)狀
2.2.3 數(shù)據(jù)標注行業(yè)前景
2.3 數(shù)據(jù)標注行業(yè)標準的制定
2.3.1 標注數(shù)據(jù)量記錄標準
2.3.2 標注工作職責說明
2.3.3 標注信息要求規(guī)范
2.3.4 標注執(zhí)行過程標準
2.3.5 標注術語體系標準
2.3.6 標注交付物說明
思考題
第3章 數(shù)據(jù)標注基礎知識
3.1 數(shù)據(jù)標注基礎
3.1.1 數(shù)據(jù)標注的概念
3.1.2 數(shù)據(jù)標注行業(yè)的特點
3.1.3 數(shù)據(jù)標注的分類
3.1.4 數(shù)據(jù)標注的過程
3.2 數(shù)據(jù)標注的對象
3.2.1 數(shù)據(jù)標注的人員結構
3.2.2 數(shù)據(jù)標注人員的素質(zhì)要求
3.2.3 數(shù)據(jù)標注的采集目標
3.2.4 數(shù)據(jù)標注平臺和工具
3.3 數(shù)據(jù)標注的質(zhì)量保證
3.3.1 數(shù)據(jù)標注質(zhì)量的地位
3.3.2 數(shù)據(jù)標注質(zhì)量標準
3.3.3 數(shù)據(jù)標注質(zhì)量檢驗方法
3.4 自動標注技術的發(fā)展
3.4.1 圖像自動標注
3.4.2 文本自動標注
思考題
第2部分 數(shù)據(jù)標注實施
第4章 文本數(shù)據(jù)標注
4.1 文本數(shù)據(jù)特征和分析
4.1.1 文本標注的定義
4.1.2 文本標注的應用領域
4.1.3 文本標注質(zhì)量標準
4.1.4 常見標注結果文件格式
4.2 文本數(shù)據(jù)采集和整理
4.2.1 文本數(shù)據(jù)采集介紹和案例
4.2.2 文本數(shù)據(jù)預處理及清洗工具
4.2.3 文本處理工具
4.3 文本數(shù)據(jù)標注工具和方法
4.3.1 目標檢測文本識別工具及使用方法
4.3.2 語義定義全文OCR識別工具及使用方法
4.4 文本數(shù)據(jù)標注案例
4.4.1 車牌——檢測識別
4.4.2 票據(jù)證件——語義分類全文OCR識別
思考題
第5章 圖像數(shù)據(jù)標注
5.1 圖像數(shù)據(jù)特征和分析
5.1.1 圖像標注的定義
5.1.2 圖像處理的應用領域
5.1.3 數(shù)據(jù)質(zhì)量和標注標準
5.1.4 常見的圖像文件和標注結果格式
5.1.5 圖像標注各類型介紹
5.2 圖像數(shù)據(jù)采集和整理
5.2.1 數(shù)據(jù)采集的渠道和方法
5.2.2 圖像數(shù)據(jù)采集案例
5.2.3 數(shù)據(jù)預處理和清洗
5.2.4 圖像處理工具
5.3 圖像數(shù)據(jù)標注工具和方法
5.3.1 目標檢測工具及使用方法
5.3.2 圖像分割工具及使用方法
5.4 圖像數(shù)據(jù)標注案例
5.4.1 人體框圖像標注——目標檢測
5.4.2 車輛輪廓摳圖——圖像分割
5.4.3 手勢特征點——點位標注
思考題
第6章 語音數(shù)據(jù)標注
6.1 語音數(shù)據(jù)特征和分析
6.1.1 音頻標注的定義
6.1.2 音頻標注的應用領域
6.1.3 語音的質(zhì)量和標注標準
6.1.4 語音標注運用類型
6.1.5 語音標注相關基礎知識
6.2 語音數(shù)據(jù)采集和整理
6.2.1 音頻采集的方法渠道
6.2.2 語音數(shù)據(jù)采集案例
6.2.3 音頻處理工具
6.3 語音數(shù)據(jù)標注工具和方法
6.4 語音數(shù)據(jù)標注案例
6.4.1 標注任務流程及規(guī)則
6.4.2 標注平臺系統(tǒng)操作
思考題
第7章 視頻數(shù)據(jù)標注
7.1 視頻標注特征和分析
7.1.1 視頻標注的定義
7.1.2 視頻標注與圖像標注的差異
7.1.3 視頻標注的應用領域
7.1.4 視頻標注基礎知識
7.1.5 常見視頻數(shù)據(jù)格式
7.2 視頻數(shù)據(jù)采集和整理
7.2.1 視頻采集的工作流程
7.2.2 視頻數(shù)據(jù)采集應用和發(fā)展
7.2.3 常用視頻處理工具
7.2.4 快剪輯平臺技術
7.3 視頻數(shù)據(jù)標注工具和方法
7.3.1 視頻幀跟蹤標注工具
7.3.2 視頻標注的方法和類型
思考題
第3部分 數(shù)據(jù)標注工廠
第8章 數(shù)據(jù)標注工廠理論基礎
8.1 生產(chǎn)管理理論
8.2 流水線理論
8.2.1 流水線起源
8.2.2 流水線的基礎概念
8.2.3 流水線生產(chǎn)的特點
思考題
第9章 數(shù)據(jù)標注工廠的管