大數(shù)據(jù)安全治理與防范——網(wǎng)址反欺詐實戰(zhàn)
定 價:79.8 元
- 作者:張凱 牛亞峰 等
- 出版時間:2023/9/1
- ISBN:9787115622389
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:202
- 紙張:
- 版次:01
- 開本:16開
互聯(lián)網(wǎng)的快速發(fā)展,在方便用戶信息傳遞的過程中,也使大量犯罪活動從線下向線上轉(zhuǎn)移,黑灰產(chǎn)常常通過搭建和傳播欺詐、賭博、色情等惡意網(wǎng)站來牟取暴利。為了凈化網(wǎng)絡(luò)環(huán)境,必須加大對惡意網(wǎng)站的檢測和攔截。
本書主要介紹惡意網(wǎng)址的欺詐手段和對抗技術(shù)。本書分為5個部分,共11章。針對網(wǎng)址反欺詐這一領(lǐng)域,首先介紹萬維網(wǎng)的起源、工作原理和發(fā)展歷程;其次通過列舉常見的惡意網(wǎng)站,讓讀者了解網(wǎng)址反欺詐面臨的主要問題;然后講解網(wǎng)址基礎(chǔ)數(shù)據(jù)、數(shù)據(jù)治理和特征工程;接著介紹包含網(wǎng)址結(jié)構(gòu)、文本、圖像、復(fù)雜網(wǎng)絡(luò)在內(nèi)的一系列對抗方法和實戰(zhàn)案例;最后介紹網(wǎng)址運營體系和網(wǎng)址知識情報挖掘及應(yīng)用。本書將理論與實踐相結(jié)合,幫助讀者了解和掌握網(wǎng)址安全相關(guān)知識體系,也能幫助讀者培養(yǎng)從0到1搭建網(wǎng)址反欺詐體系的能力。無論是初級信息安全從業(yè)者,還是有志于從事信息安全方向的在校學(xué)生,都會在閱讀中受益匪淺。
1.專業(yè)性:由在互聯(lián)網(wǎng)安全領(lǐng)域有豐富經(jīng)驗和技能的騰訊專家工程師親筆撰寫,他們的知識和經(jīng)驗是這本書的寶貴財富。他們的專業(yè)性和技術(shù)實力使得這本書成為讀者了解和掌握網(wǎng)址安全的重要參考。
2.實戰(zhàn)性:本書注重實戰(zhàn),書中包含了大量的網(wǎng)址反欺詐實戰(zhàn)案例和干貨,讀者可以通過這些案例和干貨了解和掌握網(wǎng)址安全的實踐技巧和策略。
3.全面性:從萬維網(wǎng)的起源、工作原理和發(fā)展歷程講起,然后列舉常見的惡意網(wǎng)站,讓讀者了解網(wǎng)址反欺詐面臨的主要問題。接下來,將講解網(wǎng)址基礎(chǔ)數(shù)據(jù)、數(shù)據(jù)治理和特征工程,然后介紹包含網(wǎng)址結(jié)構(gòu)、文本、圖像、復(fù)雜網(wǎng)絡(luò)在內(nèi)的一系列對抗方法和實戰(zhàn)案例,最后介紹網(wǎng)址運營體系和網(wǎng)址知識情報挖掘及應(yīng)用。這是一個完整的系統(tǒng)性的講解,將幫助讀者全面了解和掌握網(wǎng)址安全的相關(guān)知識。
4.創(chuàng)新性:本書是市面上有關(guān)網(wǎng)址安全的業(yè)務(wù)實戰(zhàn)級指導(dǎo)圖書之一,來自于互聯(lián)網(wǎng)一線大廠多年網(wǎng)址反欺詐對抗風(fēng)控經(jīng)驗總結(jié),作者們將高科技從業(yè)人員在網(wǎng)址安全領(lǐng)域的新技術(shù)、工具和實踐經(jīng)驗融入其中,以清晰、易懂的方式向讀者展示網(wǎng)址安全的各個方面。此外,書中還提供了大量的實戰(zhàn)案例和技術(shù)細(xì)節(jié),讓讀者能夠更好地理解并應(yīng)用所學(xué)知識。
張凱,現(xiàn)任騰訊專家工程師。一直從事大數(shù)據(jù)安全方面的工作,積累了10多年的黑灰產(chǎn)對抗經(jīng)驗,主要參與過游戲安全對抗、業(yè)務(wù)防刷、金融風(fēng)控和反詐騙對抗系統(tǒng)等項目。
牛亞峰,現(xiàn)任騰訊高級工程師。一直從事黑灰產(chǎn)對抗業(yè)務(wù)方面的工作,參與過反洗錢、支付反欺詐、電信反詐、網(wǎng)址反欺詐等項目。
張旭,現(xiàn)任騰訊高級工程師。主要從事大數(shù)據(jù)下黑灰產(chǎn)安全對抗業(yè)務(wù)、反詐騙對抗系統(tǒng)開發(fā)方面的工作。曾參與中國信息通信研究院《電話號碼標(biāo)記應(yīng)用技術(shù)要求》行業(yè)標(biāo)準(zhǔn)制定,并為《電信網(wǎng)絡(luò)詐騙治理與人工智能應(yīng)用白皮書》提供行業(yè)技術(shù)支持。
甘曉華,現(xiàn)任騰訊高級工程師。主要從事金融風(fēng)控、黑灰產(chǎn)對抗等業(yè)務(wù)安全方面的相關(guān)工作。
熊奇,現(xiàn)任騰訊專家工程師。一直從事業(yè)務(wù)安全方面的工作,先后參與過反詐騙、App安全、金融反詐和安全大數(shù)據(jù)合規(guī)與業(yè)務(wù)風(fēng)控等項目,積累了15年的黑灰產(chǎn)對抗和安全系統(tǒng)架構(gòu)的經(jīng)驗。
目 錄
第 1部分 網(wǎng)址大數(shù)據(jù)安全基礎(chǔ)
第 1章 緒論 2
1.1 萬維網(wǎng)的起源 2
1.1.1 萬維網(wǎng)的發(fā)明 3
1.1.2 萬維網(wǎng)的關(guān)鍵技術(shù) 3
1.1.3 萬維網(wǎng)的影響 6
1.2 萬維網(wǎng)的工作原理 6
1.2.1 網(wǎng)站開發(fā) 8
1.2.2 網(wǎng)站部署 9
1.2.3 網(wǎng)站解析 10
1.2.4 網(wǎng)站渲染 11
1.3 萬維網(wǎng)風(fēng)控發(fā)展歷程 13
1.3.1 專家規(guī)則 14
1.3.2 機器學(xué)習(xí)模型 14
1.3.3 深度學(xué)習(xí)模型 14
1.3.4 圖神經(jīng)網(wǎng)絡(luò)模型 15
1.4 萬維網(wǎng)安全風(fēng)控架構(gòu) 16
1.5 小結(jié) 18
第 2部分 黑灰產(chǎn)洞察
第 2章 網(wǎng)絡(luò)黑灰產(chǎn)及其危害 20
2.1 詐騙類網(wǎng)站 20
2.1.1 投資理財類 21
2.1.2 貸款、代辦信用卡類 24
2.1.3 刷單返利類 25
2.1.4 仿冒平臺類 26
2.1.5 虛假交易類 29
2.1.6 虛假征信類 29
2.2 網(wǎng)絡(luò)賭博類網(wǎng)站 30
2.3 低俗色情類網(wǎng)站 32
2.4 盜號釣魚類網(wǎng)站 33
2.5 木馬病毒類網(wǎng)站 34
2.6 盜版侵權(quán)類網(wǎng)站 35
2.7 惡意刷量類網(wǎng)站 36
2.8 虛假廣告類網(wǎng)站 37
2.9 小結(jié) 38
第3部分 網(wǎng)址大數(shù)據(jù)治理與異常數(shù)據(jù)發(fā)現(xiàn)
第3章 網(wǎng)址數(shù)據(jù)治理與特征工程 40
3.1 網(wǎng)址基礎(chǔ)數(shù)據(jù) 40
3.1.1 資源定位符信息 41
3.1.2 域名IP地址 42
3.1.3 Whois注冊 42
3.1.4 ICP備案 43
3.1.5 Alexa排名 43
3.1.6 跳轉(zhuǎn)關(guān)系 44
3.1.7 頁面內(nèi)容 45
3.2 網(wǎng)址數(shù)據(jù)治理 45
3.2.1 數(shù)據(jù)采集 46
3.2.2 數(shù)據(jù)清洗 46
3.2.3 數(shù)據(jù)存儲 47
3.2.4 數(shù)據(jù)計算 48
3.3 網(wǎng)址特征工程 49
3.3.1 特征編碼與嵌入 49
3.3.2 特征挖掘 50
3.3.3 特征評估 51
3.4 小結(jié) 52
第4章 網(wǎng)址異常檢測體系 53
4.1 流量模型 54
4.2 傳播渠道模型 55
4.3 網(wǎng)站行為模型 57
4.4 時間序列模型 59
4.5 網(wǎng)址關(guān)系鏈模型 60
4.6 小結(jié) 62
第4部分 網(wǎng)址反欺詐檢測模型
第5章 網(wǎng)址結(jié)構(gòu)檢測模型 64
5.1 網(wǎng)頁結(jié)構(gòu)基礎(chǔ) 64
5.1.1 網(wǎng)頁核心構(gòu)成 65
5.1.2 資源列表結(jié)構(gòu) 69
5.1.3 網(wǎng)站目錄結(jié)構(gòu) 71
5.1.4 惡意代碼片段 72
5.2 網(wǎng)頁指紋算法流程 75
5.3 生成網(wǎng)頁指紋 76
5.3.1 網(wǎng)頁預(yù)處理 76
5.3.2 指紋生成算法的選型 78
5.4 構(gòu)建異常指紋庫 79
5.5 指紋相似度算法 81
5.6 小結(jié) 82
第6章 網(wǎng)址文本檢測模型 83
6.1 網(wǎng)址文本數(shù)據(jù) 83
6.2 常見惡意網(wǎng)址文本 86
6.3 敏感詞規(guī)則模型 88
6.3.1 敏感詞發(fā)現(xiàn) 90
6.3.2 敏感詞規(guī)則 91
6.4 文本聚類模型 92
6.4.1 惡意種子擴散案例 92
6.4.2 新型惡意網(wǎng)址發(fā)現(xiàn)案例 95
6.5 文本分類模型 97
6.5.1 文本二分類算法 99
6.5.2 文本多分類算法 101
6.6 小結(jié) 104
第7章 網(wǎng)址圖像檢測模型 105
7.1 圖像提取與預(yù)處理 105
7.1.1 圖像提取 106
7.1.2 圖像預(yù)處理 109
7.1.3 圖像數(shù)據(jù)集 111
7.2 圖像分類模型 112
7.2.1 數(shù)據(jù)準(zhǔn)備 112
7.2.2 模型訓(xùn)練 114
7.2.3 訓(xùn)練加速 117
7.2.4 預(yù)測與可解釋性 118
7.3 圖像相似度方法 119
7.3.1 相似度計算 120
7.3.2 擴散方法 121
7.3.3 檢索方法 123
7.4 圖像目標(biāo)檢測方法 124
7.4.1 模型訓(xùn)練 124
7.4.2 模型預(yù)測 126
7.5 小結(jié) 129
第8章 網(wǎng)址復(fù)雜網(wǎng)絡(luò)檢測模型 130
8.1 網(wǎng)址復(fù)雜網(wǎng)絡(luò)的構(gòu)建 130
8.1.1 網(wǎng)絡(luò)的節(jié)點 130
8.1.2 網(wǎng)絡(luò)的邊 134
8.2 網(wǎng)址復(fù)雜網(wǎng)絡(luò)的節(jié)點預(yù)測 138
8.2.1 預(yù)訓(xùn)練文本模型對網(wǎng)絡(luò)節(jié)點的預(yù)測 139
8.2.2 預(yù)訓(xùn)練圖像模型對網(wǎng)絡(luò)節(jié)點的預(yù)測 140
8.2.3 預(yù)訓(xùn)練指紋模型對網(wǎng)絡(luò)節(jié)點的預(yù)測 141
8.2.4 預(yù)訓(xùn)練DNN模型對網(wǎng)絡(luò)節(jié)點的預(yù)測 142
8.2.5 預(yù)訓(xùn)練多模態(tài)模型對網(wǎng)絡(luò)節(jié)點的預(yù)測 143
8.3 網(wǎng)址復(fù)雜網(wǎng)絡(luò)的關(guān)系應(yīng)用 144
8.3.1 歸屬與包含關(guān)系的應(yīng)用 144
8.3.2 聚集關(guān)系的應(yīng)用 145
8.3.3 引用關(guān)系的應(yīng)用 147
8.3.4 跳轉(zhuǎn)關(guān)系的應(yīng)用 149
8.4 網(wǎng)址復(fù)雜網(wǎng)絡(luò)的綜合應(yīng)用 151
8.4.1 圖神經(jīng)網(wǎng)絡(luò)算法 151
8.4.2 社區(qū)劃分算法 156
8.5 小結(jié) 158
第9章 網(wǎng)址多模態(tài)檢測模型 159
9.1 特征融合 161
9.1.1 直接融合 161
9.1.2 無監(jiān)督融合 164
9.1.3 有監(jiān)督融合 167
9.2 決策融合 169
9.2.1 模型集成 169
9.2.2 分層篩選 170
9.3 協(xié)同訓(xùn)練 172
9.4 小結(jié) 174
第5部分 網(wǎng)址運營與情報體系
第 10章 網(wǎng)址運營體系 176
10.1 穩(wěn)定性運營 177
10.1.1 在線服務(wù) 177
10.1.2 網(wǎng)址黑庫 180
10.1.3 特征模型 181
10.2 防誤報運營 182
10.2.1 白保護名單 182
10.2.2 防誤報監(jiān)控 184
10.2.3 自動化處置 185
10.3 用戶反饋運營 186
10.3.1 網(wǎng)址申訴 187
10.3.2 網(wǎng)址舉報 188
10.3.3 故障反饋 189
10.4 分級告警體系 190
10.5 小結(jié) 190
第 11章 網(wǎng)址知識情報挖掘及應(yīng)用 191
11.1 黑灰產(chǎn)團伙資源情報挖掘 191
11.1.1 網(wǎng)址類資源挖掘 191
11.1.2 賬號類資源挖掘 195
11.2 黑產(chǎn)入侵網(wǎng)站情報挖掘 196
11.2.1 HTML源文件分析法 196
11.2.2 網(wǎng)址關(guān)系鏈分析法 198
11.3 惡意網(wǎng)址服務(wù)商情報挖掘 200
11.3.1 內(nèi)容服務(wù)商 200
11.3.2 支付服務(wù)商 201
11.4 小結(jié) 202