關于我們
書單推薦
新書推薦
|
現(xiàn)代推薦算法 讀者對象:本書力求用簡潔易懂的語言說清核心原理,對已經(jīng)有一定機器學習概念和數(shù)學基礎的學生和相關領域的從業(yè)者非常友好,特別適合推薦系統(tǒng)、計算廣告和搜索領域的從業(yè)者及學生拓展新知和項目實戰(zhàn)。
本書深入全面地講解了現(xiàn)代推薦算法,同時兼顧深度和廣度,介紹了當下較前沿、先進的各類算法及其實踐。本書從總覽篇開始,介紹推薦系統(tǒng)的基本概念及工作環(huán)節(jié)。在模型篇中,除了梳理推薦系統(tǒng)的發(fā)展史,本書還重點講解面向工業(yè)實踐的選擇及改進,為讀者打下推薦系統(tǒng)的算法基礎;進而帶著讀者進階到前沿篇、難點篇,面對推薦系統(tǒng)中的各式問題,給出解決方案;最后在決策篇中,從技術原理和用戶心理出發(fā),解釋一些常見決策背后的依據(jù),從而幫助讀者從執(zhí)行層面進階到?jīng)Q策層面,建立大局觀。本書力求用簡潔易懂的語言說清核心原理,對已經(jīng)有一定機器學習概念和數(shù)學基礎的學生和相關領域的從業(yè)者非常友好,特別適合推薦系統(tǒng)、計算廣告和搜索領域的從業(yè)者及學生拓展新知和項目實戰(zhàn)
趙致辰本碩畢業(yè)于清華大學電子工程系。主要研究方向包括動作識別、人臉識別、廣告和推薦中的排序模型及冷啟動問題等,發(fā)表相關學術領域論文7篇。曾從事移動端人臉識別工作,開發(fā)的紅外人臉識別算法應用于國內(nèi)多款手機;在推薦領域,提出的“POSO”模型在用戶冷啟動問題上取得突破性收益,已經(jīng)在業(yè)界廣泛應用,國內(nèi)外多家公司與產(chǎn)品如TikTok、快手、Meta等都在以POSO為原型探索冷啟動模型。
總覽篇
第 1 章 推薦系統(tǒng)概述 ............................................................................................. 2 1.1 推薦系統(tǒng)是什么 .......................................................................................... 2 1.2 推薦系統(tǒng)發(fā)展的天時、地利、人和 .......................................................... 4 1.2.1 天時 .................................................................................................. 6 1.2.2 地利 .................................................................................................. 6 1.2.3 人和 .................................................................................................. 7 第 2 章 現(xiàn)代推薦鏈路 ............................................................................................. 9 2.1 召回、粗排、精排——各有所長 .............................................................. 9 2.2 召回、粗排、精排——級聯(lián)漏斗 ............................................................ 13 2.3 打壓、保送、重排——拍不完的腦袋 .................................................... 20 模型篇 第 3 章 精排之鋒 ................................................................................................... 25 3.1 簡單“復讀機”——邏輯回歸模型 ........................................................ 25 3.2 工業(yè)邏輯回歸模型的稀疏性要求 ............................................................ 29 3.3 FM 的一小步,泛化的一大步 ................................................................. 34 3.4 多彩的 FNN/PNN/ONN/NFM 世界 ......................................................... 37 3.5 高階交叉 ................................................................................................... 41 3.6 工具人 GBDT ............................................................................................ 45 3.7 嵌入表示亦福亦禍,樹模型的新機遇 .................................................... 49 3.8 DNN 與兩大門派,“一念神魔”與功不唐捐 ........................................ 53 3.9 再論特征與嵌入生成 ................................................................................ 58 3.10 機器學習唯一指定王牌技術——注意力機制 ...................................... 62 3.11 注意力機制的幾種寫法 .......................................................................... 65 3.12 Transformer 的升維打擊 ......................................................................... 69 第 4 章 粗排之柔 ................................................................................................... 72 4.1 粗排存在與否的必要性 ............................................................................ 73 4.2 粗排復雜化的方法 .................................................................................... 73 4.3 Pair-wise 與 List-wise ................................................................................ 74 第 5 章 召回之厚 ................................................................................................... 76 5.1 u2i 之雙塔進擊史 ..................................................................................... 76 5.2 i2i 及 u2u2i 方案 ....................................................................................... 81 5.3 近似搜索概覽 ............................................................................................ 85 5.3.1 向量量化類方法 ............................................................................ 86 5.3.2 基于圖的搜索 ................................................................................ 87 5.4 樹模型與類樹模型的沖擊 ........................................................................ 89 第 6 章 模型迭代的術與道 .................................................................................... 93 6.1 什么是“老湯模型” ................................................................................ 93 6.2 模型迭代的“術” .................................................................................... 96 6.3 模型迭代的“道” .................................................................................... 98 前沿篇 第 7 章 用戶興趣建模 ......................................................................................... 101 7.1 從百到萬的用戶長期興趣建模 .............................................................. 101 7.1.1 從百到千 ...................................................................................... 102 7.1.2 從千到萬 ...................................................................................... 102 7.2 用戶多峰興趣建模 .................................................................................. 104 第 8 章 多任務學習 ............................................................................................. 107 8.1 多任務學習的實踐意義 .......................................................................... 107 8.2 多任務學習的基本框架 .......................................................................... 110 8.3 平行關系建!狹MoE 類方法 ......................................................... 113 8.4 非平行關系建模,任務間的因果 .......................................................... 117 第 9 章 非梯度場景 ............................................................................................. 121 9.1 線上與線下的鴻溝 .................................................................................. 121 9.2 弱個性化 CEM,強個性化強化學習 .................................................... 124 9.3 探微參數(shù)與性能的關系,把點連成面 .................................................. 128 第 10 章 探索與利用 ........................................................................................... 133 10.1 為什么要探索與利用 ............................................................................ 133 10.2 探索的本質(zhì)是巧妙“貪心” ................................................................ 136 第 11 章 后精排環(huán)節(jié) ........................................................................................... 139 11.1 定義多樣性問題,簡單的形式與復雜的標準 .................................... 139 11.2 DPP 算法與多樣性 ............................................................................... 142 11.3 考慮上下文的重排序 ............................................................................ 144 第 12 章 推薦中的偏差與消除............................................................................. 147 12.1 各種各樣的偏差 .................................................................................... 147 12.2 流行度偏差的消除 ................................................................................ 148 12.3 位置偏差的消除 .................................................................................... 151 第 13 章 自動機器學習技術 ................................................................................ 155 13.1 網(wǎng)絡結(jié)構(gòu)搜索與網(wǎng)絡微操的探索 ........................................................ 155 13.2 特征的搜索 ............................................................................................ 159 13.3 模型壓縮 ............................................................................................... 161 第 14 章 圖計算 .................................................................................................. 165 14.1 數(shù)據(jù)結(jié)構(gòu)的終極 .................................................................................... 165 14.2 GNN 的極簡發(fā)展史 .............................................................................. 168 14.3 物料非原子化,建模轉(zhuǎn)向圖 ................................................................ 171 難點篇 第 15 章 延遲轉(zhuǎn)化 ............................................................................................... 175 15.1 轉(zhuǎn)化與廣告機制 .................................................................................... 175 15.2 轉(zhuǎn)化的分解 ............................................................................................ 177 15.3 其他角度 ............................................................................................... 178 第 16 章 物料冷啟動 ........................................................................................... 181 16.1 “多模態(tài)之石,可以攻玉” ................................................................ 181 16.2 預排序向左,個性化向右 .................................................................... 184 16.3 流量分配,“普度眾生”還是“造神” .............................................. 188 第 17 章 用戶冷啟動 ........................................................................................... 191 17.1 元學習,對模型拔高的要求 ................................................................ 191 17.2 初始化的基底分解與生成 .................................................................... 195 17.3 POSO,首個從結(jié)構(gòu)角度改善用戶冷啟動的模型 .............................. 197 17.4 精品池:抓住人性需求 ........................................................................ 201 第 18 章 因果推斷 ............................................................................................... 204 18.1 當分布不夠用時 .................................................................................... 204 18.2 尋找“工具人”,將因果推斷直接應用于推薦 ................................ 209 第 19 章 長尾優(yōu)化 ............................................................................................... 212 決策篇 第 20 章 流量 ...................................................................................................... 218 20.1 重新認識流量 ........................................................................................ 218 20.1.1 流量區(qū)分快慢 ............................................................................ 219 20.1.2 流量區(qū)分成本高低 .................................................................... 220 20.1.3 流量是盲目的 ............................................................................ 220 20.1.4 流量是有“圈子”的 ................................................................ 221 20.2 時間的研究 ............................................................................................ 222 第 21 章 分層 ...................................................................................................... 224 21.1 你必須理解的物料生命周期 ................................................................ 224 21.2 你必須理解的用戶分層 ........................................................................ 228 21.3 三階段讓用戶為我“死心塌地” ........................................................ 231 第 22 章 實驗現(xiàn)象與回收 .................................................................................... 234 22.1 決策上線的黃金法則 ............................................................................ 234 22.2 “臨門一腳”,結(jié)果真的置信了嗎 ...................................................... 237 22.3 不萬能的 A/B 實驗和難以歸因的反轉(zhuǎn) ............................................... 239 22.4 線上和線下的對齊——無窮逼近 ........................................................ 241 后記 ....................................................................................................................... 243 參考文獻 ............................................................................................................... 244
你還可能感興趣
我要評論
|