關(guān)于我們
書單推薦
新書推薦
|
高效深度學(xué)習(xí) 讀者對象:機器學(xué)習(xí)堵
在生成式人工智能的時代,我們見證了模型推理對存儲空間和計算能力的巨大需求,這對大語言模型和視覺生成模型的實際應(yīng)用提出了前所未有的挑戰(zhàn)。在這樣的背景下,高效模型壓縮和模型設(shè)計技術(shù)顯得尤為重要,它們是降低模型計算和存儲需求的關(guān)鍵,使得模型的快速部署和高效運行成為可能。本書系統(tǒng)地介紹了高效模型壓縮和模型設(shè)計的方法,在編寫上兼顧理論和實踐。本書主體部分詳細介紹了模型壓縮的方法論,包括高效模塊設(shè)計、模型剪枝、模型量化、模型二值化、神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索、知識蒸餾幾大部分。另外,簡要介紹了定制化硬件加速器的設(shè)計及大語言模型的加速和壓縮。
你還可能感興趣
我要評論
|