關(guān)于我們
書單推薦
新書推薦
|
漢語詞自動生成研究 讀者對象:人工智能自動語言處理領(lǐng)域的學生和研究人員
漢語是一種意合語言,其詞義絕大多數(shù)來源于內(nèi)部語素義的組配,而大數(shù)據(jù)背景下,基于海量數(shù)據(jù)的語義信息提取能夠為語素義的描寫和刻畫提供充分知識。本書將大數(shù)據(jù)相關(guān)資源和漢語詞的語素義提取和描述方法結(jié)合,詳細描述漢語詞的內(nèi)部組配機制和生成規(guī)則,最終更好的實現(xiàn)漢語詞的自動生成。 漢語詞的生成一個重新解構(gòu)的語素義集合在一定的組配機制作用下進行內(nèi)部成分再替換的過程。這一過程涉及語義提取、語義解構(gòu)、語素替換和組配規(guī)則生成四個過程。其中高質(zhì)量的語義提取是前提,多維度的解構(gòu)是所有工作的基礎(chǔ)。作者通過海量數(shù)據(jù)的挖掘和篩選針對性構(gòu)建語素義知識庫的形式,為漢語詞的語義分析提供支撐,然后根據(jù)語素的組配關(guān)系,確定詞項生成的語義來源。語素替換是語義生成的核心,包括語義近似度計算和義項選擇兩個環(huán)節(jié)。項目通過構(gòu)詞結(jié)構(gòu)、語素義、物性角色等語義知識,以“語素概念”為基礎(chǔ),計算漢語語素義相似度,然后根據(jù)語素義項編碼,從而判斷可以生成替換的語素及對應的義項。組配規(guī)則是決定漢語新詞能否正確生成的重要因素,項目通過構(gòu)建語素組配規(guī)則庫的形式,生成漢語詞的組配機制,使替換對象得以正確組合。 整個流程語素義的挖掘和描述出發(fā),通過基于神經(jīng)網(wǎng)絡(luò)模型的詞向量生成工具尋找語素概念的近義詞網(wǎng),最終達到由語義到文本的自動生成,可以說是典型的利用大數(shù)據(jù)及人工智能技術(shù)來處理語言的問題。這一技術(shù)對自動文摘、機器寫作和機器翻譯有著重要影響。
你還可能感興趣
我要評論
|