-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
復(fù)雜環(huán)境下語音信號處理的深度學(xué)習(xí)方法 版權(quán)信息
- ISBN:9787302590002
- 條形碼:9787302590002 ; 978-7-302-59000-2
- 裝幀:80g膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
復(fù)雜環(huán)境下語音信號處理的深度學(xué)習(xí)方法 本書特色
本書將以中文首次全面介紹基于深度學(xué)習(xí)的魯棒語音處理的發(fā)展,具體包括語音檢測、單通道語音增強、多通道語音增強、語音分離、魯棒聲紋識別與魯棒語音識別。
復(fù)雜環(huán)境下語音信號處理的深度學(xué)習(xí)方法 內(nèi)容簡介
語音降噪處理是信號處理的重要分支領(lǐng)域。近年來,該領(lǐng)域在人工智能與深度學(xué)習(xí)技術(shù)的驅(qū)動下取得了突破性進展。本書系統(tǒng)總結(jié)語音降噪處理的深度學(xué)習(xí)方法,盡可能涵蓋該方法的前沿進展。全書共分8章。第 1章是緒論;第 2章介紹深度學(xué)習(xí)的基礎(chǔ)知識和常見的深度網(wǎng)絡(luò)模型;第 3~6章集中介紹基于深度學(xué)習(xí)的語音降噪處理前端算法,其中,第 3章介紹語音檢測,第4章介紹單通道語音增強,第5章介紹多通道語音增強,第6章介紹多說話人語音分離;第7章和第 8章分別介紹基于深度學(xué)習(xí)的語音降噪處理在聲紋識別和語音識別方面的應(yīng)用,其中著重介紹基于深度學(xué)習(xí)的現(xiàn)代聲紋識別、語音識別基礎(chǔ)和前沿進展。 本書專業(yè)性較強,主要面向具備一定語音信號處理和機器學(xué)習(xí)基礎(chǔ)、致力于從事智能語音處理相關(guān)工作的高年級本科生、研究生和專業(yè)技術(shù)人員。
復(fù)雜環(huán)境下語音信號處理的深度學(xué)習(xí)方法 目錄
第1章 緒論
第2章 深度學(xué)習(xí)基礎(chǔ)
2.1 有監(jiān)督學(xué)習(xí)
2.2 單層神經(jīng)網(wǎng)絡(luò)
2.2.1 基本模型
2.2.2 激活函數(shù)
2.3 前饋深度神經(jīng)網(wǎng)絡(luò)
2.3.1 反向傳播算法
2.3.2 正則化
2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.1 循環(huán)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
2.4.2 長短時記憶網(wǎng)絡(luò)
2.4.3 門控循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.4 深層RNN結(jié)構(gòu)
2.4.5 序列數(shù)據(jù)的RNN建模框架
2.5 卷積神經(jīng)網(wǎng)絡(luò)
2.5.1 卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
2.5.2 其他卷積形式
2.5.3 殘差神經(jīng)網(wǎng)絡(luò)
2.5.4 時序卷積網(wǎng)絡(luò)
2.6 神經(jīng)網(wǎng)絡(luò)中的歸-化
2.6.1 批歸-化
2.6.2 層歸-化
2.7 神經(jīng)網(wǎng)絡(luò)中的注意力機制
2.7.1 編碼器-解碼器框架
2.7.2 編碼器,注意力機制一解碼器框架
2.7.3 單調(diào)注意力機制
2.7.4 Transformer
2.8 生成對抗網(wǎng)絡(luò)
2.8.1 基本結(jié)構(gòu)
2.8.2 模型訓(xùn)練
2.9 本章小結(jié)
第3章 語音檢測
3.1 引言
3.2 基本知識
3.2.1 信號模型
3.2.2 評價指標
3.3 語音檢測模型
3.3.1 語音檢測模型的基本框架
3.3.2 基于深度置信網(wǎng)絡(luò)的語音檢測
3.3.3 基于降噪深度神經(jīng)網(wǎng)絡(luò)的語音檢測
3.3.4 基于多分辨率堆棧的語音檢測模型框架
3.4 語音檢測模型的損失函數(shù)
3.4.1 *小化交叉熵
3.4.2 *小均方誤差
3.4.3 *大化ROC曲線下面積
3.5 語音檢測的聲學(xué)特征
3.5.1 短時傅里葉變換的頻帶選擇
3.5.2 多分辨率類耳蝸頻譜特征
3.6 模型的泛化能力
3.7 本章小結(jié)
第4章 單通道語音增強
4.1 引言
4.2 基本知識
4.2.1 信號模型
4.2.2 評價指標
4.3 頻域語音增強
……
第5章 多通道語音增強
第6章 多說話人語音分離
第7章 聲紋識別
第8章 語音識別
參考文獻
復(fù)雜環(huán)境下語音信號處理的深度學(xué)習(xí)方法 作者簡介
張曉雷,西北工業(yè)大學(xué)教授,博士生導(dǎo)師。清華大學(xué)博士,美國俄亥俄州立大學(xué)博士后。入選國家與省部級青年人才計劃。主要從事語音信號處理、機器學(xué)習(xí)、人工智能的研究工作。在Neural Networks、IEEE TPAMI、IEEE TASLP、IEEE TCYB、Computer Speech and Language等國際期刊和會議發(fā)表論文六十余篇。出版專著和譯著各一部。主持國家和省部級項目十余項。獲授權(quán)發(fā)明專利十余項。曾獲國際神經(jīng)網(wǎng)絡(luò)學(xué)會與Neural Networks期刊2020年度論文獎、亞太信號與信息處理學(xué)會杰出講者、北京市科學(xué)技術(shù)一等獎等獎項。研究成果成功應(yīng)用于國內(nèi)三大電信運營商和金融、交通、保險等行業(yè)的二十余家主流企業(yè)。擔(dān)任Neural Networks、IEEE TASLP、EURASIP Journal on Audio, Speech,and Music Processing等國際期刊的編委,IEEE信號處理學(xué)會語音與語言技術(shù)委員會委員,中國人工智能學(xué)會模式識別專業(yè)委員會委員,中國計算機學(xué)會語音對話與聽覺專業(yè)委員會委員。
- >
【精裝繪本】畫給孩子的中國神話
- >
唐代進士錄
- >
自卑與超越
- >
上帝之肋:男人的真實旅程
- >
名家?guī)阕x魯迅:朝花夕拾
- >
史學(xué)評論
- >
推拿
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)