數(shù)據(jù)科學(xué)與工程算法基礎(chǔ) 版權(quán)信息
- ISBN:9787302680161
- 條形碼:9787302680161 ; 978-7-302-68016-1
- 裝幀:平裝-膠訂
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>
數(shù)據(jù)科學(xué)與工程算法基礎(chǔ) 本書特色
本書是新興領(lǐng)域“十四五”高等教育教材,系統(tǒng)地介紹了特征工程、多類型數(shù)據(jù)表征、數(shù)據(jù)抽樣、圖計(jì)算、隨機(jī)優(yōu)化算法、相似性度量、關(guān)聯(lián)性分析等相關(guān)知識(shí)與方法,涵蓋數(shù)據(jù)表征、數(shù)據(jù)計(jì)算和數(shù)據(jù)挖掘等多方面的內(nèi)容。本書從數(shù)據(jù)科學(xué)與工程的基本概念和流程出發(fā),逐步引領(lǐng)讀者進(jìn)入數(shù)據(jù)科學(xué)的核心領(lǐng)域,全面理解和掌握數(shù)據(jù)科學(xué)的精髓,為進(jìn)一步深入學(xué)習(xí)機(jī)器學(xué)習(xí)算法建立扎實(shí)的算法基礎(chǔ)。
數(shù)據(jù)科學(xué)與工程算法基礎(chǔ) 內(nèi)容簡(jiǎn)介
"本書對(duì)數(shù)據(jù)科學(xué)與工程中的算法基礎(chǔ)進(jìn)行了全面的論述,把讀者引入數(shù)據(jù)科學(xué)的大門,為進(jìn)一步學(xué)習(xí)和掌握大數(shù)據(jù)分析算法提供有力的支撐。本書介紹的數(shù)據(jù)科學(xué)與工程中的算法基礎(chǔ)包括特征工程、數(shù)據(jù)表征、數(shù)據(jù)抽樣、隨機(jī)優(yōu)化算法和關(guān)聯(lián)性分析等,側(cè)重內(nèi)容的科學(xué)性、實(shí)用性和前沿性。本書結(jié)構(gòu)上注重理論與實(shí)踐并重,各章通過(guò)案例引出問題,并深入介紹回答類似問題需要的知識(shí),*后通過(guò)實(shí)際案例串聯(lián)本章知識(shí)點(diǎn),可以使讀者感受到算法的價(jià)值及其在解決實(shí)際問題中的實(shí)用性。 本書可以作為高等學(xué)校大數(shù)據(jù)、計(jì)算機(jī)等相關(guān)專業(yè)的教學(xué)用書,對(duì)科研機(jī)構(gòu)的研究人員、工程技術(shù)人員也有一定的參考價(jià)值。 "
數(shù)據(jù)科學(xué)與工程算法基礎(chǔ)數(shù)據(jù)科學(xué)與工程算法基礎(chǔ) 前言
信息技術(shù)的飛速發(fā)展使數(shù)據(jù)的產(chǎn)生、存儲(chǔ)和處理能力達(dá)到了前所未有的高度。數(shù)據(jù)的豐富性和復(fù)雜性帶來(lái)了巨大的挑戰(zhàn),同時(shí)也蘊(yùn)藏著巨大的機(jī)遇。如何挖掘不同類型數(shù)據(jù)中蘊(yùn)藏的豐富信息,已經(jīng)成為大數(shù)據(jù)時(shí)代面臨的重要問題之一。數(shù)據(jù)科學(xué)與工程,作為一門新興的交叉學(xué)科,正是為了應(yīng)對(duì)這一挑戰(zhàn)而誕生的。數(shù)據(jù)科學(xué)與工程以數(shù)據(jù)為研究對(duì)象,通過(guò)綜合運(yùn)用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)技術(shù)等方法對(duì)數(shù)據(jù)進(jìn)行處理和分析,以實(shí)現(xiàn)數(shù)據(jù)的價(jià)值。數(shù)據(jù)科學(xué)與工程的核心是算法,它們是處理數(shù)據(jù)、提取信息、發(fā)現(xiàn)模式和預(yù)測(cè)未來(lái)的強(qiáng)大引擎。
本書旨在培養(yǎng)新工科背景下具備數(shù)據(jù)科學(xué)思維,掌握數(shù)據(jù)科學(xué)與工程算法的大數(shù)據(jù)專業(yè)人才。本書系統(tǒng)地介紹了特征工程、多類型數(shù)據(jù)表征、數(shù)據(jù)抽樣、圖計(jì)算、隨機(jī)優(yōu)化算法、相似性度量、關(guān)聯(lián)性分析等相關(guān)知識(shí)與方法,涵蓋數(shù)據(jù)表征、數(shù)據(jù)計(jì)算和數(shù)據(jù)挖掘等多方面的內(nèi)容。本書從數(shù)據(jù)科學(xué)與工程的基本概念和流程出發(fā),逐步引領(lǐng)讀者進(jìn)入數(shù)據(jù)科學(xué)的核心領(lǐng)域,全面理解和掌握數(shù)據(jù)科學(xué)的精髓,為進(jìn)一步深入學(xué)習(xí)機(jī)器學(xué)習(xí)算法打下扎實(shí)的基礎(chǔ)。
全書共8章,內(nèi)容包括緒論、特征工程、多類型數(shù)據(jù)表征、數(shù)據(jù)抽樣、圖計(jì)算、隨機(jī)優(yōu)化算法、相似性度量、關(guān)聯(lián)性分析,不僅覆蓋了傳統(tǒng)數(shù)據(jù)科學(xué)領(lǐng)域的重要算法,還涉及*新的研究進(jìn)展,如圖計(jì)算、因果分析、多模態(tài)數(shù)據(jù)融合等前沿技術(shù),使得本書既具有廣度又具有深度。同時(shí),本書內(nèi)容結(jié)構(gòu)遵循學(xué)習(xí)規(guī)律: 首先通過(guò)“問題導(dǎo)入”,建立現(xiàn)實(shí)問題與數(shù)據(jù)科學(xué)與工程相關(guān)技術(shù)的關(guān)系,明確學(xué)習(xí)目標(biāo),激發(fā)學(xué)生學(xué)習(xí)數(shù)據(jù)科學(xué)與工程相關(guān)技術(shù)的興趣; 然后,構(gòu)建相關(guān)的知識(shí)體系,介紹算法及其演化,提高學(xué)生描述問題的表達(dá)能力、解決問題的算法思維能力; 在此基礎(chǔ)上,通過(guò)剖析典型案例,有力提高學(xué)生對(duì)知識(shí)和方法的掌握與綜合運(yùn)用能力,并提升學(xué)生對(duì)復(fù)雜工程問題的分析能力、綜合處理能力和創(chuàng)新探究能力; *后對(duì)本章內(nèi)容進(jìn)行總結(jié),并提供選擇題、計(jì)算題、思考題等供讀者練習(xí)。
本書由徐明華、陳志剛、羅俊如擔(dān)任主編,官威博士和郝亞東博士擔(dān)任副主編。研究生丁言瑞、汪池和徐昕瑜參與了本書部分案例的編寫,并參與了書稿的校對(duì)工作,徐守坤教授、石林教授、邵輝教授、胡超副教授等對(duì)本書提出了許多寶貴意見,這里一并表示感謝。
本書在編寫過(guò)程中參考和引用了許多專家和學(xué)者的資料,在此表示衷心的感謝。*后也要感謝所有為本書的編寫、審校和出版付出辛勤勞動(dòng)的工作人員。由于編者水平有限,時(shí)間倉(cāng)促,書中難免存在不足之處,敬請(qǐng)讀者批評(píng)指正。
編者
2024年12月
數(shù)據(jù)科學(xué)與工程算法基礎(chǔ) 目錄
第1章緒論
1.1概況
1.2數(shù)據(jù)分析
1.2.1流程
1.2.2算法分類
1.2.3基本原則
1.3算法基礎(chǔ)
1.4本章小結(jié)
習(xí)題
第2章特征工程
2.1問題導(dǎo)入
2.2特征提取
2.3特征探索性分析
2.3.1單變量分析
2.3.2多變量分析
2.4特征預(yù)處理
2.4.1缺失值處理
2.4.2異常值處理
2.4.3特征變換
2.5特征選擇
2.5.1過(guò)濾法
2.5.2封裝法
2.5.3嵌入法
2.6案例: 工業(yè)設(shè)備信號(hào)特征工程
2.7本章小結(jié)
習(xí)題
第3章多類型數(shù)據(jù)表征
3.1問題導(dǎo)入
3.2時(shí)序數(shù)據(jù)表征
3.2.1頻域特征
3.2.2時(shí)頻域特征
3.3文本數(shù)據(jù)表征
3.3.1詞袋模型
3.3.2TFIDF特征
3.3.3詞向量嵌入
3.4圖像數(shù)據(jù)表征
3.4.1圖像處理基礎(chǔ)
3.4.2SIFT
3.4.3HOG
3.4.4深度特征表示
3.4.5多模態(tài)特征融合
3.5案例: 農(nóng)作物病蟲害圖像表征
3.6本章小結(jié)
習(xí)題
第4章數(shù)據(jù)抽樣
4.1問題導(dǎo)入
4.2概率抽樣
4.3非均衡抽樣
4.3.1樣本分布不均衡問題
4.3.2過(guò)采樣
4.3.3欠采樣
4.4數(shù)據(jù)流抽樣
4.4.1數(shù)據(jù)流抽樣問題
4.4.2蓄水池抽樣
4.5蒙特卡洛抽樣
4.5.1直接采樣
4.5.2接受拒絕采樣
4.5.3重要性采樣
4.6案例: 基于SMOTE的信用卡交易欺詐數(shù)據(jù)采樣
4.7本章小結(jié)
習(xí)題
第5章圖計(jì)算
5.1問題導(dǎo)入
5.2圖網(wǎng)絡(luò)
5.2.1圖網(wǎng)絡(luò)表示
5.2.2網(wǎng)絡(luò)結(jié)構(gòu)分類
5.2.3網(wǎng)絡(luò)描述性統(tǒng)計(jì)
5.3圖基礎(chǔ)算法
5.3.1圖遍歷
5.3.2圖分割
5.4社區(qū)發(fā)現(xiàn)
5.4.1模塊度
5.4.2GN算法
5.4.3譜方法
5.5GraphScope簡(jiǎn)介
5.6案例: 基于譜聚類的圖像分割
5.7本章小結(jié)
習(xí)題
第6章隨機(jī)優(yōu)化算法
6.1問題導(dǎo)入
6.2梯度下降算法
6.3隨機(jī)梯度下降算法
6.4梯度加速方法
6.4.1動(dòng)量法
6.4.2Nesterov梯度加速
6.4.3自適學(xué)習(xí)率加速方法
6.5方差縮減
6.5.1方差縮減技術(shù)
6.5.2方差縮減算法
6.6案例: 邏輯回歸模型優(yōu)化算法
6.7本章小結(jié)
習(xí)題
第7章相似性度量
7.1問題導(dǎo)入
7.2相關(guān)系數(shù)
7.2.1皮爾遜相關(guān)系數(shù)
7.2.2余弦相似度
7.2.3Jaccard相似系數(shù)
7.3距離度量
7.3.1歐氏空間的距離度量
7.3.2流形空間的距離度量
7.3.3時(shí)間序列的距離度量
7.4概率散度
7.4.1f散度
7.4.2積分概率度量
7.5案例: 金融時(shí)間序列數(shù)據(jù)分析
7.6本章小結(jié)
習(xí)題
第8章關(guān)聯(lián)性分析
8.1問題導(dǎo)入
8.2非線性相關(guān)性分析
8.3典型關(guān)聯(lián)分析
8.4關(guān)聯(lián)規(guī)則
8.4.1關(guān)聯(lián)規(guī)則描述
8.4.2關(guān)聯(lián)規(guī)則挖掘
8.4.3數(shù)值型關(guān)聯(lián)規(guī)則挖掘
8.5因果分析
8.5.1結(jié)構(gòu)因果模型與圖模型
8.5.2因果效應(yīng)評(píng)估
8.6案例: 購(gòu)物車數(shù)據(jù)挖掘
8.7本章小結(jié)
習(xí)題
參考文獻(xiàn)
- >
月亮虎
- >
回憶愛瑪儂
- >
中國(guó)人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
羅曼·羅蘭讀書隨筆-精裝
- >
姑媽的寶刀
- >
月亮與六便士
- >
我從未如此眷戀人間
- >
名家?guī)阕x魯迅:朝花夕拾