-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
R語言實戰 數據整理、可視化、建模與挖掘 版權信息
- ISBN:9787111757214
- 條形碼:9787111757214 ; 978-7-111-75721-4
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
R語言實戰 數據整理、可視化、建模與挖掘 本書特色
R語言是源代碼開放、功能強大的數據分析軟件,它在數據清洗與探索、數據分析與建模、數據可視化、機器學習、深度學習等方面具有優秀的表現,廣泛應用于數學、統計學、數據科學、計算機科學、人工智能、云計算、生物醫學、工業統計等方向,發展前景十分廣闊。本書結合作者多年的科研與教學經驗,將數據科學基礎理論與其應用相結合,內容編排由點到面、由易到難,并通過實際操作演示講授理論知識,幫助讀者快速掌握利用R語言進行數據分析和數據挖掘的技能。
R語言實戰 數據整理、可視化、建模與挖掘 內容簡介
本書是一本數據科學的入門與提升教程,全書共5篇,按照由淺入深、循序漸進的方式介紹R語言的基本語法與實際應用,并結合現實數據進行實戰操作。內容涵蓋R語言的安裝與運行、數據對象的創建與編程、R語言初級與高級繪圖、數據的管理與清洗、統計分析與數據降維、無監督與有監督學習、利用R Markdown創建動態報告和制作幻燈片等。本書為讀者提供了相關案例的源碼(獲取方式見封底)。
本書適合對數據可視化、統計建模、數據分析、數據挖掘感興趣的研究人員和工程技術人員閱讀,也可作為高等院校數學、統計學、數據科學、計算機科學、人工智能、云計算、大數據分析、生物醫學、工業統計等方向本科生或研究生的參考教程。
R語言實戰 數據整理、可視化、建模與挖掘 目錄
**篇 R語言入門
第1章 R語言簡介/
1.1R語言的下載與運行/
1.2RStudio安裝與設置/
1.3R語言包/
1.4數據類型與運算符/
1.5運行R語言代碼/
1.6本章小結/
第2章 R語言數據對象/
2.1向量/
2.1.1數值型/
2.1.2邏輯型/
2.1.3缺失值/
2.1.4字符型/
2.1.5因子型/
2.1.6類型轉換/
2.2矩陣與高維數組/
2.2.1矩陣/
2.2.2高維數組/
2.3數據框/
2.3.1生成數據框/
2.3.2數據框操作/
2.4列表/
2.4.1生成列表/
2.4.2列表操作/
2.5時間數據/
2.5.1基礎包處理時間數據/
2.5.2lubridate包處理時間數據/
2.6本章小結/
第3章 程序編寫與函數/
3.1條件判斷語句/
3.1.1if語句/
3.1.2ifelse語句/
3.2循環語句/
3.2.1for循環/
3.2.2while循環/
3.2.3repeat循環/
3.3內置函數/
3.3.1常用的數學函數/
3.3.2常用的字符串處理函數/
3.3.3常用的統計函數/
3.4自定義函數/
3.4.1函數語法/
3.4.2函數編寫/
3.4.3函數調試/
3.5本章小結/
第二篇 R語言數據整理實戰
第4章 數據讀寫與管理/
4.1數據導入與保存/
4.2從文件中導入數據/
4.2.1導入帶有分隔符的數據/
4.2.2導入Excel表格數據/
4.2.3導入SPSS數據/
4.2.4導入SAS數據/
4.2.5導入MATLAB數據/
4.2.6導入Stata數據/
4.2.7使用RStudio菜單導入數據/
4.3網絡爬蟲爬取數據/
4.3.1從網頁中獲取鏈接和表格/
4.3.2從網頁中獲取文本/
4.3.3從網頁中獲取圖片/
4.4圖像數據管理/
4.4.1讀取圖像/
4.4.2圖像操作/
4.5數據并行計算/
4.5.1apply()函數的使用/
4.5.2lapply()函數的使用/
4.5.3sapply()和vapply()函數的使用/
4.5.4tapply()和mapply()函數的使用/
4.6本章小結/
第5章 數據清洗與操作/
5.1處理缺失值/
5.1.1發現缺失值/
5.1.2缺失值分布可視化/
5.1.3缺失值填補/
5.2dplyr數據操作/
5.2.1管道操作/
5.2.2數據選擇/
5.2.3數據過濾/
5.2.4數據修改/
5.2.5數據排序/
5.2.6數據分組/
5.2.7數據融合/
5.3長寬數據轉換/
5.3.1tidyr包長寬數據轉換/
5.3.2reshape2包長寬數據轉換/
5.4文本處理/
5.4.1正則表達式/
5.4.2stringr包文本操作/
5.4.3中文文本預處理/
5.5本章小結/目錄
第三篇 R語言數據可視化實戰
第6章 R語言基礎繪圖/
6.1圖形的基礎設置/
6.1.1圖形的形狀和線條/
6.1.2圖形的坐標系/
6.1.3圖形的顏色/
6.1.4圖形的文本/
6.2基礎圖形可視化/
6.2.1散點圖與線圖/
6.2.2直方圖與條形圖/
6.2.3箱線圖與平滑散點圖/
6.2.4三維圖形/
6.3子圖可視化/
6.3.1圖形窗口設計/
6.3.2繪制子圖/
6.4本章小結/
第7章 ggplot2數據可視化/
7.1ggplot2簡介/
7.1.1圖形語法/
7.1.2qplot快速繪圖/
7.2使用圖層構建圖形/
7.2.1幾何對象/
7.2.2theme函數/
7.2.3統計變換/
7.2.4位置調整/
7.2.5形狀和大小/
7.3ggplot2可視化進階/
7.3.1主題/
7.3.2顏色/
7.3.3分面/
7.3.4坐標系/
7.3.5可視化地圖/
7.4ggplot2數據可視化案例/
7.5本章小結/
第8章 R語言高級繪圖/
8.1plotly可交互圖形可視化/
8.1.1可交互統計圖/
8.1.2可交互圖形添加控件/
8.1.3制作可交互動畫/
8.2ggplot2拓展包可視化/
8.2.1cowplot包可視化/
8.2.2ggfortify包可視化/
8.2.3ComplexUpset包可視化/
8.3特殊圖形可視化/
8.3.1圓環條形圖/
8.3.2弧形圖/
8.4本章小結/
第四篇 R語言數據建模實戰
第9章 基礎統計分析/
9.1概率分布與抽樣/
9.1.1隨機數生成/
9.1.2概率分布/
9.1.3數據抽樣/
9.2數據描述性統計/
9.2.1數據的變量類型/
9.2.2數據描述匯總/
9.2.3頻數和列聯表/
9.3數據相關性分析/
9.3.1Pearson相關性系數/
9.3.2Spearman秩相關性系數/
9.3.3Kendall相關性系數/
9.4假設檢驗/
9.4.1數據分布檢驗/
9.4.2t檢驗/
9.5方差分析/
9.5.1單因素方差分析/
9.5.2雙因素方差分析/
9.5.3多變量方差分析/
9.6本章小結/
第10章 回歸分析/
10.1一元線性回歸/
10.1.1一元線性回歸模型/
10.1.2一元線性回歸實例/
10.2一元非線性回歸/
10.2.1多項式回歸/
10.2.2非線性*小二乘回歸/
10.2.3樣條模型/
10.3多元線性回歸/
10.3.1回歸模型的建立/
10.3.2回歸診斷/
10.3.3異常值分析/
10.3.4改進回歸模型/
10.4逐步回歸/
10.4.1直接逐步回歸/
10.4.2剔除異常值逐步回歸/
10.5邏輯回歸/
10.5.1用邏輯回歸進行數據分類/
10.5.2逐步邏輯回歸分析/
10.6本章小結/
第11章 特征提取與降維/
11.1主成分分析/
11.1.1判斷主成分的個數/
11.1.2提取主成分得分/
11.1.3主成分得分系數/
11.1.4核主成分分析/
11.2因子分析/
11.2.1確定因子個數/
11.2.2提取公共因子/
11.3多維尺度分析/
11.3.1MDS數據降維/
11.3.2計算樣本的空間位置/
11.4tSNE降維/
11.4.1tSNE數據降維案例/
11.4.2調整tSNE算法的困惑度/
11.5本章小結/
第五篇 R語言數據挖掘實戰
第12章 無監督學習/
12.1聚類分析/
12.1.1選擇合適的聚類數目/
12.1.2K均值與K中值聚類/
12.1.3層次聚類/
12.1.4密度聚類/
12.1.5模糊聚類/
12.2離群點檢測/
12.2.1LOF離群點檢測/
12.2.
R語言實戰 數據整理、可視化、建模與挖掘 作者簡介
薛震,博士、副教授、碩士生導師、香港城市大學訪問學者、山西省數學學會理事、山西省數學類專業教學指導委員會秘書長、中北大學教學名師。從事統計分析、機器學習與數據可視化研究。主持參與國家自然科學基金、山西省自然科學基金、裝備預研重點項目等10多項,發表論文30余篇,出版教材《R語言統計分析與機器學習》《R語言數據可視化實戰》等,榮獲全國“公益云圖數據可視化創新大賽”優秀導師。
孫玉林,西安電子科技大學人工智能學院博士在讀,長期從事大數據統計分析、機器學習與計算機視覺等方面的研究,發表多篇SCI一區期刊論文,曾獲得多次數學建模、數據挖掘等賽事一等獎。出版著作《R語言統計分析與機器學習》《R語言數據可視化實戰》《R語言數據分析:基礎、算法與實戰》《Pytorch深度學習入門與實戰》《Python機器學習:基礎、算法與實戰》等。
- >
朝聞道
- >
隨園食單
- >
中國歷史的瞬間
- >
龍榆生:詞曲概論/大家小書
- >
名家帶你讀魯迅:故事新編
- >
月亮與六便士
- >
二體千字文
- >
伯納黛特,你要去哪(2021新版)