-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大數據搜索與挖掘 版權信息
- ISBN:9787030403186
- 條形碼:9787030403186 ; 978-7-03-040318-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
大數據搜索與挖掘 本書特色
《大數據搜索與挖掘》以作者張華平、高凱、黃河燕、趙燕平團隊十余年在大數據搜索與挖掘領域所作的研究與應用工作為內容,介紹大數據搜索與挖掘的研發成果,內容涵蓋大數據處理概論、中文自然語言處理、網絡信息預處理、網絡情報挖掘(包括網絡語言分析、新特征語言抽取、漢語詞法分析、文本自動分類、自動聚類、自動摘要、關鍵詞抽取)、網絡精準搜索(信息檢索模型、句子搜索)、人物搜索等方面的研究成果。從大數據這座金礦中挖掘有價值的信息,是本書的目的所在。全書體系完整,內容新穎,條理清晰,組織合理,理論與實踐并重,突出原創的研究成果與實際應用。 《大數據搜索與挖掘》可為高校計算機專業、計算機語言學專業和人工智能專業等師生的教學和科研工作提供幫助,也可為從事大數據搜索與挖掘、中文自然語言處理、信息檢索與搜索引擎技術研發的工程技術人員和希望了解上述技術的愛好者等提供參考。
大數據搜索與挖掘 內容簡介
主要以作者十余年在工業控制網搜索與挖掘領域所作的研究與應用工作為內容,全面介紹我們在工業控制網信息預處理、挖掘(包括:工業控制網絡分析、新特征抽取、分類等)、搜索等方面的研究成果,并介紹在工業網,包括中國郵政、中國證監會、四維圖新等單位的實際應用案例。專著突出自己的研究成果為主,理論與實踐并重,強調技術工程實現與實際應用。
大數據搜索與挖掘 目錄
序
前言
第1章 緒論
1.1 大數據
1.2 云計算及hadoop簡介
1.3 web搜索、全文索引與lucene簡介
1.3.1 web搜索
1.3.2 全文索引
1.3.3 lucene簡介
1.4 大數據挖掘
1.5 本書主要內容及其知識點
1.6 本章小結
參考文獻
第2章 大數據搜索挖掘綜述
2.1 常用的信息檢索模型
2.1.1 傳統布爾檢索與擴展布爾檢索模型
2.1.2 向量空間模型
2.1.3 概率檢索模型
2.1.4 語言模型
2.2 自然語言理解與處理概述
2.3 中文詞法分析中的分詞處理
2.3.1 基于詞典和規則的漢字分詞
2.3.2 基于大規模語料庫的統計學習的分詞方法
2.3.3 規則和統計方法相結合的漢字分詞方法
2.4 未登錄詞及其識別
2.4.1 命名實體及其識別
2.4.2 未登錄詞與新詞識別
2.5 有意義串及其識別
2.6 詞典組織與管理
2.6.1 基于trie索引樹的詞典管理
2.6.2 基于哈希表的詞典管理
2.7 文本分類
2.8 文本聚類
2.8.1 文本表示
2.8.2 相似度度量
2.8.3 聚類算法體系
2.9 話題識別與跟蹤
2.10 句子及其檢索
2.10.1 傳統的文檔檢索方法
2.10.2 信息過濾方法
2.10.3 分類方法
2.10.4 語義比較方法
2.10.5 隱馬爾可夫模型方法
2.10.6 自動文摘方法
2.11 句子級新信息檢測
2.11.1 詞重疊度
2.11.2 *大區間相關度
2.11.3 余弦冗余度
2.11.4 命名實體觸發方法
2.11.5 統計機器翻譯模型
2.11.6 lexrank方法
2.12 本章小結
參考文獻
第3章 大數據檢索與分詞
3.1 概述
3.2 分詞對中文信息檢索的影響
3.3 分詞精度與檢索性能的關系
3.4 大數據應用環境下中文信息檢索的分詞算法及其特點
3.4.1 分詞算法的時間性能要求高
……
第4章 基于層次隱馬爾可夫模型的淺層詞法分析
第5章 大數據語言新特征發現
第7章 大數據文本自動摘要
第8章 jzsearch大數據精準搜索引擎
第9章 面向大數據的句子檢索與新穎性監測
第10章 人物追蹤中的數據預處理與屬性抽取
第11章 人物模型組織與基于事件的信息處理
附錄a ictclas/nlpir 2014漢語分詞系統介紹
附錄b nlpir大數據搜索與挖掘共享開發平臺
大數據搜索與挖掘 作者簡介
張華平,1978年出生。工學博士,北京理工大學副教授。畢業于中國科學院計算技術研究所。漢語詞法分析系統ICTCLAS創始人,ICTCLAS在國家973評測和第一屆國際漢語分詞大賽中綜合得分均獲得第1名。主要從事大數據搜索與挖掘、自然語言處理、信息檢索等方面的研究工作,主持或參與國家自然科學基金、863、973、242等十余項課題。曾先后獲得2010年度錢偉長中文信息處理科學技術獎一等獎,中國科學院院長優秀獎、中國科學院計算技術研究所所長特別獎,是中國科學院計算技術研究所“百星計劃”首批入選者。高凱,1968年出生。工學博士。畢業于上海交通大學計算機應用技術專業,河北省重點學科“計算機軟件與理論”中“信息檢索與云計算”方向學術帶頭人。主要從事大數據搜索與挖掘、自然語言處理、網絡信息檢索、社會網絡計算等領域的研究工作。黃河燕,1963年出生。工學博士,教授、博士生導師,現任北京理工大學計算機學院院長、國家高技術研究發展計劃(863計劃)主題專家組成員、教育部計算機專業指導委員會委員、中國人工智能學會副理事長、中國中文信息學會副理事長兼自然語言處理專業委員會主任。主要從事自然語言處理和機器翻譯、智能處理系統等領域的研究,承擔了近20項國家級科研攻關項目和大型工程應用,以及國際合作項目,獲得國家科學技術進步獎一等獎、國家經濟貿易委員會九五技術創新優秀項目獎、中央國家機關十大杰出青年等榮譽和獎勵。趙燕平,1956年出生。北京理工大學教授,國家人力資源和社會保障部職業技能鑒定中心電子商務專業委員會專家,中國電子學會健康物聯專委會專家。北京理工大學大數據搜索與挖掘實驗室副主任,曾任聯合國開發計劃署(UNDP)“中國可持續發展網絡計劃”項目專家。主持參與了多個科研和工程項目。
- >
我從未如此眷戀人間
- >
伊索寓言-世界文學名著典藏-全譯本
- >
推拿
- >
羅庸西南聯大授課錄
- >
唐代進士錄
- >
詩經-先民的歌唱
- >
山海經
- >
中國人在烏蘇里邊疆區:歷史與人類學概述