國立臺東大學館藏查詢系統

館藏書目查詢 > 書目資料

借閱次數 :

Python+Spark 2.0+Hadoop機器學習與大數據分析實戰

點閱：388
評分：0
評論：0
引用：0
轉寄：0

簡略

MARC

001

610532

005

20230104163220.0

008		181004s2016 ch a e 000 0 chi d
020		\|a9789864341535\|q(平裝) : \|c新臺幣680元
040		\|aTWNTU\|bchi\|eccr
066		\|c$1
084		\|a312.136\|b4445\|2ncsclt
095		\|aNLB\|bA4 \|cC161732\|d312.136\|e4445-2\|pBOOK\|tCCL
100	1	\|a林大貴
245	10	\|aPython+Spark 2.0+Hadoop機器學習與大數據分析實戰 / \|c林大貴著
250		\|a初版
260		\|a新北市 : \|b博碩文化 , \|c2016.09
300		\|a554面 : \|b彩圖 ; \|c23公分
500		\|a附錄 : 本書範例程式下載與安裝說明
650	7	\|aPython(電腦程式語言)\|2lcstt
650	7	\|a雲端運算\|2lcstt
650	7	\|a電子資料處理\|2lcstt

書籤：

延伸查詢

匯出資料

線上調借

館藏
簡介
作者簡介
標籤(0)
收藏(0)
評論(0)
評分(0)

◆本書淺顯易懂的原理說明◆Step by Step實機操作◆範例程式詳細解說◆大幅降低機器學習與大數據技術的學習門檻機器學習正熱門機器學習是近20多年興起的多領域學科，機器學習演算法可從大量數據中建立模型，並利用模型對未知數據進行預測。近年來各大公司google、 facebook、microsoft、IBM…等，全力投入機器學習研究與應用，以Google為例，Google早已將機器學習，運用在垃圾郵件判斷、自動回覆、照片分類與搜尋、翻譯、語音辨識等功能。在你在不知不覺中，機器學習已經讓日常生活更便利。「大數據」與「機器學習」相輔相成大數據的特性: 大量資料、多樣化、速度快。因此如何從大量資料中擷取出有用的資訊，是大數據的主要課題。機器學習需要大量資料進行訓練，並且訓練過程需大量運算。正好大數據的興起帶來大量資料，以及可儲存大量數據的分散式儲存技術，例如:Hadoop HDFS、NoSQL..。還有分散式運算可進行大量運算，例如Spark 基於記憶體內的分散式運算框架，可以大幅提升效能。Python與Spark與Hadoop的完美結合本書的主題是Python+Spark+Hadoop機器學習與大數據分析：使用Python開發Spark應用程式，具有多重好處，既可以享有 Python語言特性所帶來的好處：程式碼簡明、易學習、高生產力的特質。再加上Spark基於記憶體內的分散式運算框架，非常適合需多次重覆運算的機器學習演算法，可以大幅提升效能。Spark可輕易讀取Hadoop分散式儲存技術HDFS。Spark也可以在Hadoop 新MapReduce架構YARN執行。Python與Spark機器學習與資料視覺化Python資料分析的相關模組如NumPy、Matplotlib、Pandas、Scikit-learn，讓Python成為資料分析主要語言之一。使用Python開發 Spark機器學習應用時，你仍然可以繼續使用這些模組，這對於Python開發者帶來很大的方便，例如：你可以使用Spark ML Pipeline機器學習、訓練、預測。並且可以將Spark DataFrames轉換為Pandas DataFrame。轉換後你就可以運用Python豐富的資料視覺化套件，例如matplotlib、Bokeh…等，進行資料視覺化。本書特色：實機操作建置Spark+Hadoop機器學習與大數據平台一般人學習大數據的困難是，沒有多台機器建立分散式系統，但是透過本書介紹使用Virtual Box虛擬機器的方法，就能在自家電腦演練建立Hadoop叢集，並且建立Python Spark機器學習開發環境。本書特色：以實務範例程式學會Python+Spark機器學習與大數據以大數據實務案例MovieLens(電影喜好推薦引擎)、StumbleUpon (網頁二元分類)、Covtype（森林覆蓋多元分類），BikeSharing(類Ubike租借數量迴歸分析)，介紹如何使用Python Spark運用機器學習演算法：決策樹、邏輯迴歸、支持向量機器SVM、單純貝氏。進行資料處理、訓練、建立模型、訓練驗證找出最佳模型、預測結果。

回頁首

林大貴作者從事IT產業多年，涉獵系統設計、網站開發、數位行銷與商業智慧等多領域，具備豐富實務開發經驗。近年來，開始從事書籍創作與教學，著重在人工智慧、機器學習、大數據等領域，並著有暢銷書《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》一書。

回頁首

此功能為會員專屬功能請先登入