館藏書目查詢 > 書目資料
借閱次數 :

資料科學的統計實務

  • 點閱:92
  • 評分:0
  • 評論:0
  • 引用:0
  • 轉寄:0



  • 書籤:
轉寄 列印
第1級人氣樹(0)
人氣指樹
  • 館藏
  • 簡介
  • 作者簡介
  • 收藏(0)
  • 評論(0)
  • 評分(0)

新書上市即攻佔日本亞馬遜統計類書籍第一名

 

很多資料科學、機器學習的書,內容充滿各種建模的技術展示、完美的案例分析,卻忘記了更重要的「資料」。唯有掌握好手中的資料,才是機器學習成功建模的第一步。

 

無法了解資料,深度學習也救不了你;相反的,正確蒐集資料,輕鬆建模沒煩惱。

 

如何了解資料?當然要從統計觀念開始。學習統計一定都要看抽象複雜的數學嗎?並不是!本書所使用的範例,會告訴大家「為什麼統計學要如此定義」、「為什麼技巧要那樣使用」。當讀者了解統計背後的觀念時,才不會迷失在複雜的數學。此外,有別於一般市售書籍總是用漂亮案例展示程式運行結果,此書用相當多的範例都是「專家也會犯的錯誤」,相信讀者同時學習成功以及失敗的案例後,可以更全面地了解資料科學的分析流程觀念。

 

本書會介紹資料分析中的許多技術的基本觀念,如變異數分析、偏相關係數、自相關函數、Bonferroni校正、Holm校正、隨機對照試驗、斷點迴歸分析、傾向評分匹配、T檢定、F檢定、分層多階段抽樣法等,介紹的過程中會直擊分析技術的思維,而非僅展示漂亮的數學。

 

本書亦會說明身為資料科學家該有的素養,來避免確認偏誤、倖存者偏誤、選擇偏誤、發表偏誤、自願者偏誤、可得性偏誤、樂觀偏誤、常態偏誤、後此謬論、賭徒謬誤、辛普森謬論、p-hacking、HARKing、單方論證、霍桑效應、畢馬龍效應等資料分析中可能踩到的陷阱。

 

如果讀者曾經有以下問題,那這本書將是你的最佳解方。

● 我想知道怎麼蒐集高品質資料來加速機器學習建模

● 我想知道什麼樣的資料適合什麼分析技術

● 我想知道分析過程中是否參雜不自覺的偏見

● 我想知道分析完的結果代表什麼意思

● 我想知道為什麼資料分析可以解決問題

 

此外,中文版還提供免費Python程式下載,讓讀者可以實際演練書中的範例,加深對知識的理解。

 

本書貫通從資料蒐集、資料分析、資料解讀每一個環節的觀念,讓你走上資料科學家的康莊大道! 

 

本書特色

 

● 概念性介紹資料分析的流程,探討過程中所需要的技術,解說分析結果的意義

● 拒絕只展示漂亮數學,改變傳統一直寫程式的教學,帶你直擊資料分析流程的根本觀念

● 分享專家的成敗案例,助你建立好的資料科學家素養,避免落入陷阱

● 底線標示重要觀念,粗體標示重要名詞,註解提供讀者延伸資訊

● 滿滿全彩圖說,每章結束附有重點整理,中文版附贈範例程式

● 中文版收錄免費 Bonus,由國內專家分享業界經驗談,讓你快速銜接上實務技能

 

好評推薦(依姓名筆劃順序排列)

 

國立政治大學統計學系副教授、台灣人工智慧學校講師 吳漢銘 推薦 

國立政治大學統計學系助理教授 周珮婷 推薦

「資料科學家的工作日常」版主 張維元 推薦

國立臺灣大學名譽教授 謝南瑞 推薦

江崎貴裕

 

東京大學先端科學技術研究中心特任講師。

 

2011 年畢業於東京大學工學部航空太空工程學系。2015 年取得同系所課程博士學位(因表現優異而縮短修業年限 1 年)與論文博士學位(工程學)。曾任日本學術振興會特別研究員、日本國立情報學研究所專案計畫研究員、日本國立研究開發法人科學技術振興機構 PRESTO 研究員與史丹佛大學訪問學者,自 2020 年起擔任現職。曾獲東京大學校長獎及井上研究獎勵獎等。致力於憑藉數學分析技術,解決統計力學、腦科學、行為經濟學、生物化學、運輸工程與物流科學等多重領域之問題。

此功能為會員專屬功能請先登入
此功能為會員專屬功能請先登入
此功能為會員專屬功能請先登入
此功能為會員專屬功能請先登入