站穩AI大師的第一步：最直覺機器學習 | 生病了怎麼辦 - 2024年11月

站穩AI大師的第一步：最直覺機器學習

作者：王聖元

出版社：深智數位

出版日期：2020年05月20日

ISBN：9789865501327

語言：繁體中文

售價：702元

書籍連結

　　本書重點

　　◎ 一本讓你打下最紮實基礎的機器學習數學書

　　◎ 理論及實作並重，全盤了解機器學習

　　◎ 線性、非線性、整合模型說明

　　◎ 線性回歸怎麼來的，邏輯回歸怎麼走的，正規化

　　◎ 支援向量機精華，決策樹以及單純貝氏定理

　　◎ 神經網路及正反向傳播的推導

　　◎ 整合學習的來龍去脈，隨機森林和提升樹

　　◎ xgboost極度梯度提升

　　本書主要內容

　　學習並精通任何一門學科無外乎要經過四個步驟：它是什麼？它可行嗎？怎麼學它？如何學好它？機器學習也不例外，本書就以這四個步驟來介紹機器學習。

　　每一章都以通俗的引言開始，吸引讀者；以精美的思維導圖過渡，讓說明想法更清晰；以簡要的歸納結束，讓讀者加強所學的知識。理論和實作相結合，既有嚴謹的數學推導，又有多樣（Python 和MATLAB）的程式展示，圖文並茂。

　　前3 章屬於機器學習的概述。作者在這3 章花費的時間最多，絕對讓讀者有所收穫。

　　第4～14 章介紹「如何學好機器學習」，重點介紹機器學習的各種演算法和調參技巧。

　　第1章「機器學習是什麼」，從定義開始，詳細介紹機器學習有關的知識、資料和效能度量。

　　第2章「機器學習可行嗎」，介紹機器具備學習樣本以外的資料的能力。

　　第3章「機器學習怎麼學」，介紹機器如何選擇出最佳模型。

　　第4～8章介紹線性模型，包含線性回歸模型、對率回歸模型、正規化回歸模型、支援向量機模型。

　　第9～11章介紹非線性模型，包含單純貝氏模型、決策樹模型、類神經網路模型、正向/反向傳播模型。

　　第12～14章介紹整合模型，包含隨機森林模型、提升樹模型、極度梯度提升模型。

　　第15章介紹機器學習中的一些非常實用的經驗，包括學習策略、目標設定、誤差分析、偏差和方差分析。

　　適合讀者群：機器學習初學者、對機器學習感興趣者，或大專院校相關科系學生。

本書特色

　　◎ 一本讓你打下最紮實基礎的機器學習數學書

　　◎ 理論及實作並重，全盤了解機器學習

作者簡介

王聖元

　　金融風險管理師；特許另類投資分析師。

　　學習及工作經歷：現任新加坡某金融諮詢公司總監。擁有新加坡國立大學

　　量化金融學士學位和金融數學碩士學位。

　　自我學習過程：獲得金融風險管理師 (FRM) 和特許另類投資分析師 (CAIA)認證，及 Coursera 頒發的機器學習、深度學習和TensorFlow實戰的認證。

　　平時堅持寫作，是公眾號「王的機器」的主理人，分享了關於金融工程、機器學習和量化投資的文章。

　　信念：“Yearning for Learning, Leading by Reading, Distilling by Writing.」（多學多讀多寫，終身渴望學習，通過讀書保持領先，通過寫作用心灌輸。）

前言

01 | 機器學習是什麼--機器學習定義
1.1 資料
1.2 機器學習類別
1.3 效能度量
1.4 歸納
參考資料

02 | 機器學習可行嗎--計算學習理論
2.1 基礎知識
2.2 核心推導
2.3 結論應用
2.4 歸納
參考資料
技術附錄

03 | 機器學習怎麼學--模型評估選擇
3.1 模型評估
3.2 訓練誤差和測試誤差
3.3 驗證誤差和交換驗證誤差
3.4 誤差剖析
3.5 模型選擇
3.6 歸納
參考資料
技術附錄

04 | 線性回歸
4.1 基礎知識
4.2 模型介紹
4.3 歸納
參考資料

05 | 邏輯回歸
5.1 基礎內容
5.2 模型介紹
5.3 歸納
參考資料

06 | 正規化回歸
6.1 基礎知識
6.2 模型介紹
6.3 歸納
參考資料

07 | 支援向量機
7.1 基礎知識
7.2 模型介紹
7.3 歸納
參考資料
技術附錄

08 | 單純貝氏
8.1 基礎知識
8.2 模型介紹
8.3 歸納
參考資料
技術附錄

09 | 決策樹
9.1 基礎知識
9.2 模型介紹
9.3 歸納
參考資料

10 | 類神經網路
10.1 基礎
10.2 模型應用
11 | 正向/反向傳播
11.1 基礎知識
11.2 演算法介紹
11.3 歸納
參考資料
技術附錄

12 | 整合學習
12.1 結合假設
12.2 裝袋法
12.3 提升法
12.4 整合方式
12.5 歸納
參考資料

13 | 隨機森林和提升樹
13.1 基礎知識
13.2 模型介紹
13.3 歸納
參考資料

14 | 極度梯度提升
14.1 基礎知識
14.2 模型介紹
14.3 歸納
參考資料

15 | 本書歸納
15.1 正交策略
15.2 單值評估指標
15.3 偏差和方差
A | 結語

前言

　　作者寫作本書的目的就是用通俗的文字來說明機器學習，最好通俗得如作者在女兒生日時，寫給她的信：

　　親愛的欣玥：

　

　　從2020 年開始，願你：

　　■ 學習不要死記硬背，避免過擬合；也不要蜻蜓點水，避免欠擬合。

　　■ 心態像隨機梯度下降一樣，不要過分注重眼前的利益和一時的得失，進而看不清大局而被假象矇騙。

　　■ 抉擇像隨機森林一樣，各取所長，集思廣益，這樣你才能做出最正確的決定。

　　■ 操行像自我調整提升一樣，知錯能改，這樣你才能越來越優秀。

　　■ 說話像奧卡姆剃刀原理一樣，牢記「少就是多」，當一個好的聆聽者。

　　■ 脾氣不要像梯度爆炸一樣越來越大，也不要像梯度消失一樣沒有，要穩定地敢愛敢恨。

　　■ 容忍像支援向量機一樣，最大化你的容錯間隔。有一些錯誤是在所難免的，要學會將硬間隔變成軟間隔。

　　■ 生活像偏差和方差達到最佳點一樣，不偏不倚，不驕不躁。

　　從2020 年開始，爸爸會

　　■ 最初輔導你有監督學習。

　　■ 然後鍛煉你半監督學習。

　　■ 接著放任你無監督學習。

　　■ 不斷評估你要增強學習。

　　當學習到了某個臨界點時，不管外界資源多麼豐富，你的表現一定會趨於穩定，這時必須靠深度學習才能大幅地突破自我，最後獲得遷移學習的能力。

　　學習並精通一種學科無外乎要經過四個步驟：它是什麼？它可行嗎？怎麼學它？

　　如何學好它？學習機器學習也不例外，本書就以這四個步驟來解讀機器學習。

　　◆ 第1 章介紹「機器學習是什麼」，即從定義開始，詳細介紹機器學習有關的知識、資料和效能度量。

　　◆ 第2 章介紹「機器學習可行嗎」，即機器具備學習樣本以外的資料的能力。

　　本章從機率的角度證明樣本內誤差和樣本外誤差的關係。

　　◆ 第3 章介紹「機器學習怎麼學」，即機器如何選出最佳模型。本章介紹機器學習版本的樣本內誤差（訓練誤差）和樣本外誤差（測試誤差），再透過驗證誤差來選擇模型。

　　前3 章屬於機器學習的概述：第1 章介紹機器學習的概念，為了讓讀者打好基礎；第2 章為證明機器學習是可行的，讓讀者做到心中有數；第3 章運用機器學習效能指標而建置架構，看懂它們不需要精通任何機器學習的演算法。作者在這3 章的寫作上花費的時間最多，光這3 章的內容就絕對讓讀者有所收穫。

　　第4~14 章介紹「如何學好機器學習」，重點介紹機器學習的各種演算法和調參技巧。在本書中，機器學習模型分為線性模型、非線性模型和整合模型。

　　◆ 第4~8 章介紹線性模型，包含線性回歸模型、對率回歸模型、正規化回歸模型、支援向量機模型。

　　◆ 第9~11 章介紹非線性模型，包含單純貝氏模型、決策樹模型、類神經網路模型、正向/反向傳播模型。

　　◆ 第12~14 章介紹整合模型，包含隨機森林模型、提升樹模型、極度梯度提升模型。

　　第15 章介紹機器學習中一些非常實用的經驗，包含學習策略、目標設定、誤差分析、偏差和方差分析。

　　為了幫助讀者閱讀，下面的流程圖展示了整本書的大架構。

　　本書的每一章都以通俗的引言開始，吸引讀者；以精美的思維導圖過渡，讓說明想法更清晰；以簡要的歸納結束，讓讀者加強所學的知識。此外，每個基礎知識都是理論和實作相結合，既有嚴謹的數學推導，又有多樣（Python 和MATLAB）的程式展示，圖文並茂，以最好的內容服務各種讀者。

　　作者非常欣賞Google 大腦研究員Chris Olah 的觀點 "I want to understandthings clearly, and explain them well"，即力爭把每個基礎知識弄清楚、弄透，然後以通俗容易的方式讓其他人學會、學透。作者願意做「把困難的東西研究透而簡單展示給大眾」的人（Research Distiller），因為學術界中的論文雖然「高大上」，但是很多會讓讀者讀完還是一頭霧水。用Chris Olah 的話來講，這種以不清不楚的方式來解釋高難課題的做法，欠下太多研究債務（Research Debt）。

　　這本書能夠完成，受到很多機器學習優質課程的啟發，比如史丹佛大學Andrew Ng 教授的CS229 課程、加州理工學院Yaser S. Abu-Mostafa 教授的Learning from Data 課程、台灣大學林軒田教授的機器學習基礎和技法、華盛頓大學Emily Fox 和Carlos Guestrin 教授的Machine Learning Specialization。他們的課程都是理論結合實際，通俗而不失嚴謹，學習這些課程可以讓我解決工作中的很多需求，可見這些課程的功力之高，在這裡我想對他們表達最真摯的感謝（即使他們也不認識我）！

　　此外，感謝父母無條件地支援我寫書，感謝爺爺、大伯和姐夫經常閱讀我的公眾號文章，經常鼓勵我，感謝夫人在我寫書時幫著帶小孩，感謝女兒給我的無窮動力：想像著以後她拿著我寫的書可以自豪地跟別的小朋友說「這是我爸爸寫的書」。最後感謝所有「王的機器」公眾號的讀者，你們的支援和回饋一直激勵著我不斷進步，這本書是特別為你們而寫的。

　　由於作者水準有限，書中難免會有錯漏之處，歡迎諸位專家和讀者們斧正。

童書久久III 閱讀越有語文力

站穩AI大師的第一步：最直覺機器學習 | 生病了怎麼辦 - 2024年11月

站穩AI大師的第一步：最直覺機器學習

相關書籍