作者簡介
葫蘆娃
15位Hulu北京創新實驗室人才。
他們利用擅長的機器學習、深度學習等領域知識和演算法模型,建立一套自訂化的機器AI平台,改變著推薦引擎、圖像 / 影片編解碼、內容理解、廣告投放等多項與客戶息息相關的線上業務技術。
編者簡介
諸葛越
現任Hulu公司全球研發副總裁,中國大陸研發中心總經理。
曾任Landscape Mobile公司聯合創始人兼CEO,前雅虎北京全球研發中心產品總監,微軟北京研發中心專案總經理,雅虎美國軟體架構師。
諸葛越獲美國史丹佛大學的計算機碩士與博士,紐約州立大學石溪分校的應用數學碩士,曾就讀於清華大學計算機科學與技術系。
諸葛越的研究結果獲多項專利,2005年榮獲美國計算機學會資料庫專業委員會十年最佳論文獎。
推薦序
前言
機器學習演算法工程師的自我修養
第1章 特徵工程 Feature Engineering
01 特徵正規化
02 類別型特徵
03 高維組合特徵的處理
04 組合特徵
05 文字表示模型
06 Word2Vec
07 圖像資料不足時的處理方法
第2章 模型評估 Evaluate Model Performance
01 評估指標的局限性
02 ROC曲線
03 餘弦距離的應用
04 A/B測試的陷阱
05 模型評估的方法
06 超參數調整與最佳化
07 過度擬合與擬合不足
第3章 經典演算法 Classical Algorithm
01 支援向量機
02 邏輯迴歸
03 決策樹
第4章 降維 Dimensionality Reduction
01 PCA最大變異數理論
02 PCA最小均方誤差理論
03 線性判別分析
04 線性判別分析與主成分分析
第5章 非監督學習 Unsupervised Learning
01 K平均群集
02 高斯混合模型
03 自組織對映神經網路
04 群集演算法的評估
第6章 機率圖模型 Probabilistic Graphical Model
01 機率圖模型的聯合機率分布
02 機率圖表示
03 生成式模型與判別式模型
04 馬可夫模型
05 主題模型
第7章 最佳化演算法 Optimization Algorithms
01 監督式學習的損失函數
02 機器學習中的最佳化問題
03 經典最佳化演算法
04 梯度驗證
05 隨機梯度下降法
06 隨機梯度下降法的加速
07 L1正則化與稀疏性
第8章 取樣 Sampling
01 取樣的作用
02 均勻分布亂數
03 常見的取樣方法
04 常態分布的取樣
05 馬可夫鏈蒙地卡羅取樣法
06 貝氏網路的取樣
07 不均衡樣本集的重取樣
第9章 前饋神經網路 Feedforward Neural Network
01 多層感知器與布林函數
02 深度神經網路中的啟動函數
03 多層感知器的反向傳播演算法
04 神經網路訓練技巧
05 深度卷積神經網路
06 深度殘差網路
第10章 遞歸神經網路 Recurrent Neutral Network
01 遞歸神經網路和卷積神經網路
02 遞歸神經網路的梯度消失問題
03 遞歸神經網路的啟動函數
04 長短期記憶網路
05 Seq2Seq模型
06 注意力機制
第11章 強化學習 Reinforcement Learning
01 強化學習基礎
02 電玩遊戲裡的強化學習
03 策略梯度
04 探索與利用
第12章 整合學習 Integrated Learning
01 整合學習的種類
02 整合學習的步驟和例子
03 基分類器
04 偏差與變異數
05 梯度提升決策樹的基本原理
06 XGBoost與GBDT的關聯和區別
第13章 生成式對抗網路 Generative Adversarial Network
01 初識GANs 的秘密
02 WGAN:抓住低維的幽靈
03 DCGAN:當GANs遇上卷積
04 ALI:包攬推論業務
05 IRGAN:產生離散樣本
06 SeqGAN:產生文字序列
第14章 人工智慧的熱門應用 Popular Applications of Artificial Intelligence
01 計算廣告
02 遊戲中的人工智慧
03 AI 在自動駕駛中的應用
04 機器翻譯
05 人機互動中的智慧計算
附錄A 作者隨筆、參考文獻