会员   密码 您忘记密码了吗?
1,661,740 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

商品分类

浏览历史

当前位置: 首页 > 电脑资讯 > Bad Data技術手冊
Bad Data技術手冊
上一张
Bad Data技術手冊
下一张
prev next

Bad Data技術手冊

作者: Q. Ethan McCallum
出版社: 歐萊禮
出版日期: 2013-09-13
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
定价:   NT480.00
市场价格: RM73.90
本店售价: RM65.00
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

  什麼是壞資料?有些人認為它是一個技術性的現象,如遺失值或是格式不對的記錄,但壞資料其實不只如此。資料專家Q. Ethan McCallum邀請了資料領域中,具有不同身分,包含公司執行長、政府官員、科學家、大學教授、程式設計師的19位專家,分享他們處理壞資料問題的方法與心得。

  從有問題的儲存、貧乏的表述到錯誤的政策,造成壞資料有許多的可能。總結來說,壞資料就是會阻礙你的資料。本書提供一些有效的解決方法。

  本書涵蓋許多主題,包括:

  .測試你的資料,來看它是否準備好被用作分析

  .將電子試算表轉換為可被使用的表格

  .處理在文字資料中隱藏的編碼問題

  .開發一個成功的網頁抓取機制

  .使用NLP工具來揭露線上評論的真實情緒

  .提出可能會影響你的分析的雲端運算議題

  .防止會阻礙資料分析的政策

  .使用系統性的方法來分析資料品質


作者簡介:

Q. Ethan McCallum

  Q. Ethan McCallum是一位顧問、作家以及科技狂熱者。他的文章出現在The O’Reilly Network以及Java.net的網站上,著有《C/C++
Users Journal》、《Doctor Dobb’s Journal》等書。他主要的工作,是幫助公司作出對資料以及技術的明智決策。