会员   密码 您忘记密码了吗?
1,505,731 本书已上架      购物流程 | 常见问题 | 联系我们 | 关于我们 | 用户协议

有店 App


当前分类

浏览历史

当前位置: 首页 > 电脑资讯 > 程式设计/APP开发 > Python網路爬蟲實戰
Python網路爬蟲實戰
上一张
Python網路爬蟲實戰
下一张
prev next

Python網路爬蟲實戰

作者: 胡松濤
出版社: 松崗
出版日期: 2017-08-22
商品库存: 点击查询库存
以上库存为海外库存属流动性。
可选择“空运”或“海运”配送,空运费每件商品是RM14。
配送时间:空运约8~12个工作天,海运约30个工作天。
(以上预计配送时间不包括出版社库存不足需调货及尚未出版的新品)
定价:   NT490.00
市场价格: RM74.54
本店售价: RM66.34
购买数量:
collect Add to cart Add booking
详细介绍 商品属性 商品标记
內容簡介

  本書從Python最基礎的部份講起,延伸到Python目前最流行的應用 ─ 網路爬蟲,講解了目前應用最廣泛的幾種Python爬行框架,並提供了詳細範例做參考,幫助讀者學習Python並開發出符合自己要求的網路爬蟲。

  本書是以學習如何爬取網站內容,著重程式技巧的分享。書中所爬取的網站,因各個網站經常改版,甚至可能不存在了。書中程式碼難免無法立即作調整,請讀者自行參考書中介紹的程式技巧,斟酌調整。

【本書特色】

透過常用的實例,詳細說明網路爬蟲的編寫過程
★內容豐富,案例經典,實用性強。
★涵蓋了Linux & Windows上模組的安裝配置。


作者介紹


目錄

第1章 Python環境配置
Python語言使用範圍很廣,。尤其是對網路的大力支援,使得Python用於網路程式設計具有很大的優勢,這也是為什麼要用Python寫網路爬蟲的原因之一。
 
第2章 Python基礎
本章簡略講解Python的基礎,介紹Python與其他程式設計語言的不同之處。
 
第3章 簡單的Python腳本
本章的幾個Python小程式都比較簡單。學習Python最快的方法就是多寫程式,用程式解決實際問題。Python並不複雜,多寫、多做、多練,很快就能掌握。
 
第4章 Python爬蟲常用模組
Python最強大的方面就展現在它那近乎無限的模組庫上。本章將只講解與網路爬蟲有關的常用模組。
 
第5章 Scrapy爬蟲框架
本章詳細介紹Scrapy爬蟲框架的使用,由易到難示範了Scrapy爬蟲爬取網頁的過程,並透過爬蟲與反爬蟲的攻守過程,讓讀者一窺Scrapy中介軟體的使用方法。
 
第6章 Beautiful Soup爬蟲
上一章節講解了Python的爬蟲框架Scrapy。本章將詳細講解另一個Python爬蟲Beautiful Soup。與Scrapy不同的是Beautiful Soup並不是一個框架,而是一個模組。因此,Beautiful Soup不能再做填空題了,只能從頭到尾的寫作文了。
 
第7章 Mechanize模擬瀏覽器
Mechanize不是爬蟲,它不是得到爬蟲結果的充要條件,但在某些時候比爬蟲更加重要。畢竟爬蟲過濾的來源資料要靠Mechanize來取得。大多數時候的確可以用別的模組來替代Mechanize,這樣一來過程就未免有些複雜了。雖然爬蟲程式追求的只是結果,過程是否繁雜對結果沒有影響,但能用簡單的模組解決問題就沒必要用複雜的方法。
 
第8章 Selenium模擬瀏覽器
Python網路爬蟲中最麻煩的不是那些需要登錄才能取得資料的網站,而是那些透過JavaScript取得資料的網站。Python對JavaScript的支援不太好。想用Python取得網站中JavaScript返回的資料,唯一的方法就是模擬瀏覽器了。所以這裡需要一款可以模擬真實瀏覽器的模組—Selenium模組。