[TOC]

爬虫小练习

1、爬取方正驱动网信息

爬取网站:http://www.foundertech.com/drivers/list_369.html

2、爬取百度百科

3、域名备案爬取

4、爬取长沙房地产开发商房屋销售情况

越秀亲邻雅苑(越秀亲爱里):http://www.cszjxx.net/floorinfo/202004160830 中冶天润菁园三期(中冶中央公园):http://www.cszjxx.net/floorinfo/202005070287 依云曦府:http://www.cszjxx.net/floorinfo/202006230442

使用pandas的read_html函数一步抓取表格数据,简单方便快捷。 但是遇到瓶颈,展开户室列表是使用js写的,动态加载。详细见crawler_display_none.md文章。

results matching ""

    No results matching ""