利用爬虫技术能做到哪些很酷很有趣很有用的事情?

1,941 阅读2分钟

豆瓣读书爬虫

通过豆瓣评分、评价人数探索挖掘经典好书,总共更新了3232088本图书信息。输入关键字、评价分数、评价人数多的数值(评价分数又高、人数又多的往往是经典之作),选定排序方法,点击好书一下就可以查找好书啦!

在抖音上找漂亮小姐姐

用Python + ADB做的Python抖音机器人Douyin-Bot。帮你最高效、直接地找到漂亮小姐姐。

抓取抖音流行的视频和音乐

爬取B站Top100的小视频

爬取的是每日的小视频排行榜前100,从此get公交地铁、排队等车打发时间神器。

爬取和分析Python岗位信息

Python有多火不用说了,这个项目爬取了前程无忧上 Python 关键字的招聘岗位,地区锁定在北上广深,选取 top650 条招聘岗位带 Python 关键字的招聘信息进行数据分析。

来看看作为一个 Python 开发者还需要什么技能,赶紧补齐技能树!

如果你想更好地学习Python,你还可以报名试听《基础算法(Python 3)》,理清学习思路,高效学习,做更酷的爬虫项目~

神探夏洛克

如果你追BBC的《神探夏洛克》,那么这个Python 工具千万不要错过,玩转这个工具,你就可以知道还有谁这么有眼光和你取了一样的用户名。

You-get下载视频和图片

You-get 这个爬虫神器能爬取视频网站和图片网站,不用写任何代码就能把你喜欢的视频、音频、图片给扒下来。支持腾讯、B站、央视网、芒果TV、优酷、斗鱼等国内主流网站。

爬取Stackoverflow 1M条问答

程序员当然要爬一下stackoverflow。爬取stackoverflow前20000页,每页将问题数量设置为50,共1m条数据。可以根据所有问题的标签提取出Top10的关键词,也能看到Python类的问答票数前10的问题:

image

爬取知乎用户人际拓扑关系

解析的用户信息包括昵称、头像链接、个人基本信息、关注人数、粉丝数量。

image