最近在学习python爬虫,写出来的一些爬虫记录在csdn博客里,同时备份一个放在了github上。
github地址:https://github.com/wjsaya/python_spider_learn/
本次内容:从豆瓣的top250音乐界面爬取指定的topX专辑。
思路:
- 拼接出豆瓣topX页面URL。
- 用BS去访问和解析豆瓣topX页面URL,获取页面内的所有歌手名和专辑名并拼接,然后输出。
代码:
|
|
一个菜鸡运维的日常
最近在学习python爬虫,写出来的一些爬虫记录在csdn博客里,同时备份一个放在了github上。
github地址:https://github.com/wjsaya/python_spider_learn/
本次内容:从豆瓣的top250音乐界面爬取指定的topX专辑。
|
|