python网络爬虫可以干啥

python网络爬虫可以干啥,第1张

《Python3爬虫入门到精通课程视频附软件与资料34课时--崔庆才》百度网盘资源免费下载

zxcv

《山海经》的白泽神兽来自海滨。

相传，上古圣君黄帝巡行考察自己国家的疆域，行至东海一带，翻越恒山，在海滨遇到了白泽神兽。博学广闻、无所不知、对精灵幻化了如指掌的它口吐人言，向黄帝遍说天下11520种妖怪成因及避御法门。黄帝如获天机，欢喜无匹，急命手下一众随行文职官员依言记录描绘。

日月轮转，耗时数日，庞大的妖异数据库终于整理完毕。从此白泽遁出人们的视野，在接下来的几千年的历史中再未露面。

文学形象

《鬼灯的冷彻》——白泽，居住在桃源乡，可化为人型，职业为药师，嗜酒，好女色。

《隐之王》中相泽虹——与黑岗野诗缟合称白泽。

《哑舍》中，白泽笔中出现的白泽，独角兽。

《封印之书·独角兽》中，被毁掉兽角的白泽神兽，后被封印进《山海经》中。

Python可以爬取数据，这么说吧，只要能通过浏览器获取的数据都能通过Python爬虫获取，比如爬、爬视频、爬文章；Python爬虫能自动循环执行目标程序，实现自动下载、自动存储、音视频和数据库的数据。

Python爬虫

下载mysqlconnector库

然后把爬虫爬到的数据通过mysql里面的insert语句查到数据库，当然也可以建表，一般我没用python建表是先建好再写数据的

import mysqlconnector

conn = mysqlconnectorconnect(

user='root',

password='root',

host='127001',

port='3306',

database='test_demo'

)

cursor = conncursor()

cursorexecute("INSERT INTO test_user(`uuid`,`user_name`,`user_level`) VALUES (%s,%s,%s)",[id, user_name, user_level])

cursorexecute("INSERT INTO tieba_user_detail(`user_name`,`user_exp`,`user_sex`,`tieba_age`,`tieba_note`,`user_favorites`,`user_fans`) VALUES (%s,%s,%s,%s,%s,%s,%s)",[user_name,user_exp,user_sex, tieba_age,tieba_note, user_favorites, user_fans])

print(' %s %s 数据保存成功 '%(user_rank,user_name))

conncommit()

cursorclose()

插进入就这样的

过程很繁琐，步骤如下：

1、写按键精灵脚本，在手机上自动点击公号文章列表页，也就是“查看历史消息”；

2、使用fiddler代理劫持手机端的访问，将网址转发到本地用php写的网页；

3、在php网页上将接收到的网址备份到数据库；

4、用python从数据库取出网址，然后进行正常的爬取。

如果只是想爬取文章内容，似乎并没有访问频率限制，但如果想抓取阅读数、点赞数，超过一定频率后，返回就会变为空值，我设定的时间间隔为10秒，可以正常抓取，这种频率下，一个小时只能抓取360条，已经没什么实际意义了。

微信公众号数据储存

1、腾讯不对你在本服务中相关数据的删除或储存失败负责。

2、腾讯有权根据实际情况自行决定单个用户在本服务中数据的最长储存期限，并在服务器上为其分配数据最大存储空间等。你可根据自己的需要自行备份本服务中的相关数据。

3、如果你停止使用本服务或服务被终止或取消，腾讯可以从服务器上永久地删除你的数据。服务停止、终止或取消后，腾讯没有义务向你返还任何数据。

相关阅读

栏目

最新发布

热门标签