网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
08月17日
漏签
0
天
python吧
关注:
476,462
贴子:
1,972,418
看贴
图片
吧主推荐
视频
游戏
16
回复贴,共
1
页
<<返回python吧
>0< 加载中...
selenium爬虫求教,被知网检测出来两次了
只看楼主
收藏
回复
李显农
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
笨人为了帮老师收集知网上近20年,211院校各个领域的发文数量,借助GPT初步运用selenium。能跑起来两个小时,但是当初6月28被封了一次,现在用的虚拟UA,防止爬虫检测,还是被封了,请问大佬有没有什么方法,或者有没有推荐的教程
李显农
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
2025-08-17 11:18:29
广告
不感兴趣
开通SVIP免广告
贴吧用户_QG7tKUb
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
emmm,爬虫被封无非就是模拟的不像真人,看起来你这是自动化控制浏览器进行爬虫(这个方案的好处就是省去了很多编辑报文的麻烦)?但看起来没控制请求速率,导致请求过快?ua的话,听你的描述,看起来应该影响不大。
GY!BE
举人
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
速率控制,随机移动都没有
匿名网友
进士
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
配ip池要么动态住宅
灰烬之上
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
控制爬虫速度,还有每个页面模拟鼠标滚轮滑动两下
AAA大汽重卡岳师傅
贡士
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
配一个ip池,然后再控制一下速率,如果还是不行就js逆向
春日影启动
举人
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
知网应该是公开的数据吧
2025-08-17 11:12:29
广告
不感兴趣
开通SVIP免广告
商纣王帝辛本人
进士
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
request试过吗
scsoce
贡士
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
有没有能爬Twitter的,带价私聊我
sunruisunrui
贡士
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
建议结合 tampermonkey 来。tampermonkey 负责解析页面,找到需要进一步处理的链接。然后你可以选择让 tampermonkey 帮你打开这些链接。这样,节奏就和真人访问一样,应该不会被封。但是如果知网的策略很激进,只要单位时间访问次数超过多少就封,甚至不在乎误伤正常用户,那么就没有办法了,如果这样就多搞几个账号和 IP 吧。
贴吧用户_G7CWVUN
白丁
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
需要动态IP可以找w
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示