网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
08月17日漏签0天
python吧 关注:476,462贴子:1,972,418
  • 看贴

  • 图片

  • 吧主推荐

  • 视频

  • 游戏

  • 16回复贴,共1页
<<返回python吧
>0< 加载中...

selenium爬虫求教,被知网检测出来两次了

  • 只看楼主
  • 收藏

  • 回复
  • 李显农
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
笨人为了帮老师收集知网上近20年,211院校各个领域的发文数量,借助GPT初步运用selenium。能跑起来两个小时,但是当初6月28被封了一次,现在用的虚拟UA,防止爬虫检测,还是被封了,请问大佬有没有什么方法,或者有没有推荐的教程


  • 李显农
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼






2025-08-17 11:18:29
广告
不感兴趣
开通SVIP免广告
  • 贴吧用户_QG7tKUb
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
emmm,爬虫被封无非就是模拟的不像真人,看起来你这是自动化控制浏览器进行爬虫(这个方案的好处就是省去了很多编辑报文的麻烦)?但看起来没控制请求速率,导致请求过快?ua的话,听你的描述,看起来应该影响不大。


  • GY!BE
  • 举人
    5
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
速率控制,随机移动都没有


  • 匿名网友
  • 进士
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
配ip池要么动态住宅


  • 灰烬之上
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
控制爬虫速度,还有每个页面模拟鼠标滚轮滑动两下


  • AAA大汽重卡岳师傅
  • 贡士
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
配一个ip池,然后再控制一下速率,如果还是不行就js逆向


  • 春日影启动
  • 举人
    5
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
知网应该是公开的数据吧


2025-08-17 11:12:29
广告
不感兴趣
开通SVIP免广告
  • 商纣王帝辛本人
  • 进士
    8
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
request试过吗


  • scsoce
  • 贡士
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
有没有能爬Twitter的,带价私聊我


  • sunruisunrui
  • 贡士
    7
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
建议结合 tampermonkey 来。tampermonkey 负责解析页面,找到需要进一步处理的链接。然后你可以选择让 tampermonkey 帮你打开这些链接。这样,节奏就和真人访问一样,应该不会被封。但是如果知网的策略很激进,只要单位时间访问次数超过多少就封,甚至不在乎误伤正常用户,那么就没有办法了,如果这样就多搞几个账号和 IP 吧。


  • 贴吧用户_G7CWVUN
  • 白丁
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
需要动态IP可以找w


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 16回复贴,共1页
<<返回python吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示