阅读吧 关注:119,500贴子:247,799
  • 9回复贴,共1
求助

怎么用正则表达式清楚垃圾广告

只看楼主收藏回复

如图,下面这种怎么用净化替换掉。每章都跳出来。怎么用符号代表正则表达式清除,只会用.*其他的没搞明白。



IP属地:重庆来自Android客户端1楼2024-05-20 13:53回复
    怎么样,应该会了吧。我想对对答案


    IP属地:江苏来自Android客户端3楼2024-06-08 19:11
    收起回复
      .*•.* 把•换成广告中的关键字


      IP属地:福建来自iPhone客户端4楼2024-06-10 03:31
      收起回复
        首先,我们要了解广告的一些特点。假设这些广告总是以“广告:”这几个字开头,后面跟着一些我们不想要的文本或链接。
        在正则表达式中,我们可以使用特定的符号来代表这些特点。比如:
        ①^ 表示一行的开头。
        ②广告: 就是广告开头的文字,我们直接写。
        ③.* 表示任何字符(.)出现零次或多次(*)。这意味着它会匹配“广告:”后面的所有内容,直到一行的结束。
        #现在,我们将这些符号组合起来,形成一个正则表达式:^广告:.*$。这个表达式会匹配所有以“广告:”开头,并以任何字符(包括没有字符,也就是空行)结束的行。
        在Python中,我们可以使用re模块来执行这个替换操作,例子如图所示↓
        这段代码会找到文本中所有匹配^广告:.*$的行,并将它们替换为空字符串(也就是删除它们)。re.MULTILINE标志确保正则表达式可以跨越多行进行匹配。
        这样,你就可以得到一个没有广告的小说文本了!


        IP属地:福建来自Android客户端7楼2024-06-17 19:31
        回复
          2


          IP属地:湖南来自Android客户端8楼2024-06-22 21:16
          回复