怎么用正则表达式清楚垃圾广告【阅读吧】

06月24日漏签0天

阅读吧关注：119,500贴子：247,799

9回复贴，共1页

<返回阅读吧

求助

怎么用正则表达式清楚垃圾广告

只看楼主收藏回复

如图，下面这种怎么用净化替换掉。每章都跳出来。怎么用符号代表正则表达式清除，只会用.*其他的没搞明白。

送TA礼物

IP属地:重庆

来自Android客户端1楼2024-05-20 13:53回复

怎么样，应该会了吧。我想对对答案

IP属地:江苏

来自Android客户端3楼2024-06-08 19:11

收起回复

.*•.* 把•换成广告中的关键字

IP属地:福建

来自iPhone客户端4楼2024-06-10 03:31

收起回复

首先，我们要了解广告的一些特点。假设这些广告总是以“广告：”这几个字开头，后面跟着一些我们不想要的文本或链接。
在正则表达式中，我们可以使用特定的符号来代表这些特点。比如：
①^ 表示一行的开头。
②广告：就是广告开头的文字，我们直接写。
③.* 表示任何字符（.）出现零次或多次（*）。这意味着它会匹配“广告：”后面的所有内容，直到一行的结束。
#现在，我们将这些符号组合起来，形成一个正则表达式：^广告：.*$。这个表达式会匹配所有以“广告：”开头，并以任何字符（包括没有字符，也就是空行）结束的行。
在Python中，我们可以使用re模块来执行这个替换操作，例子如图所示↓
这段代码会找到文本中所有匹配^广告：.*$的行，并将它们替换为空字符串（也就是删除它们）。re.MULTILINE标志确保正则表达式可以跨越多行进行匹配。
这样，你就可以得到一个没有广告的小说文本了！