视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
python如何实现敏感词替换
2020-11-02 18:01:40 责编:小采
文档


python实现敏感词替换的方法:首先倒入敏感词文本;然后当用户输入敏感词匹配成功,则用【*】代替,代码为【new_string = string.replace(words,"*"*len(words))】。

python实现敏感词替换的方法:

思路

这道题练习的是字符串的替换,不过如果不小心的话很容易把过程想简单。在过程中会涉及到递归方法的使用,在Windows下用python2还涉及到编码的转换,要考虑到的是过滤完一遍字符串后可能并没有过滤完的情况,例如在过滤一遍并将敏感字符串替换之后剩余字符串中新组成了敏感词语的情况。这种情况就要用递归来解决,直到过滤替换完一遍之后的结果和过滤之前一样没有发生改变才能视为替换完成,否则在逻辑上是有疏漏的。

编写脚本

代码如下:

# -*- coding: utf-8 -*-
import os
curr_dir = os.path.dirname(os.path.abspath(__file__))
filtered_words_txt_path = os.path.join(curr_dir,'filtered_words.txt')
import chardet
def filter_replace(string):
 string = string.decode("gbk")
 filtered_words = []
 with open(filtered_words_txt_path) as filtered_words_txt:
 lines = filtered_words_txt.readlines()
 for line in lines:
 filtered_words.append(line.strip().decode("gbk"))
 print replace(filtered_words, string)
def replace(filtered_words,string):
 new_string = string
 for words in filtered_words:
 if words in string:
 new_string = string.replace(words,"*"*len(words))
 if new_string == string:
 return new_string
 else:
 return replace(filtered_words,new_string)
if __name__ == '__main__':
 filter_replace(raw_input("Type:"))

运行测试结果:

相关免费学习推荐:python教程(视频)

下载本文
显示全文
专题