querylist采集微信公众号文章( 一种微信公众号是否有敏感词汇的检测方法及装置)
优采云 发布时间: 2022-02-10 22:22querylist采集微信公众号文章(
一种微信公众号是否有敏感词汇的检测方法及装置)
本发明属于微信公众号广告投放领域,具体涉及一种微信公众号是否存在敏感词的检测方法及装置。
背景技术:
微信公众平台主要面向名人、政府、媒体、企业等机构发起的合作推广业务。在这里,品牌可以通过渠道推广到线上平台。微信公众号广告是一种常见的广告推广方式。
但微信公众号是否带有政治色彩是企业在投放广告时需要考虑的,以免出现不必要的问题,影响企业的投资回报。投资回报是指应该通过投资获得回报的价值,即企业从一项投资活动中获得的经济回报,需要能够判断微信公众号是否有敏感词的技术。
技术实施要素:
本发明提供一种检测微信公众号是否有敏感词的方法及装置,旨在解决无法判断微信公众号是否有敏感词的问题。
本发明是这样实现的,一种检测微信公众号是否有敏感词的方法,包括以下步骤:
s1、提取微信公众号历史文章数据,手动标注文章是否有敏感词;
s2、清洗文章数据,训练word2vec模型作为训练数据,分割文章词得到embedding,最后训练双向bilstm深度学习模型;
s3、获取微信公众号预设数量的待预测历史文章数据,清洗数据,获取embedding,使用训练好的双向bilstm深度学习模型进行预测,每< @文章是否有敏感词汇的预测结果;
<p>s4、根据预设个数文章中有敏感词的文章个数,计算出有敏感词的文章个数占所有