关键词采集文章报价(阿里云·数加的数据应用——公众趋势分析)
优采云 发布时间: 2022-02-10 04:14关键词采集文章报价(阿里云·数加的数据应用——公众趋势分析)
摘要:阿里云Data Plus——流行趋势分析的数据应用已经悄然上线。它在网站上将自己描述为“基于全网公开发布的数据、传播路径和受众群体画像,利用语义分析、情感算法和机器学习,分析公众对品牌形象的认知趋势、热点事件和公共政策。” 不仅如此,舆情分析原本是阿里小爱的“眼睛”,帮助小爱成功预测《我是歌手》总决赛粉丝票数排名。今天,大厨就带你用他闯入娱乐圈。
必备产品:
单价:UI公版69元/年8月2日10:00开售!
阿里云公共趋势分析的应用场景包括政府机构、媒体机构、金融行业、房地产行业、教育行业、医疗行业、旅游行业、企业品牌等。
一、注册与购买
之前以每月1元体验价(UI体验版)向公众开放(现在升级到UI大众版69元/元),大厨在这个价位任性尝试——先开阿里云· Splus官方链接,然后点击页面左侧“立即购买”进行注册、支付、使用。
二、使用过程——以最近吴亦凡事件为例
注册并开通“舆情分析”服务后,可以配置检测主题、关键词及参数,分析采集内容趋势。
(一) 设置监控主题和关键词
首次进入“舆情分析”管理控制台时,需要为分析对象配置监控主题和关键词,可以通过一个或多个关键词监控主题组合来描述。
Data Plus官网上的“快速入门”说:
"系统后台会采集收录这些关键词的文章组合的内容,进行汇总分析。后续的一些统计功能会主要针对监控话题进行操作,所以尽量为每个分析对象创建一个分析对象。一个单独的监控主题。
八卦大厨为这次热闹的吴亦凡事件专门创建了一个话题,设置了一个关键词组合——先点击后台管理的关键词,再点击添加话题,然后配置关键词@ >。
主厨一口气添加了吴亦凡、小Gna、卓伟、加拿大炮王等一系列热词,并选择了包括新闻、论坛、微博、微信在内的所有给定来源。生成的主题如下:
根据官方描述,关键词配置的要点如下:
"配置关键词时主要考虑以下两个因素。(注:全局关键词采集策略只会在系统后台每10分钟更新一次,所以新的< @关键词 提交配置后,大约需要10分钟才能生效。)
○采集范围:采集内容需要哪些类型的网站。源站类型可以包括:新闻、论坛、贴吧、微博、微信、政府网站、视频网站。
○组合技巧:关键词如何组合,是否添加同义词、同义词、释义、或在线术语的变体,可能需要一段时间才能逐渐调整。另外,请不要设置太宽泛的关键词组合,比如“网络”、“安全”等单字,会采集太多不相关的文章,导致你的采集数量配额很快用完。如下图,一次可以批量添加多个关键词组合,每一行代表一个关键词组合。根据您订购的版本,关键词 组合的数量(即行数)有不同的上限。关键词 组合可以由单个或多个单词组成,以空格分隔,表示“与”关系:一行中所有单词的信息必须收录在采集中。"
(二) 查看 采集 内容
现在你可以开始关注舆论的新闻了。点击左侧导航栏中的“新舆情”或“所有舆情”,查看文章关键词采集列表。在列表中,粗体字表示未读文章。单击文章 将在右侧显示文章 的详细信息。
厨师随机点击其中一条文字,如下图,情绪已自动设置为“负面”,可标注标签、情绪(正面、中性、负面)、风险等级、备注等信息自定义,同时,Chef 将此消息设置为有效。
值得注意的是,标注训练是一个机器学习的过程,按照官方的描述:
Mark training”手动勾选文章标题,批量标记为'valid'、'invalid'或'read'。'valid'表示这些文章值得关注,'invalid'表示这些文章是干扰信息,人工标注的过程其实就是在后台训练智能分类模型,一般经过100次左右标注训练后,系统的分类模型会越来越准确。结合'过滤规则' '可实现智能过滤,后续采集对无关内容(如广告、干扰信息、垃圾信息),可自动分类到‘回收站’。”
同时,APP还提供了文章的搜索功能。点击文章上方的搜索按钮,从多个维度过滤文章。
(三) 查看结果分析报告
最后点击左侧导航栏中的“首页”查看相关分析报告,可以查看“今天”、“7天”、“30天”的分析结果。
三、结果展示
Chef 在 6 月 21 日至 6 月 24 日期间测试了此活动的结果。
源站类型和热词云分析如下图所示。结果显示,微博成为此次事件的主要舆论场,符合大家的潜在认知。
不过,对于采集收到的公众意见的数量,主厨有疑问。在微博上搜索“吴亦凡”,发帖数远超“流行趋势分析”在微博四天内采集到的2万多条帖子。这说明应用的数据筛选有自己的一套标准,而这个标准得到的样本量明显偏小,“大数据”的采集能力需要后续观察。
结果表明:
关于此次吴亦凡负面事件的舆情分析,6.21-6.24天的平均值为1,舆论正面情绪略占上风,说明一大批粉丝甚至脑残——死粉继续进行舆论攻势。
6.23日,公众的积极情绪上升比较高,这与吴亦凡名誉侵权案相符。
以6.24th为例,全天对这一事件的看法相对中性,但在凌晨4:00-10:00之间情绪达到高峰,说明双方对峙其他,支持者占上风(对手可能都占上风)。睡着了)。
简而言之,该应用程序对帖子的自动情感判断使厨师深信不疑。尽管存在一些 文章 偏差,但大多数都是准确和定性的。
关键词1@>
(过去 7 天的情绪分析平均值)
关键词2@>
(6.22-6.24情绪趋势图)
关键词5@>
(6.24天情绪走势图)
分析结果显示6.21-6.24th?——TOP10热门事件为:
关键词TOP10 是:
关键词9@>
舆论的数量和趋势是:
从上图可以看出,吴亦凡事件的后续发酵和走势与一些热点事件和炒作有关——吴亦凡名誉侵权案位居最热事件前两名,6.案22日下午,舆论数量达到高峰。由此可见,吴亦凡的公关做法起到了影响实际趋势,引导粉丝逆袭舆论的作用。
四、功能评论
优势:
1.情绪分析非常出色,可以更准确地表达舆论趋势。
2.自动运行检测,界面简洁,使用方便。
缺点:
1.目前应用平台还不成熟,存在一些bug。
a) 删除设置话题后,话题中的关键词不会在舆情界面消失,但数据会继续加载云端,无法删除。
b) 主页上的分析结果不是基于单个主题,而是所有关键词的聚合分析结果,不能设置,非常不合理。比如你有两个不同的主题要测试,“京东618”和“吴亦凡”,首页的情感分析和词云统计很可能是所有检测到的文本的聚合结果。目前,无法针对不同的主题显示差异化的结果。因此,该平台目前更适合检测主题单一的受众。
2.抓取的数据量不全,舆情数很容易达到上限。(大厨才检测到吴亦凡事件4天,控制台有提示如下。)
3.一些更有用的工具还没有向公众提供。如下图所示,开放接口下的传播路径分析等功能尚未开放,因此数据的使用和分析存在局限性。
PS:大厨发现前几天的1元试用版已经悄悄下架,取而代之的是69元/年的公版。据负责人介绍:1元试用版是上个月的活动价。数据量可控,每天只能抓取10000条信息,功能弱;目前69元/年的公众版每天可以抓取30万条信息,大大提升了平台的分析能力。真的商业化了。这确实部分回答了厨师的经验困惑。当然,大厨只体验过初级版,不分男女,人气版值得拥有!