采集内容插入词库(传统分析方式在处理MROC在线*敏*感*词*、快、大,如何解决?)
优采云 发布时间: 2022-04-02 05:10采集内容插入词库(传统分析方式在处理MROC在线*敏*感*词*、快、大,如何解决?)
在MROC的线上研讨会中,参会者可以同时发言,不同于传统的研讨会,参会者只能依次发言。同一个问题提出后,传统的symposium可能需要5分钟才能得到大家的反馈,而在线symposium只需要3分钟。
3)信息总量增长了几十倍甚至上百倍
一个传统的*敏*感*词*信息大约有600条左右,主要是受到主持人的启发和引导。真正的参与者只有大约 300 条评论。在MROC的定性研究中,单个symposium的信息量近2000条,参与者的意见占绝大多数,超过1600条,是传统symposium信息量的5倍,这只是*敏*感*词*上的区别,如果是两个,就是600和3200的区别,如果是四个,就是1200和6400的区别……
另一方面,互联网使调查更容易操作,缩短了调查周期,使调查更加频繁。甚至随时随地都极大地激发了企业的需求。一周不到一场的*敏*感*词*很可能变成10组线上*敏*感*词*,再加上30次左右的线上讨论,企业数据库,尤其是原文记录,将以100倍的速度增长。这只是 MROC 中的一项定性研究,尚未扩展到更广泛的 Internet 信息分析。
在处理 MROC 在线研讨会数据时,传统的分析方法无疑存在一些先天的局限性。此外,MROC信息量大,反馈周期短。如果没有更高效、更准确、更客观的数据分析方法,MROC的效率将受到限制。仅仅停留在执行层面,冗长的分析环节将成为MROC的一大短板。
那么,针对大、快、大的MROC信息,以及传统分析方法的局限性,如何使用*敏*感*词*分析的方法来解决这个问题呢?
2. 基于 MROC 定性研究的*敏*感*词*解决方案
首先,我们需要寻求一种客观深入的定性分析理论,然后利用计算机的自动文本分析功能获得全面的结构化信息,利用语义关联网络对信息进行全面、可视化的呈现,不同类型群体的表现。进行深入分析。
基于 MROC 的*敏*感*词*化解决方案基于语义分析方法。通过将软件工具与定性数据分析理论有机结合,可以在较短的时间内得到更深入的分析结果,平衡定性数据分析的时效性和深度。
消费者分类研究中的语义分析方法以逻辑结构为基础,将语义分为三个层次:表层词汇、语义类别和更深层次的逻辑联系。分析过程:获取一个消费者的语言描述,即表面词汇,通过各种研究方法,找出他的关键词语言和词频信息,通过M-QDA软件进行自动预分类。然后,通过分析关键词和结构,建立彼此之间的关系和框架,根据参与者在各种词汇表中的表现对人群进行分类,
通过这种方法,我们可以在传统的定性研究中取得突破:
(1)少即是多:定性研究可以处理海量数据
(2)从主观到客观的转变:定性研究结果更客观准确,研究结果更稳定
(3)由浅入深:分析理论与计算机技术相结合实现更深层次的挖掘,以及逻辑背后深层含义的探索
三、研究成果-案例应用
1. 项目背景
旅游电子商务近年来发展迅速,发展潜力巨大。某在线旅游网站希望提升自身的服务和产品,实现与消费者需求的精准对接,因此委托本次调研,深入了解在线旅游产品订购用户的消费动机和行为。
受访者在线参与度高,适合MROC在线*敏*感*词*的方式。本次调查的定性研究部分也采用了这种方法。
2. 定性信息采集
采用MROC线上*敏*感*词*,2天共举办4组*敏*感*词*,每组20人,参会人员平均分布在北京、上海、广州、武汉4个城市。如下表所示,该数据采集的效率相比常规方法有明显提升,时间少,信息量大,成本低:
3.定性数据分析
在定性数据的处理中,如果采用传统的分析方法,至少需要7天时间,不能在短时间内完成,而且信息损失大,难以保证分析的客观性。分析结果。
因此,本项目采用创新的*敏*感*词*化解决方案进行定性 MROC 分析,仅用了 1 天。过程如下:
1)地表词汇 - 计算机关键词爬行和词频统计
选择“在线旅游产品订购”部分的采访记录(整个*敏*感*词*包括开场和闭幕环节,涉及旅游体验、生活方式等子主题,但不是消费动机的话题,将暂不收录),导入MROC定性数据分析软件(Qualitative Data Analysis,MROC定性数据分析软件,以下简称M-QDA),软件自动过滤掉一些无意义的词,研究人员过滤抽出一些与讨论话题没有直接关系的高频词,比如“what”“How about”“Everyone”“Next”等,M-QDA按照词频排序,最后导出34个消费动机相关的关键词频率表如下:
2)人口细分——计算机词汇分类
上述关键词涵盖了价格、选择性、安全性等,为了还原关键词背后相应的核心焦点和主导动力,需要通过软件进行分类。首先,使用 M-QDA 的同义词词典对 关键词 进行预分类。然后研究人员根据对这些词的上下文的理解来调整预分类的结果。最后四个词组如下:
词组对应的四个核心词概括为:效率、价格、便利、质量。
3)结构细分标准——计算机关联词的交叉统计
根据消费动机对用户进行分类,需要分析每个参与者的语音内容与上述四个词组的相关性。
使用M-QDA的关联词设置功能,将35个关键词转化为4个核心词,例如:任何提及“优惠、促销、折扣、便宜、价格、精选”,就相当于提及核心词“价格” ”。然后,通过相关词的交叉统计得到四个词组在每个参与者的语音内容中的频率分布。发现14名被试的演讲内容在四种词组上均无明显特征,不属于任何类型。效率型15人,价格型26人,质量型10人,评价型15人(由于样本量小,抽样也根据客户的研究目的设计,
关注更多的人在订购在线旅游产品时考虑的因素更多,而关注单点的人考虑的更少。理性的用户一般都会预先设定自己的旅行目标,关注的因素是实际的,而情感的因素。用户专注于自己的感受,或者没有明确的目的,去哪里碰巧有折扣。
快速修复和无意之间的反比关系:
速订型通常会提前确定出行目的地,希望尽量少花时间自己下单,打电话给客服太麻烦。刘星也没有什么计划,只是时不时的在网站闲逛。一旦找到好的特价促销,只要条件允许,他都会抓住机会,不管提前有没有出行计划。
精挑细选与体验导向的互补关系:
会根据自己的行程(省内外、国外和国内)、一起旅行的人(无论是带孩子、和朋友还是和父母),选择合适的旅行产品、品牌、价格、服务来精心挑选综合评价,不同情况下评价的重点也不一样,比较合理;而体验型则比较情绪化,注意整个过程的体验是否舒适愉快,会尽量避免伤害情绪的可能。选择网站的时候,我看重信誉和大品牌,主要是不想后期有什么麻烦的因素。在使用在线旅游网站的时候,我也会更加关注网站的页面设计。
4)各类人群的特征描述——计算机语义关联网络分析
在根据消费动机对订购在线旅游产品的用户进行分类后,需要了解不同人群的背景特征和行为特征。将每组典型参与者的语音记录导入M-QDA,进行语义网络分析。得到的语义相关网络图可以形象地展示词与词之间的关系,一次完整地呈现参与者的背景、行为和价值观。非常直观,大大突破了以往研究只能对单节信息进行逐一分析的局限。
这里,以描述有效种群的特征为例,对这一步得到的结果进行说明。
注:紫色为3名典型效率参会者,均为化名;*敏*感*词*表示注意订购效率;橙色表示日常生活中的工作状态。
四、本研究的意义及存在的问题
1、本研究的意义
本文提出了一种新兴的MROC在线研讨会方法和*敏*感*词*化定性数据分析技术,不仅解决了传统定性数据采集方法效率低下的问题,还实现了对MROC在线研讨会海量信息的高效分析。因此。
从定性数据采集到分析的整个过程高效,大大缩短了从*敏*感*词*执行到分析结果输出的周期。互联网和计算机的应用使研究能够更快地响应企业的信息需求,达到分析的效率和深度。平衡。
采集舞台
(1)高效:不受空间限制,可以同时采访分布在多个城市的参与者
(2)大:参与人数多,发言人数多
(3)多样性:参与者更能畅所欲言,表达真实想法,提供更多信息
分析阶段
(1)可扩展性:分析海量数据的能力大大提升。
(2)可靠性:部分数据分析通过软件实现,更加客观,不受人为因素影响,减少信息丢失。每个分析结果的一致性更高,结果的可靠性更强。
(3)深入:在相对较短的时间内获取价值层面的信息。
2、本研究的局限性
在定性数据 采集 阶段,提议的 MROC 在线研讨会并不适用于所有调查对象。比如*敏*感*词*不熟练使用互联网,所以不适合使用网络论坛,亲子配对论坛也不适合。
在定性数据分析阶段,虽然目前的M-QDA(MROC定性数据分析软件)有无意义词和同义词的词库,但是在统计词频时可以过滤掉一些词,作为预分类的依据。词汇分类,但处理方法仍然不够灵活,无法自动识别一些不相关的词并采集相关词。它仍然需要研究人员进行调整。词库需要积累足够的时间才能变得越来越有针对性。
参考
[1] 艾伦·泰勒-鲍威尔·马库斯·雷纳。分析定性数据、项目开发和评估
[2]到底什么是市场研究在线社区(MROC)?
3] 绿皮书研究行业趋势。
[4]自动文本分析会取代定性市场研究人员吗?
[5]曹培杰,尚俊杰,王继德(2011).基于词频分析的社交软件教育应用特征[J].开放教育研究,(4)
[6] 段宏义. 焦点小组访谈的优缺点[J]. 北京理工大学学报, 2009, (04)
[7] 于国明. 跨界与融合:社会视角下2011年中国传媒产业发展关键词——基于传媒产业相关文本的词频分析[J]. 新闻与写作