试论基于马尔可夫混合模型的电子商务搜索引擎用户行为
优采云 发布时间: 2021-05-27 06:20
试论基于马尔可夫混合模型的电子商务搜索引擎用户行为
基于Markov混合模型的电子商务搜索引擎的用户行为聚类doc基于Markov混合模型的电子商务搜索引擎用户行为聚类基于Markov混合模型的电子商务搜索引擎用户行为聚类指南esearchengineofE- Merceo假设每个用户的行为都被随机地分配给特定集群,贝叶斯-贝叶斯-英-杨式谐波搜索引擎的用户行为模式聚类模型假设每种类型的用户行为都可以表示为马尔可夫模型。当用户使用搜索引擎时,每个用户都以一定的概率属于某个集群。用户的行为顺序由相应的马尔可夫模型确定。同时,为了解决参数估计和自动模型选择的原因,将贝叶斯阴阳和谐学习理论应用于混合模型。提出了该模型的和谐度函数和自适应梯度算法。仿真实验结果表明,这是最传统的算法。与基于贝叶斯阴阳机的自适应梯度算法相比,期望EM算法能够更有效,更准确地进行参数学习和模型选择。最后,将提出的聚类策略应用于实际的电子商务搜索引擎点击日志,以进行初步验证。此模型的有效性关键词马尔可夫模型所需的最大贝叶斯聚类算法模型杨机和谐功能AClusteringthepatternsofuserbehaviorsofEmercesearchenginebasedonthemixtureofMarkovmodelsClusteringuserbehaviorpatternsofEmercesearchenginebasedonmixtureofMarkovmodelsQINJun1XIAORong21SchoolofputerScienceSouthCentralUniversityofNationalitiesarkovmodelsisproposedtosolvethisproblemonthesearchengineofE-merceodelassumesthatthebehaviorsofeverycustomerodelandeveryuserisassignedtoaparticularc lusterrandomlyBasedonBayesianYing-Yangharmonylearningtheoryacorrespondingharmonyfunctionandanadaptivegradientalgorithmaredesignedtodealeter-learningandmodel-selectiontasksTheexperimentalresultshocanachievethemodel-selectionandthepara-learningmoreautomaticallyanddonefficientlyAtlastthiscaptureapply
简介分析搜索引擎日志中的用户行为模式可以帮助我们深入了解用户如何与系统交互,并且可以应用于许多领域,例如改善用户界面设计1提高搜索结果的相关性2-3个性化搜索结果4 5优化系统性能6等。许多学者对通用搜索引擎日志的分析进行了大量研究。 7-8随着电子商务的发展,越来越多的用户使用搜索引擎查找所需的产品。与普通搜索引擎的比较电子商务搜索引擎的用户有许多不同的行为。用户不仅可以点击搜索结果,还可以购买感兴趣的商品。表1给出了一些来自用户操作序列的示例。根据点击序列数据,用户行为模式的聚类是深入分析用户行为的基础。基于距离的聚类策略对静态矢量特征数据聚类具有良好的效果。但是,由于本文研究的用户点击行为数据显然是动态的,因此用户不断地从一个动作跳到下一个动作。考虑使用向量表示序列的每个组件代表相应动作的出现次数,并且可能会使用基于距离的策略(例如Kmeans),这可能会失去用户的行为。 3关于基于马尔可夫混合模型的电子商务搜索引擎用户行为聚类指南的动态性质,影响聚类效果的是,一些学者使用马尔可夫混合模型或隐马尔可夫混合模型9对用户的X页面浏览行为进行建模。受此启发,本文打算使用马尔可夫混合模型来评估使用电子商务搜索引擎的用户的行为。进行建模并使用基于模型的聚类策略来反映用户操作的动态。对于基于模型的聚类策略,通常使用ExpectationMaximizationEM算法来估计参数,但是该策略的前提是必须知道组件模型的数量K。并针对本文基于ationCriterionAIC贝叶斯信息准则BayesianInformatio的电子商务搜索引擎用户行为聚类论文数据的马尔可夫混合模型
nCriterionBIC和最小描述长度MinimumDescriptionLengthMDL等,但是对于不同的K值需要重复整个参数估计过程,这会消耗大量的计算时间。它可以用来解释许多现有的学习策略,并为基于有限样本集的混合模型的学习原因提供了一种新的机制。它可以用于在模型选择时实现参数估计。核心是最大化和声功能HarmonyFunctionJinodeclickbuy其他文本采用一个集来表示Ss0s14,然后将URL映射到这些动作2如何区分不同的串行IP地址不足以区分不同的用户,并且用户可能会更多地使用搜索引擎而不是每天一次。每个URL请求的cookieid记录在日志文件中。因此,本文假定cookieid和IP地址可以唯一地标识用户操作序列,并且根据URL映射生成的操作按时间顺序保留。如果同一用户的两个动作之间的时间间隔超过30m,则认为这是两个不同的序列,并获得一个近似值。由1800万个序列组成的数据集表示为OOnn1N。每个序列On由集合S中的状态组成,例如On01212134。结论为了分析电子商务X站搜索引擎的用户行为模式,本文提出使用一阶Markov混合模型。为用户的动作序列建模并使用基于模型的策略来聚类用户行为。与基于距离的聚类算法相比,该聚类策略可以更好地反映用户行为的动态特征,同时可以用于基于模型的聚类。策略组件模型K的数量是重要的前提。选择K的原因通常是选择多个不同的K值来训练不同的模型。根据诸如AIC或BIC之类的标准选择K值具有高的计算成本。本文将贝叶斯阴阳和谐学习理论应用于马尔可夫混合模型。提出该模型的和声函数和自适应梯度算法可以更好地解决参数学习问题。同时,模型会自动选择原因。实验结果表明,与EM算法相比,它是基于Bayi的。 Yesin-Yin-Yang机器的自适应梯度算法可以更有效地执行参数学习和模型选择。最后,将马尔可夫混合模型和自适应梯度算法应用于电子商务搜索引擎用户行为模式聚类,验证了本文提出的策略的可行性。研究计划的下一步包括首先采用高阶马尔可夫模型作为组件模型,这使得有可能在序列中对更大范围的依赖性进行建模。其次,它可以对序列的持续时间建模。诸如指数衰减模型之类的多个持续时间模型用作混合模型的组成部分。这些改进将使我们能够更准确地分析用户行为模式。此外,我们还将基于此聚类结果进一步分析用户行为,例如不同类型的用户操作序列。列长分析,搜索结果,相关性分析,用户的高级搜索行为等。基于Markov混合模型指南geDiscoveryandDataMiningNeixturesofhiddenMarkovmodelsCPress200231-4310XULBayesianYingYangYachingclusteringandnumberofclustersJPatternRecognitionLADEAH_NEP-ENC-CNI-167-A