亚马逊搜索引擎科学家论文2021年10月刊 用数学方法科学验证季节性、标题在产品

优采云 发布时间: 2022-07-06 17:56

  亚马逊搜索引擎科学家论文2021年10月刊 用数学方法科学验证季节性、标题在产品

  东半球最好的亚马逊免费关键词工具:

  摘要季节性是电子商务搜索相关性的一个重要维度。例如,查询封套在冬季与夏季具有不同的相关文档集。为了获得最佳的用户体验,电子商务搜索引擎应该在产品搜索中加入季节性因素。在本文中,我们正式引入了季节相关性的概念,对其进行了定义,并使用来自大型电子商务商店的数据进行了量化。在我们的分析中,我们发现39%的查询与搜索时间高度相关,并将受益于处理排名中的季节性。我们提出了LOGSR和VELSR特征,使用基于自我注意的最先进的神经模型来捕捉产品的季节性。在大型数据集上进行的全面的离线和在线实验显示了我们的方法对季节相关性建模的有效性。对784个MM查询的在线A/B测试显示,具有季节性相关性特征的处理导致2.20%的更高购买量和更好的总体客户体验。CCS概念关键词季节性;电子商务搜索;学习排名;自然语言处理;自我注意机制ACM参考格式:杨浩德、帕特·古普塔、罗伯托·费尔南德斯·加兰、布丹和贾冬梅。2021.电子商务搜索中的季节相关性。第30届ACM信息与知识管理国际会议(CIKM 21)会议记录,2021年11月1日至5日,虚拟活动,澳大利亚。ACM美国纽约州纽约市第9页。1 介绍电子商务中的产品发现主要归结为搜索和推荐。

  电子商务搜索中的产品相关性进一步取决于各种维度,如查询、用户、时间和CON-文本.虽然用户、查询和上下文维度在信息检索研究中得到了很好的体现,并在电子商务搜索引擎中得到了体现,但时间方面却没有得到很好的解决,尤其是从相关性的角度来看。作为比较,时间在时间信息检索领域的网络搜索中得到了很好的研究。一些研究致力于分析查询的时间维度,例如它们对时间的敏感性。另一项研究将时间信息与网络搜索排名相结合。季节性在电子商务搜索中起着重要作用。查询封套在冬季与夏季具有不同的相关文档集。然而,由于有限的上下文和像Jacket这样的开放式查询,搜索引擎有责任显示更多与季节相关的文档,或者至少不会过度索引到前一季记录的用户行为。因此,对于搜索引擎来说,了解季节并将这些信息纳入排名是很重要的。在电子商务中,除了搜索之*敏*感*词*绕搜索的实验,这些实验衡量了特征的有效性。

  全面的离线和在线实验通过改进指标揭示了电子商务搜索中处理季节性的重要性,包括增加0.62%的点击、增加1.22%的添加到购物车和增加2.20%的购买。我们分别使用查询量和产品销售额来量化查询和产品的季节性,并在此基础上定义季节相关性。根据提议的定义,39%的查询与搜索时间高度季节性相关,一年中42%的总购买是在这些查询之后进行的。从产品的角度来看,它们平均与一年中35%的时间高度季节性相关。在此期间,它们推动了高达48%的年度总销售额。我们采用预测方法对季节相关性建模,以便应用程序不受冷启动问题的限制,并减少数据中的噪声。在我们的方法中,我们将其构建为分别从查询文本和产品标题中学习季节相关性的语言建模任务。在所有类型的产品信息中,我们选择产品标题进行建模,因为它应用研究论文跟踪具有100%的覆盖率,并包含关键的产品属性,有助于描述产品的季节性属性,如袖长,颜色,面料等。通过使用捕获文本语义的预先训练的文本嵌入和使用自注意机制的神经网络架构来执行学习任务,以确定产品标题中对预测季节相关性至关重要的词语。我们的神经网络模型实现了比基线高4.5%的性能,并且不仅学会了检测在四季中经常购买的产品,还学会了检测那些用于特殊场合(如圣诞节和返校期间)的产品。

  我们基于神经网络模型的预测得出排序特征,并用这些特征训练LTR排序器,以使搜索排序季节感知。我们评估了所提出的方法的性能,包括离线和在线。在第一种情况下,我们测量了当季节相关性被纳入时,排名指标(如NDCG)如何变化。在第二个测试中,我们对784 mm搜索进行了A/B测试,包括更改和不更改。实验结果表明,所提出的方法显著提高了购买率,这强调通过季节相关性改善客户体验。2 季节性和相关性电子商务中的产品可能是季节性的(如雨衣)或常青树(如牛仔裤)。我们对一家大型电子商务商店的时尚品类进行了研究。时尚类别的销售遵循季节性和假日模式,反映了全年客户对产品类型和时尚风格的偏好变化。例如,两种不同风格的服装具有戏剧性-

  图1:印花T恤连衣裙和长袖紧身连衣裙的月销售额。如图所示,他们每月的销售情况各不相同。1. 电子商务搜索引擎应该在建模相关性时纳入这样的用户偏好。为此,我们定义了查询和产品的季节性相关性,并描述了从数据中估计它的细节。在部分中3,我们提出了一种从查询文本和产品标题中学习季节相关性的预测方法。2.1季节相关性的定义我们从产品的销售中推导出产品的季节相关性,直觉上,当产品进入季节时,需求和销售都会上升,这反映了客户对季节相关性的感知。我们以月为时间单位。假设是购买事件,是购买的产品,是购买的月份。对于任意一对乘积和月份,其中∈{1,..,12},我们将季节相关性定义为

  并且PA=1,..,12本质上是概率分布。给定一种产品,可以通过其年销售额集中在月的比例来估计。我们没有使用原始的月销售额,而是用当月的总销售额对数字进行标准化,以便将产品销售趋势与仅仅由总销售额变化引起的趋势区分开来。形式上,我们使用

  作为估算器,其中是当月产品的销售额,是当月的总销售额。矢量QA=1,..,12被称为产品月销售集中度(MSC)。对于查询,我们遵循相同的公式。季节性的一个查询和一个月之间的相关性被定义为在给定的月份中看到该查询的概率,条件是它的出现,并且可以用查询量来估计。然后,QA变为查询月体积浓度(MVC)。3 靠近在本节中,我们提出了一种预测方法来建立季节相关性模型。我们的方法适用于产品和查询。为了避免重复,我们详细讨论了产品的季节性相关性,并且可以相应地推导出相同的查询。3.1 季节相关性建模如第节所述2, 产品在一个月内的季节相关性可以定义为。从数据估计到有两个潜在问题:(I)它仅适用于有历史销售记录的产品;(II)由于诸如可发现性和用户行为的各种原因,在计算中使用的特定月份中的产品销售可能是有噪声的。例如,如表1, 同一件羽绒服,两个尺码的MSCs有明显差异。虽然两者都在10月至2月最受欢迎,但一个偏向于年底,另一个偏向于年初。为了解决前面提到的冷启动问题并减少噪声,我们采用了一种预测方法来学习从产品标题和。电子商务商店中的产品标题通常包含每个产品的关键属性,例如袖长、颜色、面料等。这些属性有助于描述产品的季节性属性,因此应该有助于预测。假设我们观察到一组乘积A,以及Q=QA:A和产品标题X=:A。这些产品的季节性相关性未知,表示为P=PA:A。假设有一个函数:XP,它由产品标题参数化并将其映射到季节相关向量PA。我们

  通过最小化来学习

  其中是以下交叉熵损失,因为Qa和;可以看作是两个概率分布。

  我们的学习任务需要将文本转换为数值,并且我们遵循最先进的实践来使用单词的密集向量表示。具体来说,我们使用快速文本嵌入因为(I)它们可以很好地处理词汇表外和低频词汇,并为电子商务中的产品名称等嘈杂文本提供良好的结果;(II)它们重量轻并且提高了系统的效率。我们使用神经网络对函数进行建模,因为它们在为下游任务对文本进行语义建模方面有着良好的记录。模型的体系结构如图所示2.

  

  图2:产品月销售集中度(MSC)模型的神经结构。输入是经过标记化并以FastText嵌入形式表示的产品标题。随后的前馈层和自注意层被用于提取产品标题中的词的关系,然后将它们简化为用于最终预测层的单个嵌入。我们还将该架构与其他三种选择进行了比较:直接摄取句子级嵌入的前馈网络、递归神经网络GRU和伯特。为了进行公平的比较,我们运行了超参数

  图3:一款名为“手工复古复活节兔子女士耳环”的产品MSC模型的自我注意力重量。较大的权重用较深的颜色表示。调整并使用每个的最佳结果。在测试数据集上,前馈网络的交叉熵损失比我们的模型低0.80%,这可能是由于缺乏研究产品标题中标记之间关系的机制。另一方面,GRU可以对顺序关系进行建模。然而,它也表现不佳,只有0.55%,这可能是因为电子商务商店中的产品标题不如常规语言文本那么结构化。伯特是三家公司中表现最好的,但与我们的模型仍有0.39%的差距。虽然它在微调时可以得到最好的利用,但这种方法对我们的任务来说过于沉重,有时会导致收敛困难。当我们采取冻结其参数的替代方案时,Bert失去了生成适应任务的上下文感知嵌入的优势。伯特和我们的模型共有的一个特性是,两者都使用自我注意机制,我们发现这种机制在捕捉与复活节和*敏*感*词*节等节日相关的信息时特别有用。在图中3, 我们展示了我们的模型为一款名为“女士手工复古复活节兔子耳环”的产品所产生的自我注意力重量。更深的颜色意味着更高的注意力权重,因此对后续层(包括最终预测)的影响更大。正如人们所预料的那样,复活节被赋予了很大的权重,并被视为预测季节相关性的关键标志。我们的最终模型具有4.4K可训练参数,具有2个自注意层,每个自注意层具有4个头。该模型使用Adam优化器进行训练,学习率为0.001,退出率为0.1。为了构建用于训练和测试的数据集,我们采用了一个日历年的年度销售数据,并对产品和月份进行分组,以构建每个产品的MSC Vector QA。采样为然后执行,给所有产品一个相等的概率。表2:产品MSC模型在4个数据集上的性能。括号中的数字是相对于基线的增益。交叉熵损失中负增益和余弦相似性中的正增益意味着更好的性能。

  图4:产品MSC模型的预测。我们评估了神经模型对实际MSC矢量QA预测的有效性。根据交叉熵损失和余弦相似性来衡量性能。桌子2 总结了4个数据集的结果。鉴于我们对学习任务的新定义,据我们所知,我们没有找到以前的工作来比较我们的模型。因此,我们使用均匀分布作为我们的基线,相对于此,我们在括号中报告我们模型的增益。该模型是在2019年的数据上训练的。在2020年的测试数据集上,我们看到模型性能略有下降,但仍大大优于基线。这种下降可能是由于客户行为和偏好的变化。定性地说,我们的神经模型已经学会了将季节性产品与那些销售分布平稳的产品区分开来,例如图中顶部图表中的T恤、连衣裙和牛仔裤4. 此外,它还确定了在圣诞节和返校期间等特殊季节流行的产品,无论是否在产品名称中明确提及预期的场合,例如圣诞袜以及图中底部图形中的书包4.4 实验和结果在本节中,我们首先介绍我们对查询季节性和产品季节性的观察。我们给出了关于背后的客户行为。我们的分析是基于我们的预测方法建模的季节相关性,而不是直接通过数据估计,因为后者噪声太大,无法得出可靠的结论,正如前面所讨论的。然后,我们讨论了通过将我们建模的产品季节相关性纳入搜索排名对电子商务搜索的影响。

  我们通过离线评估和在线A/B测试来衡量影响。包括定性分析,以证明客户体验的变化。4.1 查询季节性与产品MSC相比,根据数据计算的查询MVC噪声较小,因为(I)查询文本通常比产品标题短;(II)客户购买多种产品,但发出较小的查询集。在表中3, 我们展示了从数据计算的2对查询的MVC。正如人们所预料的那样,毛衣与晚秋和整个冬季的季节性相关,而圣诞毛衣与11月和12月的季节性相关性特别大。在另一组中,虽然夏季连衣裙与春季和夏季的季节性关系最密切,但连衣裙在所有12个月中的分布较为均匀。为了理解查询季节相关性与查询量和购买量之间的关系,我们将所有查询月份对划分为低、基本和高。这三个部分分别对应于0.00-0.075、0.075-0.09和0.09-1.00的季节相关性。我们将0.075-0.09视为基线,因为平均分布的月浓度与任何给定月份的季节相关性为0.083。然后,查询-月份对在三个段上的分布告诉我们查询在一年中几乎、中等或高度季节性相关的时间的平均百分比。从表中可以注意到4 平均而言,每个查询在一年中大约有31%的时间是高度季节性相关的,在此期间,它们推动了接近39%的年度总查询量和高达42%的购买量。

  当查询移动到与季节不太相关的月份时,这种能力就会下降。这一趋势与我们对季节相关性的定义一致。我们通过计算每次搜索的平均购买次数,进一步衡量每个细分市场在购买转换中的效率。Segment High的表现比Base高出23%。令人惊讶的是,BASE的表现也比Low高出14%。一种可能的解释是,在发出季节性相关性高或低的查询时,客户更有可能有明确的购买意向。例如,顾客通常想在夏天购买夏装,但他们可能在冬天也需要夏装,以便在海滩度假。在这两种情况下,他们都对所搜索的产品类型有强烈的需求。另一方面,需求不那么紧迫,并且在发出具有季节相关性的基线水平的查询时,他们可能倾向于浏览更多内容。4.2 产品季节性与查询季节性分析类似,我们对产品-月份对进行细分,以研究季节相关性与产品销售之间的关系。如表所示5, 平均而言,产品在一年中有35%的时间与季节高度相关,但却推动了约48%的总购买量。值得注意的是,淡季产品(细分市场低)仍然贡献了相当大的购买份额(24.5%),

  图5:按产品细分推动销售的效率季节性相关性。Y轴已重新缩放以忽略绝对数字如果我们回顾一下表4, 当查询与季节相关性最低时,查询也会占用大量的查询量(24.2%)。这个故事可能是人们不时需要过季的东西。虽然在实体商店里很难找到这样的商品,但在电子商务商店里可以买到。接下来是数字5, 第一张图展示了产品季节相关性与驱动购买能力之间的正相关关系。有趣的是,每个订单的单位数量并不遵循相同的趋势,过季产品推动了每个订单不成比例的大量单位数量。我们认为,卖家在淡季有产品折扣,人们倾向于在一个订单中购买更多单位。

  图6:按销售速度水平划分的产品的平均季节相关性,95%置信区间由蓝色带标记。X轴上的销售速度数字已重新调整,以忽略绝对数字。4.3 将产品季节性相关性纳入搜索排名考虑到查询和产品销售中的季节性模式,以及其背后隐含的客户偏好,我们建议将产品季节性相关性纳入排名将改善搜索结果,并帮助客户找到更多相关产品。同时,人们会期望在查询的季节性相关性和产品的季节性相关性之间存在自然的相互作用,因此排序模型应该考虑两者。虽然我们的季节相关性建模框架可以应用于查询和产品,但我们决定采取分阶段的方法来理解增量增益,并将查询季节相关性的采用作为未来的工作。4.3.1 季节相关性与行为特征。许多LearningTo-Rank(LTR)模型依赖于跟踪用户与项目交互的行为特征,例如点击和购买。这些特征捕捉到了需求的上升和下降,人们会认为这与季节性有关。这些特征之一是销售速度,定义为使用指数衰减聚合的产品的历史销售。我们比较了700K产品的季节相关性及其销售速度,在一年的时间窗口内,以了解前者是否会为搜索排名增加任何不同于后者的价值。它们之间的关系用图中的非单调曲线来描述6.如曲线所示,销售速度最快的产品不一定与季节最相关,反之亦然。

  非单调关系的根源在于销售速度的定义与季节相关性的定义之间的差异。虽然前者是一种绝对衡量标准,但后者具有对比和比较性质,这是量化季节模式所必需的。分析为我们提供了有证据表明,季节相关性可以为搜索排名提供新的信息维度,我们将在随后的章节中讨论如何将两者结合起来。4.3.2 作为排名特征的季节相关性。为了将季节相关性纳入搜索排名,我们基于产品MSC模型预测构建了新的排名特征,类似于。虽然我们还考虑了其他方法,但它们对我们的用例都有限制:(I)使用季节相关性作为过滤器。它很好地应用于推荐系统,然而,在电子商务商店购物的用户确实会搜索过季产品,因此硬过滤会产生较差的搜索结果。(II)将季节相关性视为先验,并在原始相关性分数之上添加季节相关性提升,或者在训练排序模型时在损失函数中增加季节性相关产品的权重。如果不仔细调整,这两种方法中的任何一种都可能损害搜索结果的整体质量。在我们的方法中,我们更专注于功能工程,并构建了两个不同的排名功能:(1) LogSR-季节相关性的比例对数转换(2) VELSR-将季节相关性与销售速度相结合的复合特征,其动机是考虑产品固有的季节性属性,以及不断变化且有时难以预测的动态随着季节相关性的增加,这两个特征都单调增长。

  4.3.3 具有季节相关性的排名。我们训练了三个Lambdamart使用相同的损失函数和优化程序,对从一年时间窗口采样的6 mm查询进行LTR排序。其中,基线排序器没有使用第节中提出的任何特征4.3.2, 而另外两个分别使用LOGSR功能和VELSR功能。为简单起见,我们将后两者分别称为LOGSR排序器和VELSR排序器,并将SR排序器统称为。一个令人困惑的因素是,VELSR功能将季节相关性与销售速度相结合。为了将其作为复合功能的贡献从销售速度的贡献中分离出来,我们确保后者在所有排名中作为独立功能使用。在VELSR模型中,基于信息增益,VELSR特征排在前10位,而LogSR特征在LogSR模型中排在第15位之后,因为它对绝对销售不可知,因此与购买的相关性较弱。数字7 显示相关性分数如何随两个SR功能而变化。请注意,相关性分数是由Ranker输出的值,具有高相关性分数的产品将被推到搜索结果的顶部。图中的两个图形7 显示总体上升趋势,但X轴上0处的刻度除外,该刻度表示缺失值。在VELSR模型中,趋势是单调增加的,并且相当平滑,而在logSR模型中,趋势更加曲折,这可以用logSR特征的低特征重要性来解释。另一个观察结果是曲线中的增长率下降。当产品的季节相关性低于0.057(对应于logSR中的800)时,排名人员会积极地将其降级,并生成远低于平均值的相关性分数(由蓝线标记)。一旦季节相关性达到0.10(对应于logSR中的1400),SR特征的贡献就饱和了,并且排序器允许其他特征考虑更多因素。

  4.3.4 线下评估。我们运行离线评估,将两个SR排序器与基线排序器进行比较,测试数据集为从一年时间窗口采样的2 mm查询。根据NDCG@10对(I)整个数据集(II)具有至少一个每日事件(头部)和其余部分(尾部)的查询,以及(III)基于其季节性相关性的查询片段进行性能测量。我们在表中报告了相对于基线排名的百分比差异6. LogSR在整个数据集上的性能与基线相当,但在尾部查询中具有优势。另一方面,在头查询和尾查询中,VELSR的NDCG@10比基线低。然而,在尾部查询上的差距较小。两个SR排序器在尾部查询上比在头部查询上表现得更好,这可能是由于现有排序特征在尾部查询上的覆盖范围有限。基于它们的季节相关性进一步分割查询集,我们没有看到一个清晰的模式,因为排序器没有被训练以针对任何特定的片段。虽然离线评估是衡量模型性能的一种便捷方法,但应该注意的是,在我们的案例中,离线评估将严重受到反事实偏差的影响。为了进行公正的评估,我们进行了在线A/B测试。4.3.5 在线评估。在线A/B测试进行了4周。我们从三个角度研究了排名的表现:(I)用户行为,(II)搜索结果的质量,(III)季节性相关产品的购买。

  用户行为是客户体验的一面镜子,直接反映了排名的人是否推出了吸引客户的产品。我们跟踪了点击、添加到购物车和购买,以了解对整个客户旅程的影响。请注意,我们只收集搜索属性的用户活动,以防止信号被下游操作冲淡。如表所示7, LogSR增加了具有高度季节性相关性的查询中的购买量,但没有对其他客户参与和购买指标产生统计上的显著变化。而对于VELSR,我们看到用户行为的所有三个指标都全面提升。特别是,VELSR吸引了0.86%的高季节相关性查询的点击,1.69%的添加到购物车和2.07%的中等季节相关性查询的购买。搜索结果的质量。我们利用人的判断来理解排名所呈现的搜索结果的质量。重点是搜索结果与查询的相关性,而不是客户对产品的影响。在查询下显示的产品被人类法官标记为相关或不相关。然后,我们测量了加权的相关产品的平均百分比表6:测试数据离线评估。数据集被分为头部和尾部,表示每天至少发生一次的查询集和其余的查询集。根据查询的季节相关性对查询进行进一步细分。单元格报告LogSR排序器(上图)和VELSR排序器(下图)的NDCG@10中的百分比增益,而基线排序器。统计学显著性用*表示(p值

  

  表7:A/B测试在线结果。单元格报告LogSR排序器(左)和VELSR排序器(右)的点击、添加到购物车和购买的百分比收益,以及基线排序器。对整体查询流量以及基于季节性相关性的查询片段进行了评估。统计学显著性用*表示(p值

  表8:在线A/B测试期间,产品季节相关性的3个细分市场的销售分布。单元格报告与基线有关的更改。

  通过它们在搜索结果中的位置。两个SR排名都在基线上显著提高了搜索相关性,但VELSR带来的改善比LogSR显著12%。购买季节性相关产品。最后,我们分析了SR排名如何影响季节性相关产品的销售。虽然两者分别将购买产品的平均季节相关性提高了0.20%和0.24%,但只有VELSR在统计上将高度季节性相关产品的销售额提高了1.13%。结果表明,与基线相比,LOGSR将销售分布从细分市场的低点偏斜到基数和高点,而VELSR将其从低点和基数偏斜到高点,如表所示8,主要调查结果。实验结果表明,VELSR在整体上优于LOGSR,并且在推动高度季节性相关产品的销售方面表现更好。我们认为背后有两个原因。首先,如前所述,基于特征重要性,VELSR特征在VELSR排序器中的排序高于logSR特征在logSR排序器中的排序。因此,VELSR可以更有效地改变搜索结果,并显示高度季节性相关的产品。其次,VELSR利用了销售速度,这一数量是影响购买决策的许多因素(如评论)的代理。销售速度本身也在一定程度上与季节相关性相关,如图所示6. 我们注意到线下和线上的巨大差异。结果验证了我们的假设,即季节相关性信号提供了一个新的维度,该维度尚未被现有的排名特征所覆盖,也没有在历史客户行为中完全捕捉到。

  通过在线实验证明,所提出的功能有助于展示更多与季节相关的产品,从而提高客户参与度和购买量。4.3.6 定性分析。最后,在图中8, 在在线实验中,我们将5月份呈现的搜索结果的前8个位置包括在内,并说明将季节性相关性纳入搜索排名将如何从质量上改变客户体验。对于查询连衣裙,一件白色针织长袖连衣裙在基线排名中排在第八位。它与5月的季节相关性低至0.03,因此logSR将其推至第32位。Velsr的排名也有所下降,但考虑到其过去的受欢迎程度,排在第12位。另一件蓝色长袖连衣裙被底线排在第二位。它有夏季风格的印花图案,因此与前一个五月相比,它与五月的季节性更相关。然而,与其他服装相比,它的季节性相关性仍然较低,因此两位SR排名都将其推后,但仍保持在前8名的位置。印花露肩连衣裙的情况与此类似,它在基线结果中排名第三。对于查询鞋,两个SR排名都在位置3出现了一双木屐,而在基线结果的前8个位置没有木屐。一般来说,木屐在夏天很受欢迎。平均而言,它们与5月的季节相关性为0.10。两个查询实例证明了使用季节相关性信号来提升当季产品可见性的有效性。5 相关工作我们讨论了与信息检索(IR)和推荐系统中时间方面的研究和应用相关的工作。

  图8:在线A/B测试期间,查询服装和查询鞋子在搜索结果中的前8个位置查询和文档的时间分析。从时间的角度来看,IR中的大量工作致力于配置文件查询和文档,通过了解文档内容如何随时间变化来构建每个文档的时间配置文件。所有这三项工作都利用时间序列分析,并侧重于将感兴趣的项目分为季节性和非季节性等类别。相比之下,感兴趣的项目与时间单位相关联。这两项工作都将时间相关性表述为文档在时间点相关的概率。它们的概率设置与我们的方法相同。通过计算在不同时间点与给定查询匹配的文档数量来估计查询时间相关性。将统计文本挖掘应用于文档,并跨时间聚合以获得文档时间相关性。与我们的方法相比,在单字上执行统计建模,并且不利用自然语言的语义。时间搜索排序。时间信息与搜索排序合并在.两者都8, 12]评估查询和文档之间的时间相似性。然而,使用时间相似性作为排序特征来学习时间感知排序模型,而应用它作为查询-文档主题相似性之上的增强,以确保:(I)文档与查询主题相关;(II)查询与文件的发布日期在时间上相关。将文档级时间信息汇总到查询级,并使用分治思想来训练针对具有各种时间配置文件的查询的独立排序器。关注网络搜索中的新近性。它对查询时效性进行建模,查询时效性定义为查询对搜索结果新鲜度的要求程度。

  它将文档新鲜度作为相关性的一个维度,并根据查询及时性对其进行加权或降级。目标空间搜索。它导出时间排序特征,因为在LTR框架中使用,该框架根据给定地点过去的时间戳签入来衡量地点与搜索时间的相关性。它的方法类似于我们提出的方法,但导出的特征是基于记忆的,而不是预测的。时间推荐系统。近年来,动态推荐系统引起了研究人员的广泛关连。如本文所述,但具有更精细的粒度,如一天中的时间和一周中的日期。类似于我们提出的语言建模任务,利用语义信息对项目的时间和类别之间的关系进行建模,以确定在给定的时间范围内最可能吸引用户的类别。考虑季节变化。特别是,通过研究每种产品的每月订购数量来确定电子商务商店中的季节性产品。它以类似于我们的方式处理季节相关性,但有两个不同之处:(I)它的方法依赖于历史销售,不适用于新产品,而我们的预测方法处理冷启动情景;(II)它以二元方式使用季节相关性,使用硬阈值来寻找产品的淡季,而我们利用季节相关性分数的全部范围,并将其转换为排名特征。6 结论和今后的工作在这项研究中,我们在电子商务搜索的标准学习排名设置中正式引入了季节相关性的概念。我们还通过实证对电子商务搜索流量实际受季节性影响的程度进行了定量分析研究主要电子商务商店的查询,并概述其范围和影响。

  所提出的基于神经模型的特征提供了一种对季节相关性建模的原则性方法,这有助于概括和减少数据特定噪声。全面的离线和在线实验突出了电子商务搜索中处理季节性的价值。对784mm搜索的A/B测试强烈表明,所提出的方法呈现了更高的季节性相关产品,这导致了统计上更高的购买和更好的客户体验。我们提出了未来研究的三个方向,以改进本文提出的工作:(I)丰富产品信息。虽然产品标题有100%的覆盖率,但它们也可能是嘈杂的。用户参考其他类型的产品信息来做出购买决策,例如产品图像。这些可以包括在神经网络模型中,以帮助预测季节相关性。(II)位置感知的季节相关性。客户对季节相关性的感知取决于气候和文化等因素。它们表现为季节性的区域差异。因此,可以将位置信息构建到季节相关性建模中。(III)具有查询季节相关性的排序。如前所述,在查询的季节性相关性和产品的季节性相关性之间可以存在自然的交互。因此,前者可以额外纳入搜索排名,以进一步改善电子商务搜索。

  原版文件请扫描下方客服二维码免费领取!!

  有需要站外推广的加个微信

  海量干货资料,直接加入小密圈免费领取每期干货

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线