推荐系统工程师如何串联、如何配合、有哪些坑?
优采云 发布时间: 2021-08-19 01:08推荐系统工程师如何串联、如何配合、有哪些坑?
由于近年来深度学习技术的飞速发展,大力加速了人工智能在互联网和传统行业的商业化进程。其中,推荐系统、计算广告等领域尤为突出。由于推荐系统与用户数量的增加和商业化密不可分的关系,各大公司都发布了很多推荐系统相关的职位,而且薪水高,目前发展势头非常强劲。
然而,这里有几个问题。很多想从事推荐系统工作的同学大多是自学。 1、经常学习很多推荐算法模型,了解一些推荐中常用的算法,如:协作过滤、FM、deepFM等,但不清楚这些模型在行业推荐系统中是如何连接的,怎么合作,有什么坑,有哪些花招,导致面试或者业内真正的推荐系统,都会在现场推荐“老炮老炮”一眼认出小白的属性。 2、对算法原理没有深入理解,会导致模型的性能无法在实际应用中使用。另外,在面试大厂的面试官的时候,只能扔掉offer。
对于CF、FM、DSSM、DeepFM这些推荐的行业明星机型,你真的了解它们的内部运行原理和使用场景吗?你真的了解FM模型和SVM的相似之处吗? FM可以作为评分模型,但是可以用于匹配吗,如果可以,怎么做? item2Vec模型如何缓解行业冷启动问题?双塔模型有什么优点?深度模型如何匹配?结果是离线计算还是在网络上实时进行前向计算? DeepFM在实现的时候,广端和深端的优化方法是一样的吗?基于Graph的推荐方法目前在行业中的应用情况如何?基于上述目的,贪心学院推出了“推荐系统工程师培训计划第二期”,由一线推荐系统负责人现场讲解。
01 课程大纲
Part 1:推荐系统的内容理解与画像构建
第 1 周:基本机器学习
第 2 周:推荐系统基础
Week3:内容画像与NLP技术构建
Week4:用户画像构建
第 2 部分:召回模型和策略、数据和抽样知识
Week5:传统匹配方法
Week6:深度匹配方法
Week7:图嵌入和用户行为构建图
第8周:图推荐、图神经网络、采样和热抑制
第 3 部分:排序模型、重新排序和多目标
Week9:经典排名模型方法
Week10:深度排名模型和行业抽样技术
第 11 周:重新排序和多目标学习
第 4 部分:实时召回策略和前沿推荐技术
Week12-13:行业新闻推荐系统的冷启动和热点文章实时召回
第 14 周:强化学习和推荐系统、AutoML 和推荐系统
第 15 周:项目总结,部署到职业规划
其他课程详情可联系课程顾问获取
报名、课程咨询
02课程中的一些案例和作业
1.基于人像的推荐项目
推荐系统主要分为召回和排名两部分。这两个阶段都离不开用户画像的支持,用户画像基于内容画像积累用户行为。因此,首先需要内容画像。文本项内容画像的构建需要nlp技术的支持。 、店铺内容和用户画像依赖常用的数据库、贝叶斯平滑、威尔逊置信区间等技术;学习完本项目,您将学习如何使用nlp技术提取item信息形成内容标签,依靠mysql、Redis等数据库存储内容画像,并根据内容画像和用户行为形成用户画像,构建一个在此基础上基于人像的推荐系统。
2.新闻推荐项目
目前业界最主流的推荐系统采用的是“多渠道召回+细化”的方式。在本项目中,您将掌握业界最流行的推荐方式。你将使用MF、双塔等深度网络输入算法表达用户和物品,并实现基于ANN检索的recall。最后,使用精细排序,对每个候选项目进行评分和排序,最后根据评分将项目展示给用户。
3.基于图和深度网络的新闻推荐项目
目前业界有一个趋势:“将图法引入推荐系统”。你是怎么做到的?目前业界流行哪些图推荐算法?这些方法是如何嵌入到推荐系统中的?哪些方法是基于用户行为的?使用哪些方法同时引入先验知识图信息和用户行为?本项目将带你掌握这些图方法,并基于图方法对用户兴趣进行建模,从而达到召回的目的;在精细排序和评分阶段,目前行业内的主要厂商也已经全面用深度网络及其各种变体替代了传统模型。是的,本项目将带你在排序阶段掌握深度网络的排序方法。
4.推荐商品实时召回
目前业界流行的“召回+精细排序”的推荐方式是否存在弊端?仔细想想,如果只用这种方式为用户展示物品,模型往往很难及时响应用户的实时交互需求。本项目将带你在推荐领域文章推荐实时交互技术实现实时交互策略和热点;让你知道如何计算实时收入,实现实时画像,增加推荐系统的实时交互性。
5.实现基于用户协同的文本推荐
深度学习时代,经典的协同过滤方法是否还在各大公司的推荐引擎中使用?答案是肯定的。协作算法在推荐领域有这个不可磨灭的基因。作为一种分发和传播能力极强的方法,协同过滤方法在业界仍然被广泛使用。在这种情况下,学生将亲自实践协作算法的力量。
6.基于NLP技术和Redis构建和存储内容画像
用户画像在推荐领域起着至关重要的作用。在当今火灾的主流协同和深度召回方法,如双塔和YouToBe召回方法的情况下,基于用户画像的召回方法仍然适用。可控性和可解释性,推荐领域,由于其天然的业务性质,使得推荐系统对可解释性要求极高。当有推荐的坏案例时,基于用户画像的召回策略是寻找坏案例的重要手段。
7.Item2Vec 实现
推荐业务领域经常有以下场景,相关推荐,猜你喜欢等等,熟悉吗?它背后的算法和系统策略逻辑是什么?答案是在这种情况下。一个类似的相关推荐场景是:根据已有的item推荐另一个相关的item或产品。借助用户行为和word2vec思想,在这个场景中引入item Embedding,适当引入side info信息。来做产品推荐,本案例为你揭秘。
8.FM方法的实现
MF(matrix factorization)算法是推荐算法的经典代表作品之一。是原型首先体现了Embedding的泛化和扩展思想;之后,在MF(矩阵分解)的基础上发扬了FM(因子分解机)算法。 Embedding 的思想被进一步引入到传统的机器学习中进行推荐。 FM算法被视为推荐领域的灵丹妙药。召回、粗分、细分都可以用FM来实现。在深度学习,在线资源困难的情况下,可以算是推荐的领域。最好的baseline方式,在这种情况下,你会亲身感受到FM算法的魅力。
9. Wide&Deep 算法实现
推荐算法本质上是解决两个问题:记忆和泛化,传统LR等模型,直接将大量ID类型的稀疏特征喂给模型,然后泛化线性模型直接学习这些的权重ID型特征本质上是模型对特征的简单粗暴的记忆。因此,不能保证泛化的可扩展性。对于从未出现过的特征(如重要的交叉特征等),模型无法学习特征权重,因此无法体现特征的指示能力;因此,深度学习模型引入了Embedding密集向量的概念,抽象出不同特征之间的一部分共性,放入Embedding空间进行学习。这种操作可以看作是模糊搜索,具有很强的泛化能力,但记忆力明显不如LR等模型。 Wide&&deep 的提议是兼容内存和泛化考虑的。在此基础上,后续的DeepFM等模型只是加强了模型对宽边特征的展示。类型cross,但是架构的本质和wide&&deep模型是一样的。本案例带你练习WDL方法。
03课程适合哪些人?
大学生
工人
04 报名须知
1、本课程为收费课程。
2、本期只招收剩余名额。
3、质量保证!课程正式开始后7天内,将无条件全额退款。
4、学习本课程需要一定的机器学习基础。
●●●
其他课程详情可联系课程顾问获取
报名、课程咨询