推荐算法+机器学习

1、推荐系统的目的

解决方案目的: – 信息过载,项目推荐
推荐系统:推荐系统是用于信息过载的措施。面对海量数据信息,可以快速推荐符合用户特点的商品,解决部分人的“选择恐惧症”:面对没有明确需求的人。
– 解决如何从海量信息中找到自己感兴趣的信息
– 解决如何让自己的信息脱颖而出并受到公众喜爱
– 好的推荐系统会让三方双赢
要理解:
– 电影领域顶尖推荐系统:网飞netflix,曾经举办过百万奖金设计推荐算法
– 顶级电子商务推荐:亚马逊
– 个性化广告:FaceBook,Google

2、基本思想

– 知道你所想,精准推送
– 利用用户和物品的特征信息,推荐具有用户喜欢的特征的物品
– 聚集在一起
– 使用用户喜欢的项目来推荐与用户喜欢的项目相似的项目
– 人们被分成几组
– 使用与用户相似的其他用户向用户推荐其他兴趣爱好相似的用户喜欢的商品

3、数据分析,分析哪些数据

推荐算法+机器学习

明确的用户反馈:——评论、评论
隐式用户反馈:——购买、查看、浏览

4、推荐算法的分类

– 根据实时分类
– 离线推荐 – 实时推荐
– 根据推荐是否个性化
– 统计推荐 – 个性化推荐
– 根据推荐原则分类
– 基于相似度的推荐 – 基于知识的推荐 – 基于模型的推荐
– 按数据源分类
– 基于人口统计的推荐 – 基于内容的推荐 – 基于协同过滤的推荐

推荐算法+机器学习

① 基于人群+相似度推荐(人群分组)

推荐算法+机器学习

② 基于内容+相似度的推荐

推荐算法+机器学习

③ 协同过滤:行为数据、用户和物品相关数据

推荐算法+机器学习

5、CF 与 CB 的区别

CF:协同过滤推荐方法,CF不仅可以通过当前用户评分的物品内容,还可以利用其他用户评分过的物品内容。
CB:基于内容,主要利用的是用户评价过的物品的内容特征。
–CF 可以解决CB的一些局限
– 当项目的内容不完整或难以获得时,仍然可以通过其他用户的反馈给出推荐。
– CF基于用户之间对物品的评价质量,避免了CB仅依赖内容可能造成的对物品质量判断的干扰。
– CF推荐不受内容限制,只要其他类似用户给出了对不同物品的兴趣,CF就可以给用户推出内容差异很大的物品(但又某种内在联系)
– CF协同过滤算法分为两类:基于近邻和基于模型。
– CF算法弊端:需要依赖大量的历史数据,否则不准,CF 无法解决冷启动问题。
推荐算法+机器学习

CF分类

– 基于用户的协同过滤
推荐算法+机器学习

– 基于项目的协同过滤
推荐算法+机器学习

6、混合推荐

– 加权混合:每个推荐算法对应一个推荐列表,我们为每个推荐算法添加一个系数,重复实验以达到最佳效果。
– 切换混合:两个系统,带有一个切换模块,在不同的情况下切换到不同的推荐系统。
– 分区混合:不同的推荐方法会对不同区域的用户显示不同的结果。
– 分层混合:所有推荐方法,串行,逐层连接,整合各个算法得到准确的推荐列表。

7、什么样的推荐系统最好?

推荐算法的好坏在于它的误差值
– 评估方法:
– 离线实验:将得到的数据分为训练数据和测试数据,利用训练数据得到一个优化的模型,然后通过测试集检验预测结果(已经得到的数据)。网上情况一致,可靠性确实低
– 用户研究:使用真实用户完成推荐系统上的一些任务。好的确实可靠,坏的用户研究需要可靠的用户(问卷)
–在线实验(AB测试),推荐系统分成两部分,两组用户,不同组用不同算法,统计数据,和指标,数据绝对真实(切换混合)弊端数据不能快速获取,一定周期。
– 先用离线实验,离线指标好的算法抽取出来,再进行用户用户调查,目标获取用户体验不比之前差即可,最后上线AB测试。

推荐算法+机器学习

8、推荐算法的准确度计算公式

推荐算法+机器学习
推荐算法+机器学习
推荐算法+机器学习

9、机器学习分类

推荐算法+机器学习
推荐算法+机器学习

① 无监督学习

– 有监督比无监督更有效
– 无监督学习:只提供输入数据和提取特征
例如:无监督学习应用:Google新闻
推荐算法+机器学习

② 监督学习

– 监督学习:即有输入数据和结果数据,监督学习主要包括分类和回归,当数据是一组有限的值(离散值)时使用分类算法,当数据可以有范围内的任意值时范围(连续值) 使用回归算法。
相似性学习是一类与回归和分类密切相关的监督机器学习。它的目标是使用相似性函数从样本中学习,该函数可以衡量两个对象之间的相似性或相关性。

推荐系统三要素:模型、策略、算法
– 损失函数用于衡量模型预测误差的大小
推荐算法+机器学习

10、监督学习分类

推荐算法+机器学习
回归模型使用平方损失函数

11、推荐系统算法

推荐系统中会使用到相似度算法,此相似度如何计算,假设如图,A对象与B对象,在一个三维中,两者的距离便是相似度的差距,越大表名相似度月底,所以相似度的评判可以通过两者之间的距离,或者余弦的夹角来衡量
推荐算法+机器学习

特征工程
推荐算法+机器学习
会先对数据进行特征处理,过滤掉一些多余的特征,特征选择

推荐算法+机器学习

UGC :用户打标签,通过用户的用户行为,产生对应的标签
PGC:专家打标签,通过专门的人员,手动打标签
用户打标签-----简单算法:
推荐算法+机器学习

TF_IDF:词频-逆文档频率
– 是一种统计方法,用于评估一个单词在其他文档中的一组文档中出现的次数。
模型求解算法——ALS

推荐算法+机器学习

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
乘风的头像乘风管理团队
上一篇 2022年3月22日
下一篇 2022年3月23日

相关推荐