目录
0. 相关文章链接
1. 产生背景
早期的用户画像起源于交互设计之父Alan Cooper提出的”Personas are a concreterepresentation of target users.”。认为 用户画像(Personal)是角色是目标用户的具体表示,又被称 为用户角色,是基于大量目标用户群的真实信息构建的用户标签(User Tags)体系,是对产品或服务的目标人群做出 的特征刻画 。 通过收集用户的人口统计信息、偏好信息及行为信息等,构建出用户画像,可以让产品经 理更好地了解用户,设计出合适的产品原型, 因此,用户画像是用户需求与产品设计的联系的桥梁。
- 阶段一:早期的用户数据来源渠道少,数据量级小,用户画像的研究主要基于统计分析层面,通过用户调研 来构建用户画像标签。
- 阶段二:加利福尼亚大学的Syskill和Webert就是通过显式地收集网站用户对页面的满意度,然后通过统计分析逐步学习构建出用户兴趣模型。
- 阶段三:后来,随着互联网及信息采集技术的发展,CUM 大学开发的Web Watcher以及后来的Personal Web Watcher,可以通过数据采集器,记录互联网上用 户产生的各种浏览行为及用户的兴趣偏好,实现对用户兴趣模型的构建,并随着数据的不断累积扩大而 更新系统模型,用户画像标签也更加丰富。
UserPersonal
基于用户基本信息(比如电商来说,用户注册时填写的信息)构建标签UserProfile
基于用户业务数据(用户产品产生的数据)构建标签
在大数据时代下,人们产生、获取、处理和存储的数据量呈指数级增长,过去基于统计模型的决策 无法满足人们的个性化要求。逐步演变为 基于数据驱动的决策 ,即如何 使用算法模型 实现用户画像中的 用户行为预测,已经成为产品经理及运营工作人员的关注重点。用户画像的含义也处于动态变化中,是 一个动态完善的过程,这种 基于数据建模的用户画像模型被称之为User Profile 。
目前的用户画像研究主要集中在三个方向上:用户属性、用户偏好和用户行为三个主要方面:
1)、用户属性
用户基本信息构建标签,比如某个商城会员用户注册时填写基本信息构建标签
2)、用户偏好
业务数据(订单数据,浏览数据、购物车数据。。)
喜欢买什么,看什么,玩什么,。。。 比如针对某个商城来说,主要喜欢买什么
3)、用户行为
浏览数据
- 其一、用户属性的研究侧重于显式地搜集用户特征信息,主要体现在社会化标注系统领域,通过社会化标注系统搜集比较全面的用户信息,用于多方位的了解用户。
- 其二、用户偏好研究侧重于制定兴趣度度量方法,评估用户的兴趣度,提高个性化推荐质量;
- 其三、用户行为的研究侧重于用户行为趋势的预测,如用户流失行为的 预测中,有利于提前发现问题,找出对应策略,防止客户流失;在用户的欠费预测问题中,有利于发现 电力客户欠费特征,为电力公司提供决策支持。
不同研究领域的用户画像研究方法也会有所差异,常用 的有决策树、逻辑回归、支持向量机及神经网络等模型。
1、第一种Personal被称为用户角色,主要由产品及用户研究人员使用,适用于产品初期的定位与用户调研;
2、第二种User Profile,主要由数据分析人员使用,适用于数据及产品运营的中后期。
2. 用户标签
虽然名字简单,但它确是 用户画像、精准营销、个性推荐、智能投放 等等各种系统的砖石。
2.1. 什么是用户标签
用来描述商品的,就是商品标签;用来描述业务的,就是业务标签;用来描述用户的,就是用户标签了。常说“小太阳家庭”、“中产阶层”、“爱好时尚”等都是用户标签。有意思的是,我们总是说:生活中不要给轻易给人贴标签。可为什么还要大张旗鼓做用户标签呢?
2.2. 用户标签的作用
因为面对一个人,出于尊重他人、不带偏见的考虑,我们说不能乱贴标签。但企业经营面对数以千万的用户,就不能一个个去理解,时间和成本都烧不起。如果不加区分,把所有顾客一视同仁,就只能这么地毯式轰炸,如下图所示:
如果有用户标签,就能快速、方便地细分用户群体,锁定更有需求的人,实现更精准的营销/服务。
不打标签,每次都基于原始数据分析,运营会很纠结的:到底是选买过3次的还是4次的才加活动呢?消费分段选3000,3200,还是3300呢?理论上,每次都这么纠结也是可行的。但是这样做效率太低,并且能思考的维度太少,很有可能累秃了头也没啥进展。
因此可以基于过往分析成果,预先打上标签,能极大提升效率,实现更复杂、更精准的分析。并且,还能把最后效果记录进标签库,积累分析经验。如 果标签打的对,那我们按标签做的事就能起到效果,标签本身质量也被确认;如果标签打错了,那按标签做的事就会没有效果,后续就能修订标签,打新标签。
做用户分层和分群,做精准营销,所有结果也可以以标签形式保存。在后续多次验证,从而沉淀管用、区分度高的标签,提升用户画像的准确度与有用性。
想要达成这种好的区分效果,当然只靠“男女”这种简单的标签是不够的,于是就有了制作标签的过程(俗称:打标)。具体怎么做?一起来看个简单通俗的例子。
2.3. 用户标签制作流程
以通俗易懂男朋友见未来岳母为例,如下对话:
你看,问的全是用户标签,人家丝毫不在乎你有多痴情,你有多努力。甭整那虚了吧唧的玩意,Show me the 房产证!十八姑娘一枝花,追的人多了去了,就是要大量过滤那些馋身子的小垃圾……
然而如果只知道回答是“有房”,是不是就能区分好青年了呢?——当然不可以。因为单一维度的标签,信息量很有限。就像单纯说“有房”,那到底是上海的房子还是盐城的房子,是60平小两房还是120平大三房,是全款的还是欠了一屁股债的,通通不知道。因此,丈母娘才会问一大堆信息,逐步规整判断:到底这个小伙靠不靠谱。
这就是制作用户标签的直观步骤:
依据上图的流程,归纳总共7个步,具体如下:
做用户标签可以很简单,但想做有效的标签,就会很复杂。它是一个从单维度到多维度,从简单到复杂,不断迭代验证的过程。在这个过程中,经常出现问题。
2.4. 用户标签的五大常见问题
在实际项目中构建用户标签时,如下5个问题至关重要,需要多多考虑。
2.4.1. 问题一:没有目标,盲目干活
很多人被“比如性别:男女就是个标签”这句话误导,以为只要做了分类,就算是标签了。至于分出来的类别之间有什么差异,有多大差异,压根没检验过。甚至,你问他为啥这么打标签,他说不知道。领导让打,咱就打,管他呢。
实际上,即使是同一个原始数据,在不同目标下,打标方式会完全不同。拿用户年龄举例,可能有好几种分类贴标签的方式:
2.4.2. 问题二:不区分时间状态
比如打一个“高价值用户”标签,这里“高价值”指的是历史消费水平高,还是未来消费的多?很多人傻傻不分,就统计下历史消费金额,然后消费多的就是价值高。但是谁保证用户过去买的多,未来一定买的多??完全不一定。
注意:如果我们要打的标签是个未来情况,比如未来消费多,意味着我们要做一个预测:用户未来会消费多少。这里就得基于测试或者建模预测才能得到结论,不能简单基于历史数据统计。
2.4.3. 问题三:行为动机乱归因
比如用户买了产品A,于是就打个“A产品喜爱者”标签。然而用户真的喜欢A产品吗?我
们只知道用户买了A的行为,并不能直接推导出动机。如果想推倒动机,需要基于一段时间
数据分析,并且综合多个维度判断。
在推导动机的时候要特别谨慎,因为错误的、随意的归因会误导业务行动。明明用户喜欢的是打折,结果缺误判为产品粉丝,最后很有可能狂推一堆产品却没有响应。
2.4.4. 问题四:多目标混合不清
比如评高价值用户,把活跃度和付费金额,付费金额和毛利几个指标混合在一起,美其名曰“综合评价”。结果搞出来一毛不花天天白嫖的用户也是高价值用户。要是都这么折腾公司就得破产了。
这类问题,主要是做数据的同学嫌一个维度一个维度切分不体现数据能力,非得整个模型,算个权重才显牛逼。降维可以做,但牢记整个原则:不同类目标不混合。特别是涉及钱的目标。到底公司赚没赚钱,是个很严肃的事。搞混了,是要喝西北风的。
2.4.5. 问题五:结果缺少检验
打用户标签是希望区分用户,那么最后区分效果,在目标上的差异越大越好,如果差异不大,那打标意义就不大,可以取消标签,或者再做优化。
遗憾的是,很多公司都是为了打标签而打标签。至于打了标签干什么,用在哪里,效果如何,从来没考虑过。其实,想做出好的业务效果,远没大家想的复杂,关键在于做好:打标-验证-积累-二次打标的过程,持续的进行迭代。
3. 应用场景
用户画像应用领域较为广泛,适合于各个产品周期,从新用户的引流到潜在用户的挖掘、从老用户 的培养到流失用户的回流等。通过挖掘用户兴趣、偏好、人口统计特征,可以 直接作用于提升营销精准 度、推荐匹配度,最终提升产品服务和企业利润。还包括广告投放、产品布局和行业报告等。
3.1. 精准营销
常见的营销方式包括APP信息推送、短信营销和邮件营销等。随着运营方式从粗放式到精细化,用 户画像技术能更深入和直观的了解用户,而越了解用户就越能够做出正确的决策,通过产品或服务的潜 在用户进行分析,将用户划分成更细的粒度,针对特定群体进行营销,辅以短信、推送、邮件、活动等 手段,趋以关怀、挽回、激励等策略。既能减少全量推送造成的资源浪费,又能达到较好的营销转化效果。
思考如下两个问题:
1)、大家所有人都收到这个邮件和这个短信了吗?
2)、那为什么这个短信和邮件发给了某一些人, 而另一些人没有收到呢?
短信和邮件的发送也是有成本的, 所以对于一些企业来讲, 不可能会在每一次营销中对所有人发送短信和邮件, 在不同的活动中, 可能会选取不同特征的一类用户, 对其进行短信或者邮件的营销, 那么这里就需要对用户进行分群。
3.2. 数据化运营
如果大家是一个公司的运营经理, 现在需要对不够活跃的地区举办一些活动, 刺激用户的参与, 那么应该需要这样的一张图:
如果大家是产品经理, 现在需要对整个产品的风格进行改版, 那我们应该需要一张图, 来看到我们的产品在哪个年龄段最受欢迎, 要致敬这个年龄段的用户。类似的场景还有很多, 通过数据来说话, 来找到运营的策略, 正是一种非常有必要的事情, 也是发展趋势。
3.3. 推荐系统
用户画像常用在电商、社交和新闻等应用的个性化推荐系统中。互联网时代下的信息是过载的,用 户量级巨大且用户之间千差万别。如果根据用户的行为习惯,购物或阅读记录来打造基于内容推荐系 统,实现的千人千面个性化推荐可以加深应用的用户粘性。 在电商行业中,推荐系统的价值在于挖掘用 户潜在购买需求,缩短用户到商品的距离,提升用户的购物体验。
说到推荐系统, 其实现在各种公司都在做, 我们判断未来的所有应用应该都是个性化的, 都是千人千面的, 例如如果在京东上购买了手机壳, 那么京东应该会推荐给我们其它样式的手机壳, 如果买了书,应该推荐给我们更多同类型的书, 就例如如下:
但是问题来了:什么是推荐, 如果针对不同的人, 展示的结果会不同?
其实推荐就是系统通过数据, 找到用户和用户所感兴趣的物品之间的关系, 更抽象和更准确的说, 就是找到用户和商品之间可能的连接. 可以表示为类似如下样子。
可以通过大量的数据样本, 从而使用算法找到User和Product之间的关系, 简单来讲, 这就是推荐系统的实现方式. 那么, 有一个问题:表示一个用户的这些特征如何生成呢, 如何找到一个用户的向量表示呢?
3.4. 广告投放
广告的本质是传播,是为了某种特定的需要通过一定形式的媒体,公开而广泛地向公众传递信息的 宣传手段。著名广告大师约翰•沃纳梅克提出“我知道我的广告费有一半浪费了,但遗憾的是,我不知道 是哪一半被浪费了”。通过用户画像的技术,从最早的广而告之逐渐转变为精准的定向投放,对用户数 据进行标签化,还原用户的信息全貌。广告主可以通过标签筛选要触达的用户,进而实现针对特定用户 群体进行广告投放,减少不必要的广告费用。
3.5. 产品布局
一个产品设计之初,有一定的目标用户定位。随着产品的发展,想要得到更广泛的应用,还需结合 用户的特性来做出相应的调整和改变。用户画像技术可以恰到好处地理解用户使用产品的心理动机和行 为习惯,助力产品设计的持续的完善,提升服务质量。
3.6. 行业报告
通过对用户画像技术可以了解行业动态,常见的有市场分析、品牌受众人群、不同地域品类消费差 异等。这些行业报告可以指导平台更好的运营、把握大方向,也能为相关的中小企业、店铺、媒体提供 细分领域的深入洞察。
3.7. 场景间的共性
前面提到了几个场景和几个问题,现在回顾一下这些场景和问题:
1、精准营销:需要对用户进行分群, 找到某个特质的用户
2、数据化运营:需要生成用户的图标, 所以同样也需要对用户进行分群和统计
3、推荐系统:需要找到用户和商品之间的连接, 所以需要对用户进行向量化表示
如果能有一个系统,把用户特征标注出来,如下:
那么,对于上面的三个需求,,就可以以如下方式解决:
1、精准营销, 按照地域或者性别筛选客群
2、数据化运营, 按照消费能力筛选客群
3、推荐系统, 得到每一个用户的标签化表示
那什么是用户画像呢? 用户画像其实就是对用户使用标签来进行标注,例如:
U_1001:(男, 北京, 宅男, 高消费能力)
用户画像标签表: – 存储到HBase表中
tbl_profile (表名称)
标签分为两类:(列簇ColumnFamily)
用户标签:user
商品标签:item
表的RowKey:
用户ID:userId
标签值:(列值)
实际存储标签值:tagValue
标签字段:tagName
标签信息表:
tagId, tagName, tagDesc
384 男 用户的性别为男性
385 女 用户的性别为女性
…………
4. 用户标注
前面说了几个场景, 这些场景想要实现,都借助于对用户的理解, 直白点说,就标注出来每个用户的特征,, 但是如何标注呢?
4.1. 本体论
在开始之前, 先介绍一下本体论,在介绍本体论之前看如下图,羊这种可爱的动物大家一定是见过的。
问大家的问题是,什么是羊?我觉得大家可能给出的比较标准的答案也许是一种有 四条腿、四只蹄、白色覆毛、两只短耳朵、小眼睛、性格温顺 的动物。
现在把刚才这个结论拆开:四条腿, 四只蹄, 白色覆毛, 长耳朵, 小眼睛, 性格温顺, 动物,这些词并不是羊, 只是羊的符号, 我们说羊有四条腿, 有白色覆毛, 是一种动物, 那这些形容词, 甚至羊和动物这样的名词, 都是真实存在的这个本体的一种符号化表示, 而本体指的就是一个真实的存在, 这种理论, 就是哲学中说的【本体论】, 是亚里士多德的形而上学的基本分支。
那么和用户画像有什么关系呢,大家仔细想一想, 其实本质上:用户画像就是对用户的符号化表示, 也就是说, 其实 标注用户就是把用户当做本体来进行标注 。
而本体论也逐渐的发展为描述知识的一个学科,如果大家以后要研究知识工程和知识图谱的话, 本体论是绕不过去的。
4.2. 打标签
采用本体论的思路,给用户打上标签,并存储标签,如下的表示方式:
1) 用户标签可以存储到HBase表中,使用HBase的列式存储,方便打标签时数据写入,如下所示:
2) 同时,可以将用户标签存储至Elasticsearch索引中,方便需要时进行检索,如下所示:
3) 给用户打标签后,可以获取数据在网页页面展示,构建用户画像系统,示意图如下:
5. 总结
版权声明:本文为博主电光闪烁原创文章,版权归属原作者,如果侵权,请联系我们删除!
原文链接:https://blog.csdn.net/yang_shibiao/article/details/122569423