用户体验研究中用户画像如何做

一个产品创意初期对用户的需求定义，在产品原型产出后，有时候会推倒重来。

为什么对用户理解遗失？用户是多样的，在设计初期没有对用户进行定义，闭门造车中，设计师很容易忘记用户雏形。因此，在设计初期需要用户画像来帮助设计师理解用户，用户画像在整个产品过程中具有指导作用。

用户画像的核心工作是为用户打标签，打标签的重要目的之一是为了让人能够理解并且方便计算机处理，如，可以做分类统计：喜欢红酒的用户有多少？喜欢红酒的人群中，男、女比例是多少？

也可以做数据挖掘工作：利用关联规则计算，喜欢红酒的人通常喜欢什么运动品牌？利用聚类算法分析，喜欢红酒的人年龄段分布情况？

大数据处理，离不开计算机的运算，标签提供了一种便捷的方式，使得计算机能够程序化处理与人相关的信息，甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后，无论是搜索引擎、推荐引擎、广告投放等各种应用领域，都将能进一步提升精准度，提高信息获取的效率。

如何设计人物角色：
早期Pruitt和Adlan的人物角色周期概念
1计划：创建角色前的研究和计划阶段
2构思与孕育：将研究数据和观察转换成角色
3诞生与成熟：强有力／清晰地表达
4成年：在设计流程中发挥作用
5终生成就与退休：评估角色地作用

Alan Cooper提出“人物角色”概念——以明确目标创建人物画像，从用户使用情景出发，研究人员观察记录用户在使用同类产品时的场景及人机交互的细节及原因（从群体用户的问卷调研、数据分析到具象的个性描述，再到抽象应用），产品设计人员依据用户行为数据redesign现有产品。如下图所示：

一、群体定量统计分析
做用户画像的基础，是通过数据对海量用户有一个初步的了解，一般采用用户数据提取分析与问卷调研两种方式进行，根据产品目标确定统计分析的维度指标。

分析的维度，可以按照人口属性和产品行为属性进行综合分析，
人口属性（静态信息）：地域、年龄、性别、文化、职业、收入、生活习惯、消费习惯等；
产品行为（动态信息）：产品类别、活跃频率、产品喜好、产品驱动、使用习惯、产品消费等；

数据源分析
构建用户画像是为了还原用户信息，因此数据来源于：所有用户相关的数据。
对于用户相关数据的分类，引入一种重要的分类思想：封闭性的分类方式。如，世界上分为两种人，一种是学英语的人，一种是不学英语的人；客户分三类，高价值客户，中价值客户，低价值客户；产品生命周期分为，投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。
这样的分类方式，有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整，造成维度遗漏留下扩展性隐患。另外，不同的分类方式根据应用场景，业务需求的不同，也许各有道理，按需划分即可。
此处将用户数据划分为静态信息数据、动态信息数据两大类。

图片发自简书App

——静态信息数据

用户相对稳定的信息，如图所示，主要包括人口属性、商业属性等方面数据。这类信息，自成标签，如果企业有真实信息则无需过多建模预测，更多的是数据清洗工作，因此这方面信息的数据建模不是本篇文章重点。

——动态信息数据
用户不断变化的行为信息，如果存在上帝，每一个人的行为都在时刻被上帝那双无形的眼睛监控着，广义上讲，一个用户打开网页，买了一个杯子；与该用户傍晚溜了趟狗，白天取了一次钱，打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网，乃至电商，用户行为就会聚焦很多，如上图所示：浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。

在互联网上，用户行为，可以看作用户动态信息的唯一数据来源。

以下是腾讯开放平台的一些产品用户属性，年龄与性别的交叉分析，付费用户与年龄的交叉分析。无论是后台数据分析还是用户问卷调研，都需要进行研究的效度与信度论证，保证数据尽量准确可用。
做问卷调研，需要做多少份问卷呢？一般是4000份以上，这个时候的抽样置信区间可以达到99%，错误率幅度在2%左右。如果保持错误率2%的水平，置信水平95%，那么问卷数量可以下降到2500份。需要注意的是一般我们回收问卷，还会通过答题完整性、一致性等多项标准剔除无效问卷，所以回收问卷尽量高于标准数量的10%。
案例：页游用户年龄与性别分布

图片发自简书App

数据来源：2013年腾讯开放平台白皮书

案例：付费用户年龄分布

图片发自简书App

数据来源：2013年腾讯开放平台白皮书

这本白皮书还是有不少用户数据可以供大家参考，有兴趣的同学可以去腾讯开放平台下载：http://open.qq.com/
2014腾讯开放平台白皮书

二、具象的定性个体描述

创造人物角色，这里先说一个概念：Persona。Alan Cooper提出了Persona这一概念。《赢在用户》这本书将其翻译为“人物角色”，是在上面的海量数据分析基础上，进行具象化得到一个的虚拟用户。
有兴趣了解AlanCooper的可以去他的Google+主页看看。
链接：https://plus.google.com/101097598357299353681/about

PERSONA的含义

P 代表基本性（Primary research）指该用户角色是否基于对真实用户的情景访谈
E 代表移情性（Empathy）指用户角色中包含姓名、照片和产品相关的描述，该用户角色是否引起同理心。
R 代表真实性（Realistic）指对那些每天与顾客打交道的人来说，用户角色是否看起来像真实人物。
S 代表独特性（Singular）每个用户是否是独特的，彼此很少有相似性。
O 代表目标性（Objectives）该用户角色是否包含与产品相关的高层次目标，是否包含关键词来阐述该目标。
N 代表数量（Number）用户角色的数量是否足够少，以便设计团队能记住每个用户角色的姓名，以及其中的一个主要用户角色。一个产品，一般最多满足3个角色需求。
A 代表应用性（Applicable）设计团队是否能使用用户角色作为一种实用工具进行设计决策。
我们通过调研去了解用户，根据他们的目标、行为和观点的差异，将他们区分为不同的类型，然后每种类型中抽取出典型特征，例如：一些个人基本信息，家庭、工作、生活环境描述，赋予一个名字、一张照片、场景等描述，就形成了一个具象的典型用户画像。人物角色一般会包含与产品使用相关的具体情境，用户目标或产品使用行为描述等。为了让让用户画像容易记忆，可以用具体的名字、标志性语言、几条简单的关键特征进行描述。一个产品通常会设计3～6个角色代表所有的用户群体。
譬如下面就是做YY用户画像的一个案例：

图片发自简书App

用户画像的目标是通过分析用户行为，最终为每个用户打上标签，以及该标签的权重。如，红酒 0.8、李宁 0.6。
标签，表征了内容，用户对该内容有兴趣、偏好、需求等等。
权重，表征了指数，用户的兴趣、偏好指数，也可能表征用户的需求度，可以简单的理解为可信度，概率。

具象的用户画像作用
理解用户。人物角色是海量用户“打包”后的研究结果，是用户研究结果的生动呈现方式，是用户心里模型好的载体，可以让产品经理、设计师进行方便的换位思考。
提高沟通效率。由于人物角色是用户研究结果的具象化，它不但生动，而且代表着用户真实的目标和动机等信息，基于统一用户认知基础的沟通，可以大大提高团队的沟通效率。
设依据。人物角色，让设计师找到了“以用户为中心的设计”的着力点——“用户”，在团队成员间对设计方案存在分歧时，可以依据“人物角色”来选择最佳的设计方案。

三、数据建模与产品应用
用户研究的价值，最终还是要体现在产品的应用上。
一方面是产品经理、设计师在进行视觉设计、交互设计等方面进行参考。另一方面，更重要的是将用户角色落实在在实际的产品中，用数据做产品在当前热议大数据的时代越来越受到重视。
数据建模的方法太多了，神经网络、遗传算法、蒙特卡罗算法、聚类分析、关联算法等等。

下面内容将详细介绍，如何根据用户行为，构建模型产出标签、权重。一个事件模型包括：时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件，可以详细描述为：什么用户，在什么时间，什么地点，做了什么事。

什么用户：关键在于对用户的标识，用户标识的目的是为了区分用户、单点定位。

图片发自简书App

以上列举了互联网主要的用户标识方法，获取方式由易到难。视企业的用户粘性，可以获取的标识信息有所差异。

什么时间：时间包括两个重要信息，时间戳+时间长度。时间戳，为了标识用户行为的时间点，如，1395121950（精度到秒），1395121950.083612（精度到微秒），通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度，准确度最多也只能到毫秒。时间长度，为了标识用户在某一页面的停留时间。

什么地点：用户接触点，Touch Point。对于每个用户接触点。潜在包含了两层信息：网址 + 内容。
网址：每一个url链接（页面/屏幕），即定位了一个互联网页面地址，或者某个产品的特定页面。可以是PC上某电商网站的页面url，也可以是手机上的微博，微信等应用某个功能页面，某款产品应用的特定画面。如，长城红酒单品页，微信订阅号页面，某游戏的过关页。
内容：每个url网址（页面/屏幕）中的内容。可以是单品的相关信息：类别、品牌、描述、属性、网站信息等等。如，红酒，长城，干红，对于每个互联网接触点，其中网址决定了权重；内容决定了标签。
注：接触点可以是网址，也可以是某个产品的特定功能界面。如，同样一瓶矿泉水，超市卖1元，火车上卖3元，景区卖5元。商品的售卖价值，不在于成本，更在于售卖地点。标签均是矿泉水，但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿泉水的需求程度不同。即，愿意支付的价值不同。
标签权重
矿泉水 1 // 超市
矿泉水 3 // 火车
矿泉水 5 // 景区
类似的，用户在京东商城浏览红酒信息，与在品尚红酒网浏览红酒信息，表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址，存在权重差异，权重模型的构建，需要根据各自的业务需求构建。
所以，网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。

什么事：用户行为类型，对于电商有如下典型行为：浏览、添加购物车、搜索、评论、购买、点击赞、收藏等等。不同的行为类型，对于接触点的内容产生的标签信息，具有不同的权重。如，购买权重计为5，浏览计为1
红酒 1 // 浏览红酒
红酒 5 // 购买红酒

综合上述分析，用户画像的数据模型，可以概括为下面的公式：用户标识 + 时间 + 行为类型 + 接触点（网址+内容），某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
用户标签的权重可能随时间的增加而衰减，因此定义时间为衰减因子r，行为类型、网址决定了权重，内容决定了标签，进一步转换为公式：
标签权重=衰减因子×行为权重×网址子权重

如：用户A，昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
标签：红酒，长城
时间：因为是昨天的行为，假设衰减因子为：r=0.95
行为类型：浏览行为记为权重1
地点：品尚红酒单品页的网址子权重记为 0.9（相比京东红酒单品页的0.7）
假设用户对红酒出于真的喜欢，才会去专业的红酒网选购，而不再综合商城选购。
则用户偏好标签是：红酒，权重是0.95*0.7 * 1=0.665，即，用户Ａ：红酒 0.665、长城 0.665。

上述模型权重值的选取只是举例参考，具体的权重值需要根据业务需求二次建模，这里强调的是如何从整体思考，去构建用户画像模型，进而能够逐步细化模型。

目前的产品应用中，最常见的是用户分类、各种推荐算法、防流失模型等。这里我们举几个常见的案例。
案例一：英雄联盟对新用户的类别划分
新玩家进入游戏后，不同的游戏水平，将会有不同的引导体验。

图片发自简书App

查看图片

我玩RTS：玩过一些即时战略游戏，但是并非高手。
我玩MOBA：玩过MOBA类游戏，知道打钱、杀人、推塔、拆基地。
大师你懂吗：团队顶梁柱，反黑主力军，打辅助也能杀超神，没有什么能比你更强力。

案例二：QQ音乐猜你喜欢
Fm.qq.com，这个案例，从歌手、专辑、单曲三个维度，融合离线计算与在线实时推荐机制进行设计与开发

图片发自简书App

以下也是某音乐产品的推荐逻辑：

图片发自简书App

案例三：流失预警模型决策树算法

图片发自简书App

以下是微博的做用户画像的完整案例：

基于对设计的需要和市场的了解，2011年度微博ucd团队进行了一次微博用户的用户画像研究。整个勾画过程持续了三个月，下面结合微博用户画像的流程以及项目的一些心得作一些总结与介绍。在进行微博用户画像的过程中，所面临的情况是微博产品上线已经两年多，用户群已稳定发展起来，并且研究人员对于产品及用户整体状况有了一定的把握，但是在具像化、有生活情境的故事版用户上却还存在认识的不足，因此我们在进行用户画像时给自己定下了四个目标：
使产品经理、交互设计师、视觉设计师、开发工程师对微博产品目标用户产生具象的认识，更好的了解我们的目标用户；
细化用户的使用场景、使用目的，方便产品、交互等角色讨论产品方案时举出实例；
提高产品设计效率，把资源投入在典型用户上；
指导产品决策，便于针对性地定位产品，通过分层满足目标用户需求，逐步提高用户对产品的认同度与依赖度。

一般而言，用户画像在产品没有上线、市场前景较为模糊、产品需求还需探索的阶段，定性化的用户画像能有效地节省时间、资源，在较短的时间通过桌面研究、访谈等定性化的方法来获得用户画像是一种比较可行和最优的方式。而事实上，用户画像是一种能将定性与定量方法很好结合在一起的载体，通过定量化的前期调研能获得一个对于用户群较为精准的认识，在后期的用户角色的建立中能很好地对用户优先顺序进行排序，将核心的、规模较大的用户着重突出出来。定性化的方法虽然无法对不同单位的特征作数量上的比较和统计分析，但能对观察资料进行归纳、分类、比较，进而对某个或某类现象的性质和特征作出概括，在角色建构的过程中定性化的方式能获得大量用户的生活情境、使用场景、用户心智等资料，进而形成活生生的用户类型。基于我们后台数据的支持和挖掘，这次我们的用户画像选择将定量化和定性化方法相结合来创建微博用户画像。总体来说，这次用户画像所经历的流程主要有：

一、前期资料搜集与后台数据挖掘
在描绘了这一项目的时间节点，制定出项目规划后，对前期资料搜集有利于我们了解项目的背景和对总体情况的把握。我们必需要明确的是用户画像的过程本身是一个很好的定义自身设计产品边界的契机。虽然用户画像是在创造一系列的“典型”或者“象征性”的用户，但用户画像的一个更高层次的功用在于使用用户画像融合边缘情况的行为或需求。创建用户画像不是单纯是抽离出典型进行分隔的一个过程，更为重要的是整合进边缘人群的需求，使产品能在更大范围里满足用户需求。
因此在画像之前，我们需要知道产品的用户特征，用户使用产品的操作行为特征等要素，从总体上把握用户群的需求，同时也需要竭力了解所谓边缘用户的行为或需求以便于在后期画像过程中将其需求最大程度地整合进去。
第一阶段我们首先对后台数据进行提取，通过后台数据挖掘了解到用户上网环境的一些关键指标，如屏幕分辨率、移动端与WEB端用户的比率等。在对用户使用场景有一些初步把握后，我们随机提取了10万用户UID样本量，获取用户职业身份、年龄、性别、学历、浏览微博时长(手机、浏览器)，用户的偏好(博文内容中获得)等关键因素，进行清洗后，使用SPSS聚类分析确认区分最明显的因素，得出最为典型的五类用户及其占比：
第一类属于微博内领袖人物，粉丝以及活跃度都很高，认证数量比总体高，年龄比总体偏大，男性占比稍高于总体；
第二类属于微博内属于非领袖活跃人物，关注人数多，认证数量高于总体，来自手机端注册较少，女性用户高于总体；
第三类喜欢浏览，粉丝少，全部来自PC端的年龄偏大的男性用户；
第四类浏览量很小，很少搜索，会有转发一些微博，男性稍微高于总体，而且属于低龄化群体；
第五类属于纯浏览型，很少原创以及转发和被转发，私信等，全部来自PC端的女性用户。
至此，研究团队已经对整个用户群类型与规模有了一个定量化的把握和了解，这对于建立可信的用户画像非常具有参考价值，后期的画像在数据上有了支持。

二、定量化的调研分析
在用户画像的过程中有一个很重要的概念叫做颗粒度，就是我们的用户画像应该细化到哪种程度。举一个极端的例子，如果“用户画像”最细的颗粒度应该是细到每一个用户每一具体的生活场景中，但是这基本上是一个不可能完成的任务，同时如果用户画像的颗粒度太大，对于产品设计的指导意义又相对变小了，所以把握好画像的总体丰富程度显得异常重要了。上一步我们形成了对整体用户的一个了解，但还有一些信息没有很好的得到。在这一步，我们采取问卷调查的方法来丰富用户的情态，这对于把握用户画像颗粒度有一定参考意义。
通过问卷调查研究团队主要想了解的信息有微博用户的使用场景、用户关注的内容、整体满意程度以及个人的人口学统计特征，在已有数据的支持下继续深化了解用户信息。我们通过网调系统以及微博通知的方式回收5000多份问卷，在问卷设计中涉及到以上主要变量，对回收的这批数据进行处理，获得了用户的人口学统计特征以及常用功能的占比，这些常用功能包括用户使用深度、使用核心功能等要素。

三、用户访谈与角色建构
在前期数据支持下，在这一阶段就需要发挥定性研究的长处了，前期如果是一个搭建骨架的过程，那么这一阶段就是一个塑造一个有血有肉的活体的过程了。根据目标用户的比例和使用特征数据，我们在这一阶段找到20名目标用户进行深度访谈，重点挖掘其生活情境与使用场景。围绕用户的行为特征，通过添加环境、人际关系、操作熟练程度、使用意向、人口统计学属性等细节对用户进行描述，形成用户画像的框架。此外，对用户画像取合适的名字、适当描述个性，附照片等能使角色更加生动，栩栩如生，更易于设计师形成直观印象。由于前期对用户群比例有了定量化的支持，因此在涉及到超过三个以上的用户画像需要进行排序时就有了比较明确的数据支持，这时保证了画像顺序最大的客观性。通过整个前期的调研加上定性的访谈，最终我们形成了下列五类用户角色：

图片发自简书App

总体说来，所形成的用户画像有了数据的支持和具像化的丰富，基本上满足对可信服的用户角色的PERSONA7个要求。但对于微博这个用户基数比较大的产品来说，这一用户画像还有再待提升的地方，首先微博用户的使用场景还需要根据用户群进行进一步的细化研究，了解不同用户在不同情境（交通过程中，上班途中，睡觉前）的典型使用行为与习惯，在不同情景下，不同典型用户操作行为和习惯有什么不同。同时我们按照职业分类用户的方法可能还存在问题，还需要研究不同行业人士、不同职业背景、不同身份地位的人的行为，细化专业人员与专业行业，以使用行为模式为特征提取共性，探索在不同典型场景开发出新需求点的可能性。

参考：
QQ UED用户体验之旅；
http://www.itongji.cn/article/0S02G22013.html；
http://www.itongji.cn/article/012115522013.html

扫二维码或微信搜索“大有青年”关注公众号

图片发自简书App