属性
属性的概念
在数据分析平台中,属性根据主体的不同分为事件属性,用户属性以及物品属性三种:
事件属性:以事件为主体,与事件呈隶属关系,随事件上报过程一同上报。事件属性的丰富程度直接影响事件的数据体现质量,例如支付订单事件,常规会携带订单号,订单金额,商品名称等属性,如果不携带这些属性,那么我们就只能知道用户支付了一个订单,却不知道用户支付了什么,无法进行下钻分析。
用户属性:以用户为主体,与用户呈隶属关系,主要用来丰富用户的数据形象,我们可以用标签的概念来理解用户属性,例如我们如果想要记住一个人,我们需要记住姓名,性别,年龄层次等基本属性,如果对这个人印象深刻,可能还会记住他的家乡,爱好等信息。可以说用户属性的丰富程度直接影响了用户洞察的准确程度。
属性的存在在数据分析的过程中至关重要,我们可以用一个业务中存在的故事来解释属性的重要性。
业务实例
一个个体经营者主要从事线上销售农产品的业务,业务开展的如火如荼,但最近一个月总是接到大量的退货订单,而且在线上留下产品质量差的差评,严重影响业务。
检查了自家的产品,并没有大量的不合格现象,经营者觉得这种集中式的差评不正常,这时该怎么解决这个问题呢?
需求理解
这是个很清晰的需求:为什么最近一个月多了这么多差评?
差评的主要争议点都在于产品的质量差,但是检查过后发现不存在质量问题,那为什么用户会留下大量的差评呢?
问题解决
- 这些用户都是正常用户还是虚假用户?
首先我们对留下差评的用户进行分析,着重关注首次付费时间,会员等级,注册时间等数据,我们发现,这些指标的数据都很正常,没有集中式的痕迹。这说明留下差评的用户并非集中式注册用来进行恶意竞争的虚假用户。
- 这些用户是否存在地理位置上的集中痕迹?
接下来,我们开始分析用户所处的地理位置,如果存在恶意竞争的话,那么这些留下差评的用户在地理位置分布上可能存在一定的集中痕迹,然而数据查询结果显示,这些用户都分布在该个体经营者的主营市场范围内。
- 这些用户是否存在其他的集中式特征?
难道真的是产品出现了没有发现的问题么?就在我们自我怀疑的时候,我们在数据上发现了一个不明显的特征,通过对这些用户的订单数据进行分析,我们发现,这些用户从末次消费到倒数第二次消费的时间间隔都超过了三个月,有的甚至达到半年之久,也就是说,这些用户本来是已经流失的用户,却在最近一个月内开始“主动回归”,到这里,我们怀疑部分流失用户的数据发生了泄露。
根据这次发现,我们直接开始查询用户的MAC地址,果然,虽然恶意竞争者伪造了用户的IP地址,让地理位置分布均匀,但MAC地址仍然存在明显的集中特征。这说明,恶意竞争者从不明渠道获取了经营者的流失用户账号数据,以其为武器实施恶意竞争行为。
总结
这是一个现实中困扰很多线上经营者的问题,对于用户来说,本身没有分辨真假差评的能力,最简单有效的办法就是放弃这家店,可是对于经营者来说却是实实在在的损失。
同样的属性分析策略还广泛存在于广告投放的反作弊策略中,在反作弊的过程中,不仅仅是IP地址,MAC地址等常规属性,其他诸如鼠标位置坐标,屏幕尺寸,浏览器型号版本等属性都是反作弊策略的主要武器。
综上,无论是用户洞察,还是业务分析或者异常处理,在这些过程中,属性数据都起到了举足轻重的作用。