在过去的十年中,初创企业和大企业都都投入了大量的人力物力收集、分析庞大的数据。一些企业用数据来调整完善原有产品,一些将数据作为产品本身的基石。

而如果一家公司想要在大数据方面有所作为,那么数据越独特,效果越好。众所周知,现在算法本身已经商品化了,所以如果公司想要做公开可用的数据方面的业务,恐怕没那么保险了。

那么数据都有哪些类别?它们分别在“独特性”程度上有什么等级差别?以下是四种主要的数据分类(按照独特性依次递进):

1. 公开可获得数据

只要有API,这种数据在网上随处可得。类似数据如谷歌地图和公开政府数据等。

2. 原始公共数据

这种数据对公众开放,但是需要做大量的收集工作(数据整理、清理工作)才能使用。因此,它们只限于那些具备技术知识和资源的人使用。

3. 用户私人数据

这种数据是由用户创造和分享的,并能用网站的终端服务收集使用。这种情况下,用户可以选择要不要分享自己的数据,无论是亚马逊网站上的浏览记录、Facebook上的帖子还是把银行账户连接到Mint.com上。但要记住虽然这是私人数据,但是因为用户可以在多个平台上分享同一种信息,所以该数据不一定就是专属的。

4. 用户专属数据

这种行为数据会跟踪记录用户与产品/网站互动的行为特征。一般会在后台捕捉到这种数据,而且仅限于特定的网站——正因如此用户专属数据才价值非常,并且作为独家的反馈环路,可以用来完善产品。比如可以通过跟踪记录用户的搜索行为,之后为他提供更精确的搜索结果。(下文将展开这一点)

201607212

公司是怎么利用这些数据的?

下面两个实际案例将展示公司是如何利用不同“独特性等级”数据的。

案例一:谷歌

谷歌最初利用的是原始公共数据(第二类),但随着其产品的发展成熟,他们获取了用户专属数据(第四类)。他们利用数据来完善用户的搜索结果,甚至让结果变得个性化,最终创造出来顶级的产品。他们成了搜索引擎的代名词。而越多人使用他们的搜索引擎,他们获取的用户数据越多,就可以继续用数据强化自己的优势。

谷歌最初能够用公开可获得数据建立初始产品是因为当时没有虎视眈眈的竞争对手与其争抢市场。于是谷歌建立了一个日常使用的产品,从而获取了庞大的专有数据来促进自身产品发展和业务增长。

案例二:亚马逊

亚马逊采用了一定手段激励用户分享自己的产品评论(第三类)中的私人数据。但对于亚马逊而言,真正的增值是当你将这些评论(第三类)与行为数据(第四类)结合在一起时产生的价值——像用户购买过的商品、用户浏览过但没有购买的商品此类信息。这让亚马逊能够给出真正个性化又中肯的推荐。
亚马逊这种等级的推荐系统可复制吗?答案取决于个人品味和数据点的多少。在我看来,为电影建一个推荐系统要比大型商品市场容易得多,因为人们对电影的品味要更趋于主流,数据集也更小点。此外,如果只有评论而没有交易数据(如Yelp),数据集的价值也不大。

这能给你什么启示?

可以借鉴的有几点:

围绕公开可获得数据展开业务的初创企业要格外注意啦,你需要推出一个一流的日常使用的产品并迅速积累用户数据,用它提升产品质量,构建自己的品牌,这样才能立于不败之地(如谷歌的案例)。

获取独家数据固然重要,但能将其跟用户数据结合起来则更重要。产品增值部分就取决于服务的个性化程度和数据集的复杂性。

最后一点,真正的数据网络效应可以通过第三和第四类数据获得。

© 2016, 微能创投加速器. 版权所有.

微能创投加速器

发布者: 微能创投加速器

微能创投加速器致力于联合中国顶尖的众创空间合作伙伴,用标准化的全球成功实践打造中国最大的加速器网络。