Tag: Big data

APP开发者们,小心糖衣炮弹!

随着互联网的日趋成熟,这一领域的动态也越来越好理解。部分公司掌控着95%的社交媒体,互联网市场趋于饱和封闭,垄断也逐步加深。 “大数据”这个术语在过去15个月里被频频提及。本文所说的大数据主要指用户数据,大多是从社交媒体中获取的可以用来开发其他app和相关业务的数据。 举几个例子吧,比如Facebook:开发者、产品设计师、企业家等人想要分析的数据是姓名、图片或分享次数。而Snapchat则是分享或发送了多少东西;Instagram里主要是用户、点赞数或评论。而对Tesla而言,汽车位置、能源消耗等信息才是主要数据。这样的例子不胜枚举。由此看来,现代的社交网络是建立在公开数据交换之上的。 我经常被问到的一个问题就是:好APP是怎么做出来的?答案很简单:数据。具体点来讲:用户和他们各自的元数据。用户即是数据。没有他们,不管你的APP多花哨,也等于零。就是这个道理。 而接下来的问题就是“那我要怎么获取用户呢?” 这可是个价值数十亿的问题。现有的社交网站想让你相信用了它们的平台你就能用户暴涨。真希望这是真的。但我要澄清的一点就是,用户是买不到的。你不能期待通过现有的社交网站来达到影响和利用用户的目的。用户们早已被层出不穷的新鲜事物和新出的软件弄得审美疲劳了。因此,分销(比如发掘和保留用户)才是推出一个成功APP最艰难的部分。 作为开发者,我们习惯于深入分析Facebook上的社交图片,并能用复杂的方式将有用的数据插入各种网站跟APP产品中,其中最关键的一点在于我们能够无视带宽的限制请求大数据集。但是,就算大公司同意你使用它们的数据,也不代表这就是全部真相。 过去几年里这个局面发生了翻天覆地的变化。不幸的是,阐述这个转折的最好方式就是剖析Zynga的大起大落。当Facebook开放了自己的API,让用户能够深入访问Facebook相册的数据时,Zynga跟其他公司一样争先恐后地抓住了这次机会,直接通过Facebook的Graph API建立了游戏业务,风靡一时。随着时间推移,Facebook 开始改变了开发者使用具体数据的模式,于是一夜爆红的Zynga 这一次也迅速衰落了下去,而且是一败涂地。许许多多的公司无论规模大小,都重蹈了Zynga的覆辙。 当今的大型社交数据玩家用无穷无尽的诱惑与糖衣炮弹般的许诺吸引着你,而你就像个身处糖果店却身无分文的孩子一样沉浸在虚假的欢乐中。如今的大企业API都声称能够提供高质量又高速的数据交换或深入渗透相册的机会。但是,正如老话所说,魔鬼在于细节,遇到这种说辞你可要当心点。当然使用API能够迅速有效地获取数据,但是一旦达到API的临界值,数据的供给就会从滔滔不绝的黄河水迅速枯竭成水龙头里滴落的细流。如果你的业务完全依赖于从大公司API里的检索数据,那么面对这种状况你将不堪一击。 同理,你也可以从他们那获取图片集,进行深度分析,但要是如果挖得更深一点你就会发现,他们给你提供的有用信息(包括具体位置、任务、点赞数、分享等)只占百分之一到三。仅仅得到用户在APP上全部活动的一小撮信息又有什么用呢? Zynga 和其他同样缺乏远见的公司向我们展示了如果你将自己的业务建立在别人的生意上,那你就会受制于人、任人宰割。他们可以并且也一定会改变你使用数据的方式,如此,你的业务就会如履薄冰、摇摇欲坠。 不要让社交功能成为业务的唯一支柱。 过去那段可以无限制地快速请求数据、深入渗透用户数据的光辉岁月已经一去不复返了。随着互联网和社交媒体行业的成熟,现在有价值的信息成了“围墙内的花园”。核心业务在于保留用户数据,而依托该数据进行营销和广告推销的能力是致胜的关键。当然了一些公司在广告推销上要强于他人,但是花钱购买稳定的数据源这种商业模式是不好用的。毕竟庙小容不了高僧,市场规模也支撑不了这种模式。 那么现在开发者该何去何从?如果能够联系地看待行业的演变进程,你仍会发现无数商机。你不能简单的想:“我有一个好点子,利用现有的广大客户群就能一鸣惊人。”大公司的API再也不给你这个机会了。就像近年来Uber、Pinterest 、Snapchat的脱颖而出给了我们一个启示:创客们需要以一个新的群体视角进行思考,一种更垂直更专门化的方式——做一个“怀揣共同利益诉求的群体”。 不要让社交功能成为业务的唯一支柱,而是把它作为一个特色。只考虑社交而不顾其他无异于茕茕孑立,只会让你的应用以最快的速度被淘汰。

/ 2016年7月21日

大数据时代,你的数据策略是什么?

在过去的十年中,初创企业和大企业都都投入了大量的人力物力收集、分析庞大的数据。一些企业用数据来调整完善原有产品,一些将数据作为产品本身的基石。 而如果一家公司想要在大数据方面有所作为,那么数据越独特,效果越好。众所周知,现在算法本身已经商品化了,所以如果公司想要做公开可用的数据方面的业务,恐怕没那么保险了。 那么数据都有哪些类别?它们分别在“独特性”程度上有什么等级差别?以下是四种主要的数据分类(按照独特性依次递进): 1. 公开可获得数据 只要有API,这种数据在网上随处可得。类似数据如谷歌地图和公开政府数据等。 2. 原始公共数据 这种数据对公众开放,但是需要做大量的收集工作(数据整理、清理工作)才能使用。因此,它们只限于那些具备技术知识和资源的人使用。 3. 用户私人数据 这种数据是由用户创造和分享的,并能用网站的终端服务收集使用。这种情况下,用户可以选择要不要分享自己的数据,无论是亚马逊网站上的浏览记录、Facebook上的帖子还是把银行账户连接到Mint.com上。但要记住虽然这是私人数据,但是因为用户可以在多个平台上分享同一种信息,所以该数据不一定就是专属的。 4. 用户专属数据 这种行为数据会跟踪记录用户与产品/网站互动的行为特征。一般会在后台捕捉到这种数据,而且仅限于特定的网站——正因如此用户专属数据才价值非常,并且作为独家的反馈环路,可以用来完善产品。比如可以通过跟踪记录用户的搜索行为,之后为他提供更精确的搜索结果。(下文将展开这一点) 公司是怎么利用这些数据的? 下面两个实际案例将展示公司是如何利用不同“独特性等级”数据的。 案例一:谷歌 谷歌最初利用的是原始公共数据(第二类),但随着其产品的发展成熟,他们获取了用户专属数据(第四类)。他们利用数据来完善用户的搜索结果,甚至让结果变得个性化,最终创造出来顶级的产品。他们成了搜索引擎的代名词。而越多人使用他们的搜索引擎,他们获取的用户数据越多,就可以继续用数据强化自己的优势。 谷歌最初能够用公开可获得数据建立初始产品是因为当时没有虎视眈眈的竞争对手与其争抢市场。于是谷歌建立了一个日常使用的产品,从而获取了庞大的专有数据来促进自身产品发展和业务增长。 案例二:亚马逊 亚马逊采用了一定手段激励用户分享自己的产品评论(第三类)中的私人数据。但对于亚马逊而言,真正的增值是当你将这些评论(第三类)与行为数据(第四类)结合在一起时产生的价值——像用户购买过的商品、用户浏览过但没有购买的商品此类信息。这让亚马逊能够给出真正个性化又中肯的推荐。 亚马逊这种等级的推荐系统可复制吗?答案取决于个人品味和数据点的多少。在我看来,为电影建一个推荐系统要比大型商品市场容易得多,因为人们对电影的品味要更趋于主流,数据集也更小点。此外,如果只有评论而没有交易数据(如Yelp),数据集的价值也不大。 这能给你什么启示? 可以借鉴的有几点: 围绕公开可获得数据展开业务的初创企业要格外注意啦,你需要推出一个一流的日常使用的产品并迅速积累用户数据,用它提升产品质量,构建自己的品牌,这样才能立于不败之地(如谷歌的案例)。 获取独家数据固然重要,但能将其跟用户数据结合起来则更重要。产品增值部分就取决于服务的个性化程度和数据集的复杂性。 最后一点,真正的数据网络效应可以通过第三和第四类数据获得。

/ 2016年7月21日