从1984年开始,苹果电脑减少了对用户的询问,在随后的时间里,这个趋势也越来越明显。人们对此一直牢骚满腹——因为对一些用户来说这是便捷省事儿,但对另一些人来说这是对选择权的侵犯。(对比一下iOS 和 Android系统就能看出这一点)史蒂文·乔布斯曾说iDVD的界面只需要一个“BURN”(烧录)按钮就足够了。苹果于1997年推出了Data Detectors,协助读取手机短信和数据中关于预约安排、手机号码或地址等相关信息。如今已经能够帮你做到这些事情的AI技术还算AI吗?AI是不是一套标准算法?这个问题重要吗?对于只追求操作方便快捷的用户来说,这些问题有什么意义?

这似乎也是苹果看待其设备上AI的方式。在iOS 10中,苹果将AI渗透在界面的点点滴滴中。有时做到了推陈出新,比如图片搜索这个功能,但大部分情况下它只是旧版本的升级或是在现有应用上锦上添花罢了。苹果确实似乎只将AI看成“一种计算”。

同时(这也引起了广泛关注)苹果一直直言不讳地呼吁公司不应该收集和分析用户数据,并公开宣称苹果不会提供任何此类服务。人们对此众说纷纭。类神经网络的一个特点就是它的训练跟使用是两件截然不同的事情。你可以在“云”上使用大规模的图像集训练出一个类神经网络,然后将其加载到一部手机上,这样一来,只通过手机也能使用本地数据运行该网络。举个例子来说,谷歌翻译就是这样在手机上运行的——系统预先在云里接受过训练,但是分析是在本地进行的。苹果声称它也将此技术运用到了苹果照片(Apple Photos)上,但是问题是用户不需要拿苹果有关“山”的图片来训练系统识别什么是山。他们可以用自己的。苹果的应用程序界面允许开发者用图形处理器运行未经训练的类神经网络。对于其他服务则实行“差别隐私”,即:使用加密来混淆数据,这样一来即使数据被搜集到手并进行大规模分析,(理论上来说)也找不出数据所对应的用户身份。

“我理解苹果在此事上的立场,但也捕捉到一丝诺基亚/黑莓当初拒绝智能手机一事的影子。”

— Benedict Evans (@BenedictEvans)

苹果在诸多领域处理此事的迥异方式和科技手段都让人无法轻易将其归结为“苹果在此事上失算了”这一定论。显而易见,苹果决定在此事上有所克制,但是尚不清楚有多少服务将受其影响,影响程度又有多深。也许苹果需要用用户的照片来训练手机识别山的图像,但是如果要识别每个用户孩子的照片呢?这一点能够在手机上做到吗?该训练数据升级更新了吗?谷歌训练数据比苹果的好多少?谷歌又将从中获益多少?

撇开用户隐私不谈,我们来看看大局。AI领域发展迅猛,很难说花落谁家,也很难确定何为商品,是非的差别界限又在何处。尽管多数围绕AI此类科技产生的主要电脑技术已经发表并开源,但是操作起来并不繁琐——科技不一定都能成为商品。这与苹果设计芯片的方法大有不同。自从2008年(可能还要早)收购了PA Semi,苹果就将手机中SOC的设计作为基本的技术核心和竞争优势,现在又为手机设计独家的芯片,该芯片无疑在市场上独领风骚(在推出VR产品时这将成为苹果的巨大优势。)但仍说不准苹果有没有把AI放在同等地位上。

(愤世嫉俗一点来说,这里还存在一个“默认力量”的问题。)如果谷歌图片在物体分类上永远领先苹果图片10%-15%,那么用户在相同的精准度之外,还能够意识到其他细节差别吗?苹果手机用户使用苹果地图的数量是谷歌地图的三倍,但论性能,无疑是谷歌地图更佳。所以,在面对苹果诸如Photostream之类的产品竞争时,谷歌的领先优势会不会被抵消目前还不能下定论。

苹果和谷歌的一个共同发展思路就在于,其平台上的应用是否最终会将AI技术全面地应用在API和开发工具中?比如在地理位置这个问题上,15年前,手机定位功能还属于异想天开,移动通信公司对于“位置服务”进行了收入预测。GPS和WIFI查找服务使得位置服务(一个询问位置的应用程式介面呼叫)不再成为电脑需要向你询问的问题了。尽管定位成为了API——一项数据库查找服务——也是另一个条件句,它所提供的服务却延伸极广。有像Foursquare(一家基于用户地理位置信息的手机服务网站)这样的产品,该种产品只用于实时定位。在其基础上进一步发展的是Uber或Lyft这样的应用——定位服务对于使用Lyft打车时提供地理位置比较有用,但绝非不可或缺的(当然对于司机的应用定位服务还是至关重要的)。在此之后发展出了诸如Instagram一类的应用,定位服务对此类应用来说只是个锦上添花的选择。它可以自动定位一张图片的位置,但却无关紧要,因为用户也可能感觉无所谓。(与之相反的是图像识别功能,这个功能让Instagram彻底改头换面。当然了,在为训练数据筛选不同种类的咖啡时可要仔细研究一下分类学了)。它还在某航班APP之中有所应用,在你搜索航班的时候询问你所在的位置,但这个功能也只是锦上添花,而非雪中送炭。

无独有偶,正如地理定位服务带来的巨大变化一样,只有机器学习才能让某些产品变成可能,无论是用于图像、语音还是别的方面。(没有人只看到定位服务就能想到“这个服务可能改变出租车行业的格局。”)。机器学习也会让某些产品如虎添翼,但离了它也未尝不可。对于另一些产品来说机器学习则无关紧要(现在所有人意识到这一点了。)所以,苹果提供了图片识别服、智能键盘和日历程序中的会议场地建议服务,所有这些都说明了苹果将AI技术撒播在各种服务之中,与上述的地理位置定位服务如出一辙。同时,就跟所有电脑科技的工具一样,还有一些科技即将被转化为商品,另一些则是无法转化成商品,至少现在还不行。

迄今为止所有的发展动态都显示出AI的影响力类似某种T型模型:竖轴代表AI技术自身日新月异的变化,横轴代表AI技术对全盘格局的大变革(一如定位服务的影响)。但是还有另一模型可以用来描述AI技术的影响,在该模型中AI成为手机本身的新的技术层,它改变了交互模型、从应用筒仓里重新定位所有服务,形成新的运行时间。AI改变了手机的电子聚集层吗——它提高了应用的效能,但是它改变应用的本质了吗?这相较于苹果发明的模型来说,有更大的不稳定性。
显而易见,在某些情况下对此问题的回答是肯定的。退一万步来讲,搜索定义的结构性变革改变了整个行业的竞争格局,降低了谷歌普通搜索跟业内竞争者之间协调的稳定性:用Yelp搜索的问题可能在谷歌那儿属于自动提问的范畴,甚至是无需提问就能得到回答。这就是减少提问的另一个例子——无需用谷歌搜索引擎给你提供的成百上千与该问题相关的答案,它试图自行找出答案,甚至在你提问之前就解答这个问题。

更有趣的是,一项Uber或Lyft请求,或是在Opentable(目前美国领先的网上订餐平台)的预订都能在语音界面通过一项应用重新组合得出建议或是解决方案,比如在地图应用上就都能实现。一个应用如果只有一个按钮,只能询问一个简单的问题,就能够轻而易举地形成请求,无论在谷歌助手、Siri, 苹果还是谷歌地图上都是如此。事实上,可以将苹果把API嵌入苹果地图、Siri、Messenger等等应用的举动视为对谷歌的一个反制。如果谷歌自动就能给你找到影院、饭馆或宾馆,那苹果就能通过倚靠开发者解决同样的用户问题。谷歌Allo可以向你推荐一个餐馆,苹果的iMessage则可以为你提供Opentable的插件。

不过,未来语音界面的服务范围能有多广呢?没错,你的确可以通过语音命令Siri或者Google Assistant帮你刷新Instagram首页的新鲜事。但是试想,为什么语音问答形式的用户界面(UI)更好?为什么谷歌的机器学习界面在语音方面比Instagram开发的chrome更优秀?机器学习也许的确能够优化Facebook的 newsfeed(信息流)功能,但是就一对一和一对多的沟通渠道来说,机器学习能消除它们之间的差别吗?为什么通用渲染层比特殊目的渲染层更好?

有人可能会提出用再连接来实现一个更方便快捷的界面显示——主屏可以同时显示你的文档、电子邮件和当日预约会议,免去了挨个打开应用程序的麻烦。也许‘你接下来想打开哪个app’这个问题就不必存在——因为出租车已经预约好了、会议邀请也接受了、费用报告也已批准了。早在机器学习出现之前,Facebook在交互环节就是这么干的——看哪些分享帖、跟谁对话、读什么新闻。但手机上不只这一项功能。再次强调,我们研发的系统再怎么智能,它也不能做到真正意义上的了解你,它也无法了解你的所思所想或者完全掌握你app里面的所有信息。甚至可以说,要实现上述所有内容目前来说还是痴人说梦。因此,谷歌能够将你手机上的一切行为统一归入一个基于AI的表层科技的这种想法,完全就是《王牌大贱谍》中“邪恶博士计划”的再现——这未免是聪明过了头,因为这种技术(邪恶博士的激光武器)根本不存在。

对我来说,要谈论AI技术大爆炸就得首先弄清楚两件事儿。第一是“AI”这个广义的概念并不意味着我们拥有点石成金的魔法。的确,我们已经研发出了一系列新的先进工具,可以解决许多以前想都不敢想的问题,但要注意,AI可不是解决所有问题的万能钥匙,通过分析庞大的数据池也不一定能收获独到的见地,因为数据可能有误、见解也不一定正确。 第二是AI领域的增长和变化的速度相当快,以前不能实现的事物如今成为了现实,新事物、新公司如雨后春笋般接连涌现。我们有令人惊叹的发明也有一文不值的垃圾,我们心怀疑虑,却也高瞻远瞩。总有一天AI将无处不在,而你甚至都不会注意到它。在这些使用AI技术的公司中,一定会出现下一个亚马逊。

© 2016, 微能创投加速器. 版权所有.

微能创投加速器

发布者: 微能创投加速器

微能创投加速器致力于联合中国顶尖的众创空间合作伙伴,用标准化的全球成功实践打造中国最大的加速器网络。