人工智能(AI)的过去、现在和将来

人工智能(下文简称“AI”)领域在过去几年中发生了翻天覆地的变化,技术开始发挥其魔力,发挥的作用也越来越大。新技术不断开发,尤其在机器学习(简称ML)领域更是呈现百花齐放的态势。尤其是当技术能够满足人们某些长期性需求时,它的作用就会被无限放大。比如,在技术的帮助下,目前某些图像识别、语音识别、自然语言处理的错误率已经大大降低,与人工错误率相差无几。

当你对着手机说出:“显示我家狗狗在海滩的照片。”,这时,语音识别系统会将音频转换成文本,接着自然语言处理会识别出你的照片查询请求,将其发送到相关照片应用程序。该应用程序的机器学习(ML)系统早已标记了你手机中所有包含“狗”和“海滩”的照片,此时只需在数据库中查询符合请求的标记图片即可。怎么样,神奇吧!

这里就牵涉到需要注意的两点—— 一是你用语音代替了查询对话框,二是对话框的查询能力达到了前所未有的程度。这两个功能是独立开发的,但它们的实现都离不开机器学习。必须说,最有趣的部分不在语音,而在查询。事实上,能够做到这一点,背后相当重要的结构性变化绝不仅仅在于计算机有能力找到这张“狗狗在海滩”的照片,而在于计算机自己通过学习,研究出了找到它的方法。机器的学习能力如何体现?举个例子吧,比如你把上百万张照片存进手机里,一半标记着“这里面有只狗”,另一半标记着“这里面没有狗”,计算机就能通过学习从而研究出“狗”应该是什么样子的。

现在我们经常会使用到数据分析工具,其工作量之庞大,通常会耗费你数小时、甚至数周的时间。你通常需要专人负责分类梳理庞大的Excel表格,然后再在海量的表格数字中找到自己要的结果。夸张点说,如果要分析一个百万行、上千列的Excel表格一定够你喝一壶的。然而,机器学习让海量又枯燥的数据分析实现了全面自动化——不只是可以提供搜索,还能通过正确的搜索“姿势”,更快地帮你找到想要的结果。

其实,这些令人耳目一新、激动不已的语音或图像识别功能只是技术最外化的表现形式之一,它还可以广泛应用于音乐推荐系统、网络安全模式或自动驾驶汽车等。我是说也许。

这对谷歌来说可谓是根本性的转变。狭义上来说,图像和语音识别技术的应用意味着Google在智能问答方面取得长足进步,未来Google能更好地理解用户问题和标记音频、图像、视频。但更重要的是——它意味着Google在回答用户问题方面有了巨大突破,能够回答的问题数量和答案质量都远超之前。因此才有了我们在Google2016年网络开发者大会(I/O)上看到的一幕——在该次大会上我们可以明显看到Google对类似技术开发的高度重视。当然,所有这些技术都将在未来以不同的方式、在不同程度上得以应用,就像AlphaGo的出现就是各种技术一同催生的结晶。

19091014_fkQN

此次会议上尤其值得关注就是Google最新发布的“谷歌助手(Google Assistant)——一项人工智能语音助手服务。谷歌助手基于语音和文字搜索,支持用户和机器双向连续对话。人工智能程序可以通过语音识别,分析你的某些习惯性行为来更好地理解问题,并推测出你即将可能要问的问题。比如在实际使用中,你可以问它“泰姬陵在哪儿?”,然后接着问“它有多久的历史?”,Google Assistant可以根据前后对话分析出“它”就是指的“泰姬陵”;你也可以问它“今天晚上要看哪部电影?”Assistant就会给出它认为你可能感兴趣的电影,并贴心地送上今晚的电影票预定信息。但这还只是冰山一角——真正让人吃惊的是,谷歌目前对海量的数据语料已能很好的理解吸收,对五花八门的提问也能很好的应对,而这还只是刚刚开始。

虽然微软错失了整个移动端领域,但目前也正利用先进技术,着力开发基于云的工具和属于微软自己的应用程序。Facebook和IBM也是一样。任何手握海量数据,并以此牟利的公司都会在未来某一个时刻谋求转变,届时又将会出现一大批产业链上的新公司。

另一方面来讲,虽然我们有魔法,但也还不足以变出一个HAL9000(影片《2001太空漫游》里人类最高科技的结晶,科技文明发展的顶端)——我们还没有研发出一个人类级别的人工智能(俗称AGI 强人工智能)。我们也还不能解释人类智慧究竟是我们已有的技术和想法的总和,还是包含什么别的东西。相反,还有一大堆工具有待人类来开发。比如,我之所以可以用语音指挥Google Assistant或Siri显示我家狗狗在海滩的照片,是因为谷歌和苹果的工具都可以进行绑定。例如,Google Assistant或Siri如果没有添加Opentable(美国领先的网上订餐平台)的应用程序编程接口(API),就无法提供预定餐厅的服务。这也是目前为止Siri、谷歌助手或任何聊天机器人面临的最重大的挑战——你能问什么、不能问什么。

这让我想起了当时课上关于到底什么能算作AI、什么不能算的争论。我们当时开玩笑地说:“这算AI吗?我看不过是一堆条件句啊!”“每当我们弄懂了AI其中一小部分,对我们来说这部分就不再神奇了,我们常感叹说‘啊,这不过就是一堆数学计算得出来的结果而已嘛!’”“AI就是那些将尽未尽之事。”

我们这些笑话话反映出两个问题。第一,人工智能本身在很大程度上是超越‘条件句’的存在,至少究其概念来说是如此。第二,从啧啧称叹到司空见惯是所有科技的必经发展轨迹,这不是说科技时间长了就没用了,而是人们的新鲜感丧失了。也就是说,科技在某种意义上是那些存在时间不长的东西,比如我们不会把习以为常的电力称作一门科技、也不会把随处可见的洗衣机叫做机器人。所以下次别问“这算是人工智能还是计算结果?”要问“这是科技,还是只算工程?”
我认为关键就在于埃里克·雷蒙的法则:一台电脑不应该向用户询问那些可以自动完成的检测、复制和推导——尤其是推导。一种看待电脑在过去50年里发展历程的方法就是研究电脑删除了多少需要询问的指令,又新添了多少能够询问的问题。上述许多问题不一定跟用户看到的是一模一样的,但情况确是如此。

电脑也不再询问下列如是的问题了:

该文档要存在哪里?
你需要重装硬盘吗?
你想要退出该程序吗?
内存不足,你想删除哪些照片?
你手机的PIN码是多少?
该单词的正确拼法是什么?
页码是多少?
你希望看到朋友们的哪些更新?

我有时候会恍然,作为早期科幻小说的忠实粉丝,我意识到虽然它们大部分没有涉及计算机的内容,但是却写了很多“自动化”的情节。如果你仔细浏览一下早期的那些科幻作品,基本上没有类似AI的的先进设备(其中一些有可能在未来得到普及),但是有一大部分都是“自动化”的。这就是HAL 9000中的AI的定义——自动化导航、自动化拼写检查、自动化图片搜索或语音识别、自动化餐馆预订或打出租……上述的方方面面都是电脑不需要再向你询问的行政事项,因为电脑已经获取一定的人工智能,可以自动为你提供相应服务。

© 2016, 微能创投加速器. 版权所有.

微能创投加速器

发布者: 微能创投加速器

微能创投加速器致力于联合中国顶尖的众创空间合作伙伴,用标准化的全球成功实践打造中国最大的加速器网络。