关注IDG资本微信

新闻中心

IDG牛奎光(Justin):在市场成熟度仅为20%的人工智能领域拼杀,什么样的创业者可能胜出?

IDG资本 牛奎光
2016.04.25

消费升级时代已然到来,共享经济越发成为普遍存在,企业服务到处填补低效漏洞,VR使用场景尚待验证何处可行,AlphaGo之后的人工智能探索商业结合,文化娱乐产业遍地结果。原来你对事物更精彩的渴望,正有一群人在不分昼夜地打造它的模型。

本文来自网易创业Club的“2016十问风投”第六期——专访IDG资本合伙人牛奎光,探讨人工智能领域的投资逻辑。

相关视频由「网易创业Club」联合「即刻视频」出品,详情请点击:http://v.qq.com/boke/page/x/0/c/x01969obgnc.html

话题开始前,牛奎光讲了一个小故事。20世纪90年代末,初入清华计算机系不久的他,“象棋下得还不错”。某天,一个参加奥林匹克竞赛的同学到寝室聊天,问他:“关于象棋你是怎么思考的”,牛奎光于是随便聊了聊。一个星期后,这个同学已经编写出了一套象棋程序,牛奎光与他对战,下输了。而此前,那位同学基本不懂象棋。

也是在牛奎光入学清华的1997年,对战IBM“深蓝”的世界国际象棋冠军加里·卡斯帕罗夫以1胜2负3平成绩败北。

相对而言,象棋招数变化相对有限,对计算机的搜索域要求相对简单。而围棋如果想把每一种可能性都计算出来,要复杂得多。

所以直到不久前谷歌AlphaGo对弈韩国棋手李世石,并以4:1绝对优势胜出,舆论惊呼“人工智能时代来了”,媒体探讨“人工智能怎么样与商业结合”,语音识别和图像识别又到了什么阶段,公众对人工智能领域的创业者给予了更多的关注。

现在来听听IDG资本合伙人牛奎光怎么说。

牛奎光,IDG资本合伙人。专注于企业服务、安全、数据驱动的应用和人工智能方面的投资,投资案例:纷享逍客、同盾科技、金山云、安全狗、脉脉、Teambition、SenseTime、铜板街、找钢网等。

(以下以牛奎光自述形式,网易创业Club整合梳理其对人工智能的方向判断和投资逻辑)


 人工智能和商业结合的时代正在到来

“人机大战”使大家对人工智能有更广泛的认识,但对于创业者来讲,还要想到人工智能怎么跟商业结合,怎样应用到一些场景中去。目前来看,大多是从接收信息和给出信息的角度进行考虑布局——这是人最常见的两个活动。

人对外输出信息最主要靠“说”,这是他表达自己的最快方式。而接收信息最快的方式是用眼睛“看”。人工智能最初就是在这两个地方开始得到很好的应用。

我认为,主要是两件事促进了人工智能的发展进程:一是互联网的出现使数据变得越来越多,并且大量数字化地积累在网络上。二是后来的机器学习跟之前的方法相比,有很大的进步,设计算法其实是让计算机处理信息的组织,从生物学上向人脑信息处理方式学习。人脑目前可以说是计算效率最高的一种方式——吃几片馒头就可以工作了,能量消耗也很少。这就使一些简单智能的工作慢慢地可以由计算机去完成,这是所谓的“人工智能热”背后的大背景。 

1. 语音识别:大公司必争之地

人工智能取得进展的第一个领域是语音识别。

语音输出之后,怎么更好地被计算机理解,自然成了人工智能发展过程中第一个比较重要的事——即语音识别。

而反向问题,得到一段字后,如何将它转化为语音,这是一个相对比较简单的事情,需要解决的只是读的过程中哪个字和哪个字连结得紧一点,或者稍稍带点感情。这里包含两个问题,一是如何把语音变成某个字或某个音,二是自然语言理解的问题,这个比较复杂。比如两个人如果有过很长时间打交道的经验,那么在交流时,其实有些话不用讲出来便可以互相理解,但这些话在没有语义的情况下,甚至第三方都很难理解,更不用说机器了。

但这个事情本质上还是一维问题,就是从声音到文字,所以也相对较容易为人工智能技术解决。去年机器学习的发展使整个语音识别有了较大飞跃。

之前整个语音识别技术还没有到特别实用的阶段,但是今天在一些垂直领域,比如有些导航地图,因为POI(Point of Interest,信息点)可能就是那么几十万个,所以容易基于某地理位置加上之前提高了准确率的模型,再来识别,准确率就会大大提高。

包括有些购物网站,因为它的SKU(Stock Keeping Unit,库存量单位)数量尽管多,但也相对有限,所以通过语音搜索的准确率也容易大大提高。

这些都是在之前技术进步的基础上,加上行业应用,到目前已经达到了民用级的阶段,我相信在不久的将来,在这个领域可能也会有比较好的突破。

在语音识别领域,大公司的技术积累会比创业公司好很多,所以给创业型公司留的机会相对来讲要少一些。但还是能举出例子来,像科大讯飞就是做语音做起来的,也做得非常好,又比如云知声,一直做语音服务,做得也还可以。就看时间会给它们留多少来跟巨头竞争。

语音的通用问题可能还是大公司解决得比较好,创业公司相对比较难,但它可以在一些具体领域实现突破,比如在具体行业里,有一些行业专属库,涉及特珠的词或特珠的交流方式。但在通用型应用上,基本是大公司的天下。

现在我们输入还是需要键盘,说明这个问题还没有很好地解决。什么时候我们输入不用键盘了,直接用语音来输入,这个时候才说明到实用程度了。但是现在技术才刚刚开始,找到具体的应用点非常重要。如果能把这件事情做到足够成熟和产品化,是件巨大的事情。因为这相当于掌握了输入入口,这也是大公司必争之地。 

2. 图像识别:刚迈到走向成熟的坎

人工智能取得进展的第二个领域是图像识别。

图像基本上是人接收消息最快的方式,在微信里听语音可能要15秒,但是看字的话,有可能扫一眼就差不多了,因为它是二维的,你甚至可以说是有纵轴、横轴,甚至还有深度信息,其实它的信息获取效率是非常直观且非常快的。

当时关注到图像识别,很大程度上也是因为当时香港中文大学汤晓鸥教授的一篇论文,说在他们在限定的测试结果集上,计算机对人脸的识别已经开始超过了人眼的准确率,这件事说明在某些特定领域,机器识别已经开始跟人相媲美了。

我们现在看到的图像识别在一些To B应用上会相对多一些,比如监控,以及人跟证件照的比对。但同时我们也发现,有很多To C的应用正在诞生。

比如原脸萌团队推出的Faceu,它的技术是由SenseTime提供的。也就是说机器在识别人脸之后,未必做的都是很严肃的事情,还可以做一些好玩的,比如画画眉毛涂涂腮红。其实现在很多娱乐领域里,人脸识别都得到了应用。比如云相册,可以按照人的归类使照片按人分享变得更容易:大家出去游玩拍照片,云相册可以自动识别人脸在后台将所有照片做好分类,只有点击一下,便可以直接按照人脸分别分享出去。

可以看到在这些更偏娱乐化或实用化的To C领域,也是很好的应用方向。未来可能还会有更多更好的跟技术相关驱动的应用出现。

关于图像识别我目前有两个判断:一是产品上已经开始接近成熟,二是它刚刚迈到走向成熟的这个坎。换句话说,在一些算法、效率,以及降低成本方面,还有一些改进空间。关于深度学习,其实从出现到现在,从学术研究上也有不少值得研究和突破的地方,改进的空间可能还挺大。

另外,图像识别还是需要找到一些可以接受目前的成本结构和服务方式的应用方向。比如在监控方面的应用,尤其是人员流量大的地方,跟公共安全相关的地方有很强的需求。

最后就是我们身边的智能设备,具有一些简单计算的能力,比如在拍摄时自动识别关键位置和关键的人,或着做人脸追踪、自动调整角度,这些都是很好的应用。如果能从这些角度展开,商业机遇也不小。

现在,人工智能和商业结合的应用都这样一个一个来了。 

3. 爱上人工智能的秘书

在语音识别和图像识别之外,还有一个方向我特别看好,而且是我觉得很激动的事,就是什么时候人工智能可以给每个人都配一个秘书。

从指使人的角度讲,这是人的天性。我们经常说三岁的孩子会打酱油,为什么他会打酱油?因为有人指示他去。这是每个人多多少少都有的指示人的能力。

有一部电影讲的便是一个人工智能机器人做着相当于秘书的事情,后来片中的男主角爱上了这个虚拟的秘书。

如果能给每个人都配备一个类似秘书的人工智能服务,使它能记住每个人的偏好、兴趣点,那么可能会使人的生活便利程度大大增加。而且这是和每个人都有关系的事情。 

 实现人工智能创业的“正循环”

现在是投资人工智能的好时机吗?

对投资或者创业者来讲,在人工智能领域内投资和创业,需要考虑周期的问题。

从创业公司角度说,必须找到一个很好的对应应用,从而使一开始推出的时候就有一个好的切入点,只有这样才能形成正向循环,从而使得这个公司得以继续在人工智能角度往后发展。

人工智能的物理表现形式不太重要,主要还是对事情的理解。在速度上,计算机的进步和机械方面的进步差别太大了。我们现在很多事情可能跟10年前、20年前机械的进步没有本质性区别,但是我们的计算能力(比如学人脑怎么思考)和处理信息方法有了巨大的进步。所以我觉得人工智能在软性方面可能进步的速度会更快一些。

计算机从能耗和信息处理的速度上来讲,跟人比起来还是效率不够高。当这个效率足够高的时候,可能很多原来的生物学的组织形式就要发生变化了。

具体来说,有这样几个方向的人工智能应用我还是非常看好的:

  • 一是通用型的,如果像咱们这样说话,它能够识别出文字来,它基本就算解决了键盘的问题,这是一类通用的应用,一种基础性的应用。

  • 二是情感的支持和获得。其实人对外感情的沟通,很大程度上都靠语音和图像。人工智能在对人的感情的理解上,相当于做一种陪伴,这也是一个应用的方向。

  • 三是To B或To C的应用方向,目前还是声音、图象识别为主。我觉得接下来在自动驾驶,甚至医生看病方面,会有相当一部分重复性工作由机器来完成。

甚至现在有比较激进的说法是:多年之后,人类驾驶有可能就是违法的,人类医生看病可能也成了违法的。虽然比较激进,但是它可能也代表了一个应用产生的方向。

终极的事应该是机器到底能不能理解人的情感,这件事我没有答案。

我觉得正像《奇点临近》里面讲的,人类技术是在以指数级别上升,只不过人的生命周期比较短暂,所以在过程里面,是近似线性发展。

很多人会问,人工智能真的将彻底取代人类的工作吗?

我觉得这挺正常,而且这事应该是可以发生。

开玩笑地说,劳动是人的一种权利。而我们现在的社会远远没有到达“劳动是权利”的阶段。如果大部分的工作到时候可以由智能机器去完成,那个时候有可能劳动真的就变成了一种权利。

另外,我觉得人是一直和外部环境一起进化和共生的过程,如果人可以把一些重复性的或低级要求的工作逐渐交给机器去做,其实会有更多时间去做更具有创造性或交流性的工作。

正如《奇点临近》里说的:人的“进化”更多的是机体保持一种比较有效的生命形式,或者是物理形式,如果外面有更高效的形式出现的时候,可能会跟着这个技术一起去进化。

 20%的成熟度,我们正寻找这样的创业者

人工智能领域的创业者,跟之前我们在中国见到的很多其他商业模式的创业者情况不太一样。

这个领域的创业者主要还是基于在人工智能目前发展阶段的基础上,去找到能够接受这个技术的成本和演进方式的应用,这样的创业者才可能更好地让公司滚动式发展。

如果分成两个方面来看:一是需要创业者对人工智能技术的发展路径有较深了解,或对这件事情有很好的感知,这样才可能更好地带领公司。团队里有能够把握好和技术路径发展相吻合节奏的人才非常重要,它是一个典型的由技术进步带来商业模式的应用,或是一种革新的创业形式。

这就对创业者要求非常高了:不仅要懂技术,还要懂应用,并且需要对成本、演进方式、节奏都有所把握。

比如Google,作为大公司,它有资本做一个 AlphaGo 跟人下棋,但是哪个创业者会花这么大的成本搞个机器人去下棋呢?所以对成本必须有很好的判断。

我们比较看好的人工智能创业团队,最好这几个方面能力兼备:

  1. 创业者具备较强的技术能力,或者有一个比较好的对技术发展节奏的把握能力。

  2. 找到好的切入点,同时还得有一个好的商务能力,把这个切入点变成在当下阶段就可以实现的应用和收入,从而使公司能快速滚动起来。

相对来讲比较看好的是在软件领域有突破的,就是基于这个观察:实际上硬件的进步可能并不是特别快;在软件上的进步,比硬件的进步要快得多,无论是在计算速度还是在算法上。硬件类或者跟机械沾边的进展也有很多很好的公司,也会出现,但是我觉得通过软件的进步,给到创业者的机会可能会更多一些。

   

还是那句话,大公司在这件事情上可能会有优势,但是这种优势并不是无限的。

PC互联网时代跟现在一个重大的区别是:PC搜索的数据多是公开数据,所以像百度、Google 这种公司从数据的可获得性来讲,具有压倒性的优势。而在移动互联网时代,这件事得到了某种程度的改善。

技术驱动可能是 IDG资本与其他VC机构有明显差别的地方,我们对于技术驱动型的事情特别特别的敏感。比如我们很早便开始关注云计算并且进行系统性的投资,包括在安全方面、人工智能领域,都是技术驱动型。我们有专门的专家网络来帮我们做一些相关的尽职调查,所以还是比较了解这个行业里哪些公司相对来讲技术上是比较扎实的。当然看公司的时候,还是会综合起来看,对人和团队也有相关的要求。

如果说企业服务市场的成熟度是40%的话,人工智能的创业领域的成熟度仅仅为20%,一切刚刚开始。

学生时代时,我问过导师这样一句话:老师,什么样就算研究生毕业了?

他说:第一,同行说的话你听得懂;第二,不同方向上你大概知道它的难点在什么地方。能做到这两点,基本上就可以毕业了。

我认为我还是一个合格的毕业生。

快问快答

Q:喜欢的一本书?

A:《从0到1》。

Q:渴望拥有的才华是什么?

A:幽默。

Q:经常面对的问题是什么?

A:有一个挑战是,人在坚持自己想法的时候,经常会受到周围环境的困扰。很可能你的想法其实是对的,但是你在过程中不知道。所以坚持自己的想法,有时会受到各种各样的压力和挑战。