累计融资近亿美元 云知声打算怎么玩

2016-11-14 04:05伊珊
时间线 2016年5期
关键词:车载语音芯片

伊珊

云知声的创始人都是语音识别领域江湖元老级的人物,他们见证了这个行业的起起伏伏。2012年,几位“老江湖”放弃了大公司的高薪厚职,走上了充满不确定性的创业之路。

强大的技术背景加上先发优势,云知声自成立起就备受关注,目前已累积融资近亿美元,去年已实现营收数千万元人民币。创业四年,云知声进行了哪些探索?在人工智能越来越火爆的今天,语音识别这一领域究竟有多大的想象力?

被Siri搅动的寂寞江湖

要了解云知声的故事,先要从语音识别二十年来的发展历程讲起。在很长的一段时间里,语音识别都是一个寂寞的领域,人们认为那是只存在于实验室的高精尖技术,与现实生活联系不多。

这个行业也曾在上世纪90年代末期迎来短暂的繁荣:

1997年,蓝色巨人IBM推出可安装在PC机上的语音识别软件via voice;

同年,美国公司Nuance发布了连续听写产品Dragon NaturallySpeaking,奠定了Nuance公司在此领域的巨头地位;

2000年前后,摩托罗拉等知名手机厂商发布了带有语音拨号功能的高端机。

然而,语音识别技术一直作为一个附加功能出现,应用场景和应用领域都非常有限,产业化更是遥遥无期。

2008年前后,云技术和大数据的出现搅动了沉寂许久的语音识别江湖。云的存在,使得技术人员可以用几乎无限的计算资源,从而服务器端可以用很大的集群、最牛的算法、最复杂的手段来把性能提上去。当数据不断地训练引擎的时候,系统可以被训练得很好。“以前做语音识别产品,每个语言版本的容量只有100个小时,而现在我们云知声的平台上每天的日调用量在1.5亿~2亿次,这在过去是不可想象的。”李霄寒说道。

2007年,苹果推出siri,识别率可以达到99%。技术的提高使语音识别的功能迅速普及,谷歌当时做了一个统计,有25%的用户习惯用语音功能进行搜索,在中国,这个数字是10%。

技术的突破使得识别率大大提高,而智能手机的兴起又催生出更多的需求场景。无论从需求端还是技术端来看,都为语音识别的爆发做好了准备。置身语音识别领域多年,云知声创始人们都敏锐地察觉到,语音识别的时代来了。2012年6月29日,云知声科技公司正式成立。他们并没有一个庞大的商业计划,盈利方式也并不清晰,只是坚信自己的两点判断:

第一,语音是未来人机交互的基础,在互联网领域、移动互联网领域,以及此后的物联网领域至关重要。

第二,“云”技术会产生巨大的价值。因此他们没有像以前的语音公司那样先做语音技术,而是从一开始就致力于语音云的研发。

2012年10月,云知声拿到了千万元的天使轮融资。

公司成立前两年,一直以技术研发为主。他们选择从语音交互和云入手,并在2012年9月,推出了语音公共云,这是第一家永久免费的语音云。

同年11月,云知声与搜狗语音助手合作,这一项目为云知声的公共云带来了巨大的用户量,技术团队基于这些数据进行迭代,很快使语音云识别的性能有了一个巨大的飞跃。

不断探索,确定四个垂直领域

云知声成立之初,市场上做语音识别的创业公司并不多,基于云端的语音识别只有科大讯飞和云知声两家,是明显的卖方市场。对于云知声来说,这却是一个喜忧参半的事情,他们可以在市场上争取到不错的议价权,同时也要面对一个困惑:面对来自各行各业的需求方,他们分不清哪些需求是刚需,哪些是伪需求。公司成立前两年,云知声开始不断探索和尝试。

字幕转写、手机App应用、输入法应用、智能电视应用、车载、音箱、手表……他们几乎尝试了可以接触到的每一个行业。经过一段时间的摸索,最终确定了四个适合语音识别技术的垂直领域:

第一,教育市场。最典型的应用场景是口语评测,未来的口语考试中,或许为你打分的是一个人工智能机器人。

第二,车载后装市场。从公司成立之初,云知声一直看好车载市场,并坚持认为安卓系统将是更大的市场。2014年,安卓系统在车载后装市场的占有率约为5%,云知声开发了“车载Siri”。到今年,安卓设备比例已经达到了90%。

第三,医疗市场。这一领域在国外已经有成熟的业务模式及产品。语音江湖老大Nuance有接近一半的收入来自医疗产业。语音识别技术可以帮助医生做病历录入,大大节省了人力。今年,云知声与协和医院展开合作,协和成为国内第一家全院语音识别病历的医院。

第四,智能家居。家电智能化已成必然趋势,超级电视,空调等的智能化改造都需要语音识别技术。在这一领域,云知声第一个落地的项目是华帝油烟机,用户在做饭时,不需要腾出双手,可以用语音对油烟机进行操控。这一项目的难点在于如何降噪,云知声使用了降噪芯片加上特有的语音算法,完美地解决了这个问题。

云、端、芯产品体系

2014年,云知声提出AI芯、AIUI(智能交互)、AIService(智能云服务)的概念。云、端、芯三者结合,打造成为一个完整的产业闭环。

第一个层次是芯片侧,叫作AI芯。李霄寒解释道:“今后人们的生活中,芯片将无处不在,包括灯、插座等很多东西都是自带芯片,可以联网的。而每个家电厂商的平台、操作系统、硬件的核都是不一样的。我们现在做一个AI芯,直接把芯片嵌进去,通过芯片来将我们的技术应用在服务中。

李霄寒所说的AI芯片,可以理解为一个硬件Siri,它像一个翻译,把人们的指令传达给硬件。假设我们对空调发出“气温调到26度”的指令,AI芯就会给空调发指令。如今,云知声已经与一线芯片厂商高通等达成合作。

第二层次是软件侧,叫作AIUI,这是指一整套的交互、对话、SDK逻辑。

第三个层次是端口,叫作AIService。语音识别是把语音变成了文字本身,把人们说的话变成了打印体。人工智能还要根据数据场景分析真实的意思,即语用计算。谈到这里,李霄寒举了一个生动的例子:比如“我的信用卡被猫吃了”这句话,如果语境是移动营业厅,营业员会告诉你换张卡;如果语境是宠物店,宠物医生会告诉你如何让猫把卡吐出来。根据不同的数据场景,人工智能会分析出话语不同的含义。

AI芯、AIUI和AIService三大解决方案构成了一个完整的生态闭环。

强大的技术背景加上先发优势,云知声自成立起就是资本追逐的宠儿。2013年,他们完成了亿元级A轮融资,2014年12月启动了5000万美元B轮融资,不到一个月后又启动了B+轮数千万美元的融 资。

目前云知声的合作伙伴超过两万家,其中不乏乐视 TV、小米、联想、华为等一线企业。据悉,云知声去年已实现营收数千万人民币,而继续融资是想要在物联网布更大的局。

谈到公司的核心优势,李霄寒认为,技术的门槛永远不会很高,真正的门槛在于行业经验。“只有在市场上积累了足够的经验,才能迅速判断出哪些领域可以做,哪些领域不能做,哪些地方是需要花力气去攻克的。”

语音江湖群雄纷争,云知声将如何在人工智能的浪潮中大展拳脚,我们拭目以待。

猜你喜欢
车载语音芯片
高速磁浮车载运行控制系统综述
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
智能互联势不可挡 车载存储需求爆发
芯片测试
多通道采样芯片ADS8556在光伏并网中的应用
基于ZVS-PWM的车载隔离DC-DC的研究
新型轻便式车载电子系统的结构设计