2020年8月13日-15日,“2020中国汽车论坛”在上海隆重召开。该论坛是由中国汽车工业协会(CAAM)主办,世界汽车组织(OICA)、世界经济论坛(WEF)唯一支持的行业顶级论坛。本届论坛以“新变局 新挑战 新思路——引领中国汽车新征程”为主题,紧扣时代脉搏, 求索突破之道,紧密围绕“十四五”规划,把控宏观产业形势,解析全球汽车产业发展动态。其中,在8月15日上午举办的“智能网联汽车创新发展与产业生态的升级”分论坛上,科大讯飞智能汽车事业部副总经理赵毅发表了主题演讲,以下为演讲实录:
科大讯飞智能汽车事业部副总经理赵毅
赵毅:最后一个分享,首先必须要感谢在座各位还能坚持到现在。
我的PPT展示分为两部分:第一部分,科大讯飞对行业的理解;第二部分,基于理解突出的产品特性、布局。
像上午这么多大咖给我们进行的介绍一样,智能化有非常多的方向是不同公司、不同从业人员在努力探索的。一方面汽车行业“四化”说了一两年、两三年了,这是大家共同努力的目标。另外一个方向大家可以一起共同关注,汽车行业的数字化转型。因为传统制造型企业想转变成基于软件、基于服务的企业时,数字化转型是必不可少的。
就是说,可以通过车联网能够将汽车“四化”和“数字化”融合在一起,所以我们认为车联网就是当前节点汽车新业态形成的关键。
今天很多大咖都在说软件定义汽车、架构定义汽车、服务定义汽车,看一下过往所有的汽车品牌基本上无非是操控、内外饰竖立品牌、形成品牌。但是在现在的状态下,软件和服务会让品牌的调性变得更加不同,甚至可能会比传统认为的内外饰、操控性、科技感更加重要,科大讯飞觉得有两点:(1)车内人机交互。(2)用户服务生态。
我们通过调研公司了解的信息,具体的就不说了,大家可以看到用户一定希望有个性化、多样化,同时会注重安全感和愉悦感。现在的客户已经脱离了对简单功能、功能叠加的需求,更加关注的是软性,比如说是否能带来愉悦、能否带来安全、能否在我伤心的时候逗笑我,这是目前主要的诉求。已经脱离了功能性需求。就是说,如果我们还一味地强调现在有这样的功能、那样的服务,并不能吸引当前主力的购买人群。
从更大的行业来看——“ABC+芯片”,人工智能、大计算、云计算已经说了很多,和汽车息息相关,但在每个行业都在产生影响。在这样的大环境下,目前汽车供应生态也在发生着变化,刚才长安的张总在提,在这样的新软件服务的业态下,整车厂和供应商的关系应该是什么样?我们既有自给自足型的,什么都自己来做,比如说特斯拉,特斯拉就是典型的自给自足型的。同时大部分车厂是第三方解决型的。我们相信车企和消费者会和传统和新兴的势力融合在一起,无论是产品研发、技术研发、用户研发,一定是“蜘蛛网型”的。
虽然今天上午以及昨天论坛有很多大咖都在讲,但恕我直言,很多时候只是理念和愿景,是需要有节奏、过程的。实际上看现在目前各个整车厂生态系统的建设,是和理念、愿景相对滞后的。在中国也好,在国外也好都有生态壁垒的问题、选边站队的问题,很多时候通过资本的方式、资源置换的方式,虽然某种时刻可以打破壁垒,但是会看到在中国服务提供商的壁垒是长期存在的。
如何跨行业协同创新意识和能力?汽车方向的创新是不是汽车人可以单独搞定,如何创立一个模式跨越其他行业?比如说《公检法》、医疗、教育,这都是上半年疫情一直比较火的行业,这些行业对汽车行业是不是有帮助、有认识,如何构建渠道?这是三个典型的问题。
我们梳理出来和的生态发展观——共创共研推动去中心化生态。
这是讯飞对未来智能汽车发展布局的理解,相信上午所有嘉宾基本上在看横向的事情——车如何理解环境?终极目标就是自动驾驶,是车和环境之间的关系。讯飞选的路是纵向的,因为车是服务于人的,所以一定要理解人,只有车既理解了环境又理解了人,才能够真正成为我们定义的智能汽车。
十年前我们更多是在核心技术这一块儿去深耕,去积累,把车内的语音交互从不可用做成可用,从可用做到好用,这是过去五年十年我们做的事情。但现在以及在未来的两三年,希望能够达到虚拟个人助理的水平。到底有什么区别?目前终端用户已经不是特别care产品是不是一堆功能叠加的结果,更加care能否带来软性的东西。所谓的软性就是情感化交互。
这是我们梳理出来的四个最核心的点,后面我都会进行介绍:
(1)听说看能力。
大家对讯飞最了解的就是语音识别、语音合并,很多朋友说讯飞的语音好,但实际上语音并不是单纯的技术,是由十多个技术闭环所组成的,所以会形成木桶效应。十几个闭环里有任何一个不是特别好就会给最终人机交互感觉变得不好,因为短板比较短。还好讯飞在这一块儿基本上每一环都是世界领先的,所以我才有信心说我们可以打造全闭环的世界领先的语音交互产品。
(2)从现在维度看未来两三年车内人机交互会有三个升级。
多模态交互,今天上午很多大咖都提到了,后面我会具体讲。多乘客交互、情感化交互是我们正在做的,也是我们认为会有升级机会的。
多模态交互,比如说有一些手势、视觉、语音,但实际上讯飞目前做的更多的是眼神的追踪,通过对乘客眼神的追踪,我们发现好像对用户意图可以进行判断最高的途径。这是讯飞比较早在行业里发现的事情,今年年底应该会有相应的产品出来。
多乘客交互,所谓的多乘客是在一辆车内,特别是大车,第一排和第三排的乘客会有交流的需要愿望。比如说我在开车的时候我的后排坐的是我的女儿,6岁,很多时候她说话我听不到,如果我回头会有安全的问题。能不能通过车内声学的方式解决这个问题?这是我们现在正在做的事情。
前两年智能座舱大家都在拼谁的屏多,恨不得一个车里装20多个屏,但屏只是解决了视觉的问题,并没有解决听觉的问题。为什么我和前面这个屏说话和旁边的屏说话是不是一样?你希望得到的反馈是否一致?从我的角度应该是不一致的。通过语音交互来做的话,整车如何判断我是对这块屏说的,而不是对那块屏说的。这是我们为了解决这个问题做的核心问题的突破和积累。
同时讯飞是做语音的,人要和车说话,车对人说话怎么办?过去几年我们只做人对车说话这件事情,但声音不能形成闭环,也就是说我们仍然不能从声音维度在汽车内给用户完整的体验,这也是为什么在前年开始发力整个智能驾驶舱的音效体验。
这是一个例子。您会发现想做真正情感化交互肯定是离不开多模态的交互,他们是相辅相成的,否则我怎么知道司机累了或者不开心了,如何更精准地判断取决于多模态交互的手段,所以所有的这一切都是相辅相成的。
谈到生态智能,我们做了分类,不太再想把BAT的CP/SP纳入到非常大的范围内,但仍然属于娱乐和生活相关的小类,对整车场来讲最有价值的仍然是整车的生态势能,加上和售后相关的能够产生售后运营价值养护、保修、保养、保险、二手车生态,无论对用户还是终端客户来讲都是最有价值的。
过去大家更多说的是功能,我有这个功能,我有其他功能,但现在OS相信一定会基于场景,基于情绪的良好助手。
未来一定是“交互+生态+场景”三擎驱动的。讯飞没有光想,我们也做了很多事情,无论是OS的软硬分离还是云端的软硬分离,一说软硬分离就是车机的软件和硬件大家分开做,但我们还有定义云端的软硬分离,会和很多整车厂通过专有云、私有云的方式搭建云端平台的软件和硬件是分离的。
讯飞不仅可以做语音,现在也在做非常多的OS,在国内和广汽、长安、奇瑞、江铃形成了品牌化OS合作,目前在智能驾驶舱方向积极探索。
到今年为止,讯飞在汽车方向已经耕耘了18年,到上半年全中国有2500万辆搭载了讯飞的语音,离不开在座的各位对讯飞的鼎力支持,特别希望能和在座各位携手起来,汇智同行,谢谢大家!
(注:本文根据现场速记整理,未经演讲嘉宾审阅)