在当下我们可以体验到的元宇宙的世界里,人类与机器交互的设备,有头盔,有手柄,但没有了鼠标与键盘。那么,我们怎么在这个世界里与外界交流?
在计算机时代,因为智能输入法的出现,我们输入的效率得以提升。事实上,输入法已经从一个TO C的基础工具,演化为人机交互上的重要一环。
在近两年,受益于元宇宙概念而如日中天的VR/AR等虚拟世界,因为人机交互方式的差异性,技术人员在输入法方向上的革新也正在迭代创新。
(资料图)
去年9月,搜狗完成了私有化交易,并入腾讯集团。一周年之后,腾讯输入法部总经理鲁剑接受了钛媒体APP等少数几家媒体在内的采访。
钛媒体APP了解到,腾讯搜狗输入法,在IoT领域已累积超过1.5亿用户,覆盖智能家居、智能穿戴、智慧教育、智能汽车等多个行业。
最近,他们将发布新版的VR输入法,在行业首创可以不用操控键盘、能智能识别多种输入场景的输入产品,未来将会与“全真互联网”概念相结合,提供新的人机交互方式。
与VR手柄结合的输入方式
VR世界的输入有别于现实物理世界。鲁剑告诉钛媒体APP,用户在3D场景下去做输入,甚至做一些交互,其实是需要举在手柄,在一个投射出来的虚拟键盘上进行字符的点击,这样的局限就会使打字特别累,也很慢,把VR的沉浸感就给打断了。
目前我们可以看到的,承载的可能更多的还是影视、游戏。相对来说,这还属于比较简单的需求。但是,如果在未来,VR需要去承载着更多的社交场景的话,比如,我们在VR场景下,去用头显,甚至有更沉浸式的社交体验。
这个时候进行输入,不管是用语音,还是用手写、打字,可能都会有一个相对来说更便捷的诉求。针对这些问题,我们可能会需要用语音来“敲打”VR世界的键盘——在搜电影、发弹幕的时候,可以自动用语音动动嘴就可以完成输入。
在VR的需求下,新兴技术也会用在输入法里,比如,像手势算法和输入法的结合,让用户也体验到领空手写代替在虚拟键盘下打字的输入,毕竟有的时候,语音代表着一种非隐私的环境,而用户需要静默输入的时候,领空手写的虚拟技术,也会是输入法领域接下来重点发力的方向。
当前,VR输入法更多的还是基于3D引擎在做的研发工作,而3D引擎是非常多样性的,会导致我们输入法一个一个去适配的时候,工作会相对来说比较复杂。在技术上,技术人员也会去采用像虚拟屏的概念去适配不同的3D引擎,然后来增加输入法产品的通用性。
鲁剑也坦言,在新的场景,输入法开发的工作,会相对来说慢一点。像在VR场景,他们的顺序是优先要去打造一个基线版本,当基线版本积累出来之后,后面流水线上需要去开模,开了模之后,整个体系才能高效运作起来。
以下是钛媒体APP等对话鲁剑的实录,经钛媒体APP编辑:
Q:这次你们发布VR端的输入法,请您介绍一下具体的应用场景?
鲁剑:早期有不同的理解。现在VR基本上还是作为一个独立的硬件设备的存在,但是这个硬件设备呢,我们目前认为它其实是不同于手机的,它的产品形态主要是头显、手柄。用户在3D场景下,其实去做一些输入,甚至做一些交互,其实是需要举在手柄,在一个投射出来的虚拟键盘上进行字符的点击,这样的局限就会使打字特别累,也很慢,把VR的沉浸感就给打断了。
我们的思考,如果未来VR去承载着更多的社交的话,目前承载的可能更多的还是看片、游戏,相对来说比较简单的需求。但是,如果后面用于社交的话,比如我们在VR下面去用头显,甚至有更沉浸式的社交体验的时候,这个时候输入,不管是用语音,还是用手写、打字,可能都会有一个相对来说更便捷的诉求。
所以针对以上的这些问题,我们也去首创了一个VR的语音键盘。像用户在搜电影、发弹幕的时候,可以自动用语音动动嘴就可以完成输入。另外,我们也会去不断探索像VR中间的一些新兴技术用在输入法里面,比如像手势算法和输入法的结合,让用户也体验到领空手写代替在虚拟键盘下打字的收入,因为毕竟有的时候语音不是很隐私的环境,用户需要静默输入的时候,领空手写的虚拟技术也会是我们接下来重点发力的方向。
Q:关于这次VR端的输入法,现在国内外大厂都在布局VR端的输入法,像这次搜狗推出的输入法在手势交互或者识别精度等技术层面,会不会有一些比较大的改进或者亮点?
鲁剑:在技术上面,我可以谈一些。因为VR更多的还是基于整个3D引擎在做的研发工作,而3D引擎是非常多样性的,所以会导致我们的输入法一个一个去适配的时候,工作会相对来说比较复杂。
我们在技术上也会去采用像虚拟屏的概念去适配不同的3D引擎,然后来增加输入法产品的通用性。另外会去解决用户输入效率低的一些难点,比方说像调整键盘尺寸、增加音效和震感,同时能够增加用户裸手输入的能力,让用户的输入效率和体验得到不错的提升。
还有,我们也会尝试软硬件结合,给用户提供更便利的输入体验,比如像虚拟键盘和手柄按键之间产生一种映射关系,用户也可以利用手柄上的快捷键对文字内容进行增删改查。
Q:输入法从PC时代到智能设备,再到万物互联,它的属性一直在变化。现阶段,智能家电各种各样的智能终端设备都有输入的需求,现阶段输入法最突出的变化是什么?
鲁剑:腾讯搜狗输入法从2015年开始服务像TV、教育平板这样的一些硬件厂商,我们积累了比较多的经验,我们相信像5G、AI技术的发展会使得智能终端的智能程度会不断地提升,整个赛道的软硬件厂商都在追求为用户提供便捷、智能的体验。
现阶段,我们比较明显的会感受到厂商对于系统输入法品质上的追求,以及对于人机交互的探索动力也是不断地在提升。我认为这块最突出的变化就是要从一个单一的工具升级为万物互联的人机交互。
Q:托于开放平台计划,和其他玩家合作的思路是什么或者合作的方式是什么样的?
鲁剑:我们现在推出开放平台的思路更多的是聚焦在人机交互的赛道上,我们的生态合作伙伴未来会包括操作系统、系统中间件、字库厂商、智能终端、企业办公软件。我们希望通过上下游生态以及和合作方的捆绑,形成完整的人机交互解决方案,然后助力各行业、各场景效率和体验的提升,为行业用户去创造价值,进而促进输入法和相关生态合作方,我们能够共同的去获得商业价值,这是我们的核心思路。
Q:一些平台型解决方案,不管是什么行业,我们都能达到高效率吗?
鲁剑:一些新的场景,我们会相对来说慢一点。比如像VR,我们的顺序是优先要去打造一个基线版本,当基线版本积累出来之后,后面流水线上需要去开模,开了模之后,后面的定制就会非常快。
Q:这是不是也和搜狗在输入法领域积累了很多年的经验有关?
鲁剑:每个产品是需要深度的去打磨。我拿一个C端的输入法举例,大家看到的其实只是一个键盘,但是实际上我们真正把它解构开去看,里面有表情、语音输入、手写输入,光我们的键盘输入就有上百种。
比如多语言,我们有一百多种键盘,还有粤语用户专门用的粤拼键盘,还有游戏用户所使用的游戏键盘,以及我们在折叠屏下面使用的折叠屏键盘、悬浮键盘,每一个键盘的交互体验不是说堆一个键盘上去就可以,因为它是需要适配机型,甚至是需要自动的用深度学习的方法去适配我们的手型,比如手大的用户的键盘大小是否具备一个自动调节的能力,这些都是需要一个一个去打磨的。在这块来讲,我觉得在这个行业里面没有足够的时间和深度的积累,其实是非常难在短时间内把它做得非常好。
Q:这次推出的几款新品,在颠覆式创新方面有哪些新的突破?你们的目标用户,创新生态是什么样的?
鲁剑:我们结合企业的特点去推出了一个开放平台,通过这个开放平台能够让用户更快、更好的去定制他的输入法。
具体的这个开放平台未来可以定制的方向,一方面像车载,目前大屏、多屏,其实是主流,针对不同尺寸的屏幕,我们会提供全新的键盘布局设计,同时考虑用户在主驾和副驾输入的时候不同的体验,比如键盘镜像、悬浮拖动,都让主驾和副驾轻松的输入。针对车载常见的地图导航,我们也会内置车载的专属词库。
甚至我们也在考虑用跨屏的方式去打通我们的输入场景,比如当你的手解放不出来的时候,去按车载上的导航,因为我们需要把手放在导航上面,还是比较麻烦的,我们是不是也可以用手机去连接车载设备,然后完全输入。
还有一个就是VR,我觉得创新性刚才也谈到了就是推的语音键盘,动动嘴就可以完成输入,同时和手势算法去结合的这些东西,都是我们独特的一个创新。
在TV下面,还有大屏下面,我们也推出了一种二维码的跨屏输入,它是跨屏输入概念,把用户手机和终端设备通过蓝牙链接后,用手机完成输入。比如这个设备离我相对很远,会考虑用我们的手机,在我们的设备上扫一个二维码,就是传统的像电视一般是用遥控器做输入,我们可以考虑在电视上出现一个二维码,我们离得很远,但是我们拿手机一扫就可以完成在电视输入框上的输入,这样就不用频繁地去拿遥控器来去完成输入。
Q:输入法解决方案涉及很多不同的领域,包括智慧办公、智慧金融等等,想问一下,在不同领域的硬件商而言,他们对解决输入解决方案的需求方面会有哪一些差异?
鲁剑:早期更多的还是聚焦在C端,比如移动端、PC端。但是后来随着产业价值的兴起,让我们对B端有了一个更清晰的认知,所以站在产业需求的角度上来讲,为每个行业去提供定制化的,包括不同的解决方案,就成为我们现在优先去做的一个选择。
比方说,我们现在刚推出的生僻字解决方案,其实就是服务在金融行业上面生僻字改造的需求,当然和智能家电行业对比的话,金融行业的需求差异相对来说还是比较显著的,需要输入法联合字库厂商、系统的中间件,整体进行生态的结合和改造,最后形成一整套金融行业专属的生僻字改造解决方案。当然,为了支持生僻字的改造,我们也推出了新的技术方案就是云输入法,包括金融行业的专属词库。
像智能汽车其他行业的话,我们也是同样的道理,在各个行业上都会有针对这个行业比较不同的一些创新,还有和厂商结合的一些定制化的解决方案。所以这个行业的需求现在已经基本脱离输入法应用了,输入法现在也从一个基本的C端应用商的工具,逐渐升级为人机交互上重要的一环,也是需要和上下游的厂商深度协同来去完善目前的系统,结合行业的需求和用户的场景进行定制化的设计。
Q:针对教育行业,输入法会区别于通用型输入法所呈现的一些特征?这个行业用户的需求主要集中在什么方向上?
鲁剑:这个场景确实也是一个蛮重要的场景,在这个场景下,我们确实会更关心青少年的一些身心健康。当然,为了有别于其他的教育场景,我们也会考虑学习模式和考试模式。之前输入法的教育场景提供了敏感词的屏蔽能力,用来去守护青少年的身心健康。
另外就是输入法的AI能力,也可以在学生学习的过程当中协助同学们掌握组词、造句、诗词歌赋,还有在数理化公式相关的一些知识点。当然,我们同时也会推出一个叫“考试模式”,家长端和教师端,因为很多学校现在用的都是搜狗输入法,如果智能方面做的过于强的话,学生们在考试的过程当中就可以利用输入法去作弊。
之前,我们在做金融考试的时候就有很多用户在问说考试机器上有没有搜狗输入法?因为我们当时做了一个功能是用搜狗输入法里面可以有一个计算机的功能,可以用来去做复杂的运算,所以在“考试模式”下,家长端和教师端可以一键开启学生客户端的考试模式,在学生上网课或者在线上考试的场景下就避免出现信息引导,从而更真实的考验学生对知识的掌握程度。
Q:什么样的教育机构或者企业,会单独去为一个输入法买单呢?
鲁剑:这两年,其实教育行业也在做改革,他们也在全面的电子化,尤其像疫情的影响之下,其实学生的远程教育会变得比较频繁。现在的学生,尤其是高年级的学生对于平板的使用是非常多的,有很多的学习和考试都会在平板上来完成。
我们更多的还是围绕具体的使用场景去做定制化的需求,比如我们的客户需要在平板中定制这样一套系统,但是这个系统里面肯定少不了要有一套学生使用的输入法,但是一个简单的输入法有时候是非常难去满足客户需求的,所以他们就会来找我们去围绕远程学习的场景去定制这样一款输入法。
Q:针对不同的行业会提出很多定制化的方案,对于搜狗来说,可能更多聚焦在技术端开发。各个行业隔行如隔山,每个行业都有自己的问题,有自己独特的需求,您在与这些行业接触的过程中,发现有哪些行业的客户提出过哪些问题是你们之前没有想到的,又让您印象比较深刻的?
鲁剑:其实还是蛮多的,你坐在办公室里面去搞和走出去,其实是有非常大的区别。举几个例子,比如我们之前在无障碍方向上做的输入,我们去面对一个肢残的用户看他怎么去输入的时候,当时他输入的方法还是让我们挺震撼的。
还有像今年我们推出的汉字守护计划,我们之前认为是有生僻字,但是没想到会有这么多,要支持标准(强制性国家标准GB 18030-2022)内的87887个汉字,如果是这样一个量级的话,之前国家的政策是互联网可以去适配,今年国家把它变成一个强制需求的时候,我们去和银行推的时候,其实才知道这个原来是这么大的一个痛点。
还有在车载下面,我们当时是面对主副屏需求的时候,才发现原来在主驾输入和副驾输入的体验差别这么大,这些其实都是我们之前没有意识到的。我和产品同事共同的感触就是了解需求必须要走出去,并且我现在都坦诚地说,我们走出去的还是要更多一些。即使都是车企,可能不同的车企之间都会给你不同的启发。
Q:因为2B的行业很多,有大中小客户,也有不同的需求。我们在服务客户的团队上是一个怎样的策略呢?因为面对海量的用户,海量细分的需求,搜狗现在是一个怎样的流程?重点和侧重点是?
鲁剑:这个分两个层面去说,一方面是早期我们去交付的时候,我们更聚焦的是头部客户,因为我们认为头部客户的用户量比较大,他们对于需求的理解也会更加深刻。早期我们的交付方式更多的是偏向于销售去跟客户连接,我们紧接着就是产品经理连接,然后我们采用点对点的交付方式去进行和用户之间的深度沟通,之前有若干个需求都是点对点去交互。
但是随着时间的推移,整个的交互方式也会发生变化,因为我们发现一方面整个用户的需求在收敛,我们接着如果还用这样的交付方式,势必在交付成本上会存在大量重复造轮子的情况,这也是我们这次在“腾讯数字生态大会”上想重点主张的一个点,就是我们想要用开放平台的理念和产品来去帮助我们的客户。
比如,我们希望我们的客户在一些简单的输入法定制,比如这个工业化设备是医疗设备,他肯定希望快速的定制一个输入法,他只需要去选择一个医疗的词库,然后选择所需键盘的种类,我们提供手写、9键、26键等等。当企业用户勾选完之后一打包,这个输入法就生成了,生成之后可以拿来做调试。从这个交互方式来讲,我们是完成了阶层的跨越。
(本文首发钛媒体APP,采访、撰文|李程程)