随着AI大模型的持续演进,其应用场景也在不断更新。
“今天我们正站在大语言模型的技术基点去思考,汽车里所需要的最本质的核心变革点是什么。”5月26日,在21世纪经济报道科技峰会“潮起AIGC:大模型崛起”北京闭门会上,百度智能汽车事业部智舱业务部产品架构师徐嘉南介绍称。
在徐嘉南看来,未来可移动的汽车机器人应当具备自主移动及人机对话式交互两大方向的能力,大语言模型则以其更强的自然语言理解、逻辑推理及创造性为汽车的智能应用带来全新的想象空间。
(资料图片)
需要注意的是,百度正在进行大模型上车的持续探索。就在日前,百度Apollo汽车智能化业务展示了以文心大模型为基础的新一代AI智舱探索成果,这也是国内首个基于文心大模型在车载场景下的探索成果,并有望在未来推进量产。
据介绍,基于文心大模型能力,百度Apollo推出的智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,同时也能够实现在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的极致体验。
“从整个发展角度来看,我们认为未来文心大模型会重塑车内的应用和交互,基于文心这样的能力,把过去可能我们想到的体验,但是过去的技术做不到的能力,去进行一次重构,给大家带来全新体验。”徐嘉南指出。
文心大模型上车
作为智能汽车的核心,智能座舱随着汽车智能化的演进而持续发生着变化,它也愈发成为用户购车决策的决定因素之一。
徐嘉南指出,当前智能座舱的功能正在持续增加,同时语音交互的覆盖率也在持续增加。据相关机构调研,2022年1-8月,语音交互功能在智能座舱的渗透率达到73.3%,百度方面则预测称,未来智能座舱的语音交互覆盖量还会快速拓展,到2025年会实现超过95%的搭载。
不过当前,智能座舱的语音交互更多是命令式的交互工具,并且系统功能单一,交互系统毫无智能可言。大模型的落地,则带来了全新的可能性,有望推动座舱语音助手向“AI智能助手”升级。
就此,百度Apollo正式推出国内首个基于文心大模型在车载场景下的探索成果。据介绍,基于文心大模型能力,百度Apollo针对车载场景进行专项训练和模型精调,无需人工数据标注,AI便会具备更出色的语言理解和学习能力。
例如,在出行场景中,小度车载语音可以帮用户进行旅途行程规划、沿途景点美食推荐。在家庭出行时,灵感画画可起到给儿童娱乐陪伴的作用。只需用一句话描述想要的画作内容,AI即可在几秒内按照完成一幅创意画作。
同时,百度也在探索如何借助文心大模型能力重塑个性化驾驶空间。在未来,百变人设功能可针对不同场景和不同用户特点、偏好,定制个性化的语音助手人设,与用户进行情感化交流。用户也可以拥有一个用车顾问,抛弃陈旧的产品说明书,用户可以随时随地、详细了解车辆功能。
此外,大模型融入智舱场景后,百度Apollo智舱也将演变为“第三生活空间”的核心载体。可以依托语音助手完成朋友圈文案撰写、沿途景色拍照并一键发送至手机,也可以在开车途中让语音助手完成一天的日程安排和会议预定等等。
据介绍,在未来,大模型加持下的智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,让车内助手在未来有能力像真人一样跟用户交流,可以理解并满足用户在车内场景的深层次需求。
“未来基于文心大模型的能力,车里所有交互可以用自然语言的方式进行,而不是以点击页面然后跳转的逻辑进行交互,这是大模型给未来车机交互体验带来的非常大的变化。”徐嘉南表示,“用户直接表达需求,系统根据分析和理解,调动应用资源进行需求满足。这将改变人与应用、甚至人与车之间的关系。”
技术推动变革
身处汽车行业剧变的时代,智能化成为汽车品牌差异化的重要因素,而智舱是当前阶段用户最容易有感知的智能汽车配置。
百度智能座舱产品由小度车载SDK及小度车载OS构成。官方数据显示,百度Apollo始终助力OEM打造智能化竞争优势,其汽车智能化解决方案已在31个汽车品牌的134个车型上实现量产,累计搭载超700万辆。
同时,考虑到车企希望进行个性化、定制化而非千篇一律的体验,希望形成自身的品牌调性,因而百度进一步推出了小度车载SDK,从而让车企实现差异化设计。
其中,在小度车载语音SDK方面,百度Apollo已经实现了最新的技术升级,使其变得更加智能化和易用。
基于大模型本地化,小度车载语音SDK持续推动座舱极致交互体验。“所谓的大模型本地化,是指将云端参数非常大的模型通过蒸馏和裁剪的方式,把整个体积和运行资源占用变得更小,然后移动到端上,利用本地化的算力去进行加速运行,从而带来更极致的语音交互体验。”徐嘉南解释称。
具体而言,小度车载语音能够实现流畅的免唤醒多路同时交互、全页面所见所说、全域毫秒级响应,让用户像是拥有了一个随时待命的私人助理。
尤其值得注意的是,小度车载语音还能够实现真多路同时对话能力,最大支持8路同时交互精确处理,覆盖整个座舱内外,可以实现多路同时、快速、连续对话的极限挑战。坐在驾驶位、副驾驶位、和后排的每一个人都可以同时提出自己的诉求,语音助手不仅可以识别不同位置用户的需求并且可以依次解决。
此外,小度车载语音还实现了全领域毫秒级响应,且通过自动识屏方式实现用户全场景的语音交互体验。“车里所有的功能都可以语音交互,而不是只在某些应用里面才能交互,这在我们行业上是非常大的改变。”徐嘉南表示。
在徐嘉南看来,大语言模型正在推动行业走向真正的对话式交互,而它也将带来用户及产业层面的深刻变革。
从用户层面而言,随着通用语言模型置入设备中,其能够在不同场景下化身不同类型的助手,并解决用户的专业问题。从产业层面来看,车企未来在进行语音交互功能开发时,也将从储备语音开发人员进行具体功能设计,到配备提示词工程师进行大模型调教,训练车机更好地响应用户需求。
而想要达到这样的变革,就需要坚实的技术支撑。“百度在整个行业内拥有深刻的AI技术积累,拥有全栈自研的AI架构,从底层芯片的昆仑芯,到上层深度学习框架飞桨,再到AI大模型层,我们能够基于文心大模型的能力实现用户及车企所需要的体验。”徐嘉南表示。
(文章来源:21世纪经济报道)