五福节成AI互动应用练兵场支付宝技术迭代提速

《财经》 2024-02-18 10:10:16

作者 | 《财经》新媒体 撰稿人 闫晓寒/文 高素英/编辑

只需要在支付宝五福节的“飙戏小剧场”上传自己的照片,使用一张福卡,就可以一键变身能歌善舞的白娘子。如果还想在周星驰系列电影、甄嬛传、乡村爱情故事……一系列经典影视剧中成为主角,同样也可“一秒入戏”。除此之外,会说话红包、时空照相馆以及大家来找福都引发了支付宝亿万用户的参与热情。

今年春节支付宝把“集五福”换成了“五福节”,别出新裁的玩法背后离不开AI应用的全面布局。2月9日,支付宝方面提供的数据显示,今年,近6亿人次通过AI科技体验新年味,其中,“大家来找福”成为最受欢迎的集福卡方式之一,共有近30亿个AI生成的福字被用户找到。在支付宝上用AI飙戏和拍照的人群中,“90后”和“00后”占了七成。

业内人士认为,2024五福节就是支付宝AI互动应用集中大规模落地的练兵场。如果将双11倒逼支付宝解决海量高并发数据场景下的安全顺滑问题,所产生的分布式技术看作是第一次技术迭代,那么能够解决AI互动应用大规模落地中的算力、成本可控问题,就是支付宝正在经历的第二次技术迭代。

五福节“大练兵” 加速AI大规模落地

作为蚂蚁集团的技术老兵,虽然支付宝CTO陈亮从第一届双11开始完整经历了十余年的支付压测和技术保障,也连续9年参与到集五福活动中,但今年的集五福活动对他和团队来说却有着不同意义。

今年支付宝将集五福升级为“五福节”,并首次由AI全面驱动。如同以往的每次国民级活动,此次有亿级用户参与的“五福节”同样是支付宝AI技术磨练升级的一次“大型战场”,其首要解决的是AI规模化落地应用的问题。

“这涉及很多技术体验和技术成本的平衡,所以我们并非强调支付宝的AI有多么炫酷,而是要把AI落地到场景中、落地到产业中,让AI可以为人所用,实现其产业价值和社会价值。”陈亮表示。

过去几年,用户参与支付宝集五福大多是AR扫福、浇水得福等传统玩法。2024年则是一个转折点,这一年AI及大模型迎来全面爆发,诞生了不少现象级AI应用,支付宝也在思考如何用AI改造自身业务。去年,陈亮带领团队第一时间参与到大模型技术迭代中,并很快将其在业务中落地。

在AI的支持下,2024年支付宝五福节推出了“飙戏小剧场”、“时空照相馆”和“大家来找福”等新玩法。其中“飙戏小剧场”通过AI换脸技术,让用户上传一张照片即可参演一系列经典影视作品;在“大家来找福”中,支付宝通过像素级可控生成等技术生成10万多张藏福图,用户可以边找福字边得福卡;而一键生成“会说话”的视频红包,也大幅提升了用户拜年互动的趣味性。这是去年11月蚂蚁集团的百灵大模型通过备案后,第一次在大模型技术的基础上对产品应用进行大规模的探索。

深度科技研究院院长张孝荣认为,支付宝在五福节中大规模落地AI技术,有助于其数据积累和技术的验证,在大规模的实际应用场景中测试AI技术,能够帮助支付宝检验技术的可靠性和稳定性,为其未来的技术迭代提供实战经验。

迎战算力、成本等难题 第二次技术迭代提速

实际上,支付宝以往的技术迭代都是在一个又一个“大型战场”上得以磨练升级并实现突破。支付宝的第一次技术迭代,正是双十一场景下的业务倒逼,推动其解决了海量高并发数据场景下的安全顺滑问题,由此支付宝诞生了最关键的自研技术:分布式数据库和绿色计算技术。

陈亮及其团队自2010年就开始承担起双十一的技术保障,“我们通过异地多活等各种各样的技术,解决了支付宝的分值问题,在这个过程中沉淀了分布式技术。”陈亮说道,在这过程中,他发现传统的技术已经无法解决一些极致场景业务中存在的问题,这倒逼了支付宝技术的不断迭代。

过去十几年,蚂蚁通过双11锤炼的安全科技的能力、分布式计算存储的能力已经非常成熟,并且处于国际领先地位。而在AI时代,支付宝迎来了第二次技术迭代,其核心便是解决AI互动应用大规模落地中的算力、成本可控等问题。在陈亮看来,AI大规模落地需要解决算力支撑得住、成本可控以及门槛低、用户体验好等关键问题。

在算力及成本方面,除了持续优化历年双十一积累的能力,支付宝还叠加了AI算力来支撑海量用户同时涌入参与AI应用互动,其中包括硬件上的万卡异构集群的能力,其硬件算力效率已超过60%;以及软件上对推理效率和训练效率的优化,其中推理效率提升了2.3倍,处于业界先进水平。此外,蚂蚁的CPU利用率从2017年的不到10%,提升到了2022年的33%。

以支付宝推出的业内率先多人AI人像“时空照相馆”为例,可同时支持6人同框,在单人照、双人照、全家福的每个类型下有5到6个风格模版,每个风格模版有最多10种姿势可选,这意味着支付宝的后台模版多达近三万张。

而此前支付宝作为另一国民级项目杭州亚运的亚组委技术支持方,已经在推动AI规模化落地——全球1亿数字火炬手,其背后的数字人技术为蚂蚁自研,这一技术充分结合了AIGC与大模型技术,通过AI降低数字人全链路生产成本。

值得一提的是,今年AI在应用层面的落地已经为部分技术人员带来工作效率上的提升。据悉,蚂蚁自研代码大模型CodeFuse正帮助支付宝提升可代码开发效率,目前,约有50%的蚂蚁程序员在写代码时都用上了该模型,AI生成代码占比超过10%。

此外,在用户体验方面,支付宝AI在此次五福节的大规模落地有两个亮点,一方面,其能够实现智能手机99%全覆盖;另一方面则实现图片流量节省约50%,更大降低用户图片资源的流量消耗,同时降低网络耗时。

这些也正是行业共同存在的难题,这意味着,支付宝正通过实际应用不断训练自身能力,以实现技术的突破,并为行业提出值得参考的解决方案。

加速AI深度布局多场景应用将成新增长点

近年来,蚂蚁集团一直在积极布局AI领域。根据蚂蚁方面数据,过去五年,蚂蚁集团在国际专业学术期刊和学术会议上发表论文近500篇,其中AI领域的论文300余篇。同时,蚂蚁集团在人工智能领域持续进行技术投入,基于大规模业务场景的需求,布局了包括大模型、知识图谱、运筹优化、可信AI等在内的技术领域。

随着2023年以来AI的全面爆发,蚂蚁集团也开始加速布局AI应用,期待在AI领域施展拳脚,以跟上技术周期浪潮的节奏。

2023年11月,蚂蚁集团旗下的百灵大模型完成备案,除了语言大模型外,蚂蚁集团也在研发百灵多模态大模型,并已进入内测阶段,形成了涵盖大模型底层基础设施、基础大模型、行业大模型和应用产品的完整技术链条。

近期,蚂蚁集团内部成立了专注于AI创新研发与应用的部门“NextEvo”,该部门承担了蚂蚁AI的所有核心技术研发任务,其中包括百灵大模型、数字人等关键领域,今年支付宝五福节的AI互动任务便由该部门提供技术支持。

NextEvo的成立也标志着蚂蚁集团在人工智能领域的深度布局,是以全面的技术投入致力于推动AI的前沿研究和应用。

关于未来大模型的布局,陈亮表示,蚂蚁做大模型在第一阶段核心目标是服务好支付宝、消费金融、支付互联等自身业务;第二阶段在将大模型锤炼好之后,会将一整套大模型解决方案逐渐开源。

目前,蚂蚁基于百灵大模型,落地应用场景,已研发的垂直大模型包括代码大模型、医疗大模型、遥感大模型、民生大模型等,这些模型集也都在服务支付宝业务。例如,用户向支付宝智能助理咨询挂号问题,背后就是医疗大模型在为其提供支持。

可以预见的是,蚂蚁集团今年对AI的重点发力将助力其在新一轮科技浪潮中占据领先地位并提升自身竞争力。张孝荣认为,如果相关企业能够深度布局AI并掌握先进AI技术,不仅能够推动新的服务模式和商业模式的出现,为行业带来新的增长点,也能够助力其在激烈的市场竞争中脱颖而出。

0 阅读:9

《财经》

简介:源于《财经》,广于《财经》。