随着「百模大战」进入深水区,国内的科技巨头、互联网大厂、AIGC创企及行业龙头纷纷递交了最新答卷。
10月31日,阿里云不仅推出最新通义千问大模型2.0版本,还推出了八大行业大模型、大模型应用开发平台,并从AI基础设施层面全方位布局,本次发布可谓阿里云的AI「全家桶」爆发。
而不久之前,百度除了正式发布文心一言4.0版本外,包括新搜索、新地图、新文库等数十款百度AI原生应用「全家桶」也正式亮相。
那么面向AI浪潮,阿里云与百度双方的大模型产品及实力如何?将在大模型方面有哪些新布局?谁更有望为AI大模型产业化落地提供更好的底座支持?
本文通过对双方AI「全家桶」的产品、底层算力、行业应用与生态等方面进行深入对比探讨,试图解答上述疑问,为国内已经布局大模型或者准备应用大模型的企业,提供发展模式与方向。
10月31日,阿里云正式发布了千亿级参数大模型通义千问2.0,同时扔出一个AI「全家桶」,从IaaS(基础设施即服务)、PaaS(平台即服务)和MaaS(模型即服务)全方位秀出“肌肉”。
相比4月发布的1.0版本,新版本在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。此外,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。
与此同时,为推动大模型更易在千行百业集成落地,基于通义大模型训练的8大行业模型组团上线,主要包括通义灵码-智能编码助手,通义智文-AI阅读助手,通义听悟-工作学习AI助手,通义星尘-个性化角色创作平台,通义点金-智能投研助手,通义晓蜜-智能客服,通义仁心-个人专属健康助手,通义法睿-AI法律顾问。
尽管阿里云这次发布了八大产品模型,但阿里云CTO周靖人强调,阿里云此举并非为了直接To C提供服务,而是To B。做行业模型,更多是像个面向客户的Demo,让客户先了解到大模型能做什么。
在令人眼花缭乱的各类产品发布背后,阿里云面向AI时代其实已经做出了坚定选择——做AI时代的基础设施、开源路线、开放平台。
除了阿里云在10月提交了一份新答卷之外,国内各家大模型厂商也纷纷拿出通用大模型的新版本,试图一较高下,例如腾讯、百度、讯飞、智谱、百川......
其中,早在半个月前——10月17日,百度发布了文心一言4.0版本,新版本在理解、生成、逻辑、记忆四大能力都有显著提升。其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。百度基于文心大模型研制了智能代码助手Comate,从内部应用效果来看,整体的代码采纳率达到40%,高频用户的代码采纳率达到60%。
此外,包括新搜索、新地图、新文库等数十款百度AI原生应用“全家桶”也正式亮相,备受外界关注。
从产品角度来看,阿里云和百度都推出了大模型的新版本,并且在不同领域都拥有一定优势。阿里云的通义千问2.0版本在大模型能力和行业应用方面表现突出,而百度文心一言4.0版本则在语言理解、生成和逻辑能力方面更优异。
不过有意思的是,百度似乎对自己的技术实力更自信,起码在对外宣传的口径上是这样。周靖人在云栖大会上表示,通义千问2.0综合性能超过GPT-3.5。而百度创始人、董事长兼首席执行官李彦宏宣称文心一言4.0综合水平与GPT-4相比已经毫不逊色。
大模型的发展需要更强壮的AI基础设施,基础设施主要是两个核心部分构成——芯片与云。
首先由于大模型需要大量的计算资源和存储空间,因此需要高性能的芯片来支持其运行。
飞天芯片是阿里云自主研发的大规模分布式AI芯片,专为云计算和大数据处理而设计。它采用了一种新型的架构设计,可支持多种深度学习框架,包括TensorFlow、PyTorch等。飞天芯片不仅仅是一颗芯片,它还内置了阿里云自研的云操作系统,可以与阿里云的其他产品和服务无缝集成,提供一体化的解决方案。
昆仑芯片则是百度自主研发的AI加速器芯片,专注于高性能计算和智能推断。它采用了高性能计算架构,可实现高能效比和低功耗。昆仑芯片支持多种数据类型,包括图像、语音、自然语言等,适用于多种AI应用场景。
飞天芯片和昆仑芯片都具有强大的计算能力。飞天芯片的分布式计算能力使其在处理大规模数据时具有显著优势,并且支持大容量内存和分布式存储,可满足云计算和大数据处理的需求。而昆仑芯片的高性能计算架构则使其在推断等计算密集型任务中表现出色。同时昆仑芯片采用了高速缓存和优化存储技术,提高了数据处理速度和效率。
3月17日,李彦宏在亚布力中国企业家论坛上分享,昆仑芯片现在很适合做大模型的推理,将来会适合做训练。
在这场争夺中,阿里云是国内最早布局云计算的平台之一,可谓是国内云计算领域的先驱。回溯至十多年前,阿里云在云计算和大数据尚未成为主流的年代,就坚信云计算的重要性,并开始着手布局。当时,很多国内技术公司认为“做云还太早”、“云只是旧瓶装新酒”,但阿里云选择了坚定的信念:“必须要做,客户需要,市场需要”,“每年给阿里云投10个亿,投个十年,做不出来再说”。
如今,云计算不仅成为全社会重要的基础设施,也为今天热潮翻涌的AI大模型创新提供算力底座。而阿里巴巴完整的AI技术体系,正是建立于自研云计算的基础之上。根据IDC相关报告,2022年下半年,中国公有云市场上,阿里云的市场份额为31.9%,排名第一。
在云栖大会上,阿里云针对大模型升级了AI基础设施,提供更高性能、更低成本的智能算力。周靖人介绍称,全新升级的阿里云人工智能平台PAI,底层采用HPN 7.0新一代AI集群网络架构,高效协同调度各类芯片,可支持高达10万卡量级的集群可扩展规模,让超大集群像一台计算机般高效运转。
据了解,阿里云PAI可支撑多个万亿参数大模型同时训练,超大规模分布式训练加速比高达96%,远超业界水平;在大模型训练任务中,更可节省超过50%算力资源,性能全球领先。
从业绩看,百度云则发力较晚,在2018年第四季度才开始公布业绩。据百度财报显示,百度云2019年实现营收46.5亿元,2021年则实现营收151亿元,两年增长224.73%。2023年二季度,百度智能云收入45亿元,同比增长5%。李彦宏在财报电话会上透露,继一季度首次盈利后,本季度,百度智能云再次盈利。不过,与一季度一样,百度并没有给出具体数据。
百度云的优势则在于其搜索引擎所拥有的海量数据,侧重于融合AI能力,将AI技术与云基础设施服务相结合,聚焦智能服务突出差异化,基于“云智一体”的技术和产品,在制造、金融、能源等领域积极实践。
百度创始人李彦宏将大模型视为改变云计算市场游戏规则的存在,而阿里董事会主席兼CEO张勇则将大降价、联合伙伴推动大模型落地、产品被集成作为关键的“三板斧”。
随着时间的推进,2023年云厂商们相较于2022年的“保守”状态,已经开始了奔跑,预示着这个市场将迎来一场激烈的竞争。
阿里云积极推动大模型在各行业的落地,已经与60多个行业头部伙伴进行深度合作,通义千问已经在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域落地。早在今年9月,阿里集团CEO吴泳铭在全员信中表示,要让阿里各个场景都变成AI技术的应用场。如今,淘宝天猫、钉钉、天猫精灵、斑马智行等均接入通义千问大模型,先后发布了适合各自业务场景的AI应用。
百度也展示了文心一言在商业化方面的成果。自8月31日文心一言面向全社会开放以来,其用户规模已经达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。此外,百度还推出了会员模式,开通后可解锁文心大模型4.0。
在世界大会上,百度千帆还推出了自己的“App Store”——AI原生应用商店,为基于文心大模型开发的应用提供了交易平台。目前,应用商店已经针对智能办公、营销服务、行业职能、生产提效、分析决策5个场景上线了百度自研以及客户开发的AI应用。
显而易见,大模型与行业的融合发展已是主要趋势,具体的场景还在逐步探索,一批典型案例则已经发布。
李彦宏提到,百度正在大力推动数字技术与实体经济的深度融合。大模型技术已应用在制造、能源、电力、化工、交通等实体产业中,他认为,“大模型正成为新型工业化的重要推动力。例如,百度与浦发银行合作推出了智能客服“小浦”,与吉利汽车合作推出了智能驾驶“银河”。同时,百度还通过开源的方式向公众开放文心一言4.0版本,以推动大模型技术的普及和应用。
阿里云则将大模型应用于电商、金融、制造等领域。例如,阿里云与美的集团合作推出了智能家居“美的美居”,与吉利汽车合作推出了智能驾驶“斑马智行”。此外,阿里云还通过与政府、高校和其他企业合作的方式,推动大模型技术的普及和应用。
今年4月18日,钉钉宣布接入阿里巴巴的通义千问大模型,表态将用大模型把钉钉重做一遍。当时,钉钉发布了一个AI“魔法棒”,演示了聊天、文档、音视频会议等4大高频场景中的智能化应用。4个月后,钉钉在生态大会上交出了新的答卷。叶军称,钉钉已有17条产品线个场景全面接入大模型,实现智能化改造。
百度的办公软件如流则可以针对群聊信息多的办公痛点,“一秒划重点”,差旅助手不仅能订机票酒店,甚至还能通过接入CRM等公司系统,总结出拜访客户的背景资料和谈话参考。最新发布的商业办公工具GBI可以通过自然语言进行交流使用,主要针对商业办公场景,例如快速进行工程报价计算、完成商业竞价方案等。
经历了10月份的密集更新后,国内大模型产品也在积极探索商业化,或将告别免费时代。
11月1日,百度正式上线元/月,连续包月优惠价为49.9元/月,同时还推出文心一言和文心一格的联合会员,价格为99元/月。这也成为国内首个采用会员模式面向C端收费的大模型产品。
此前,钉钉也公布大模型落地应用场景的商业化方案,在专业版年费9800元基础上,增加1万至2万元即可获得一定的大模型调用额度次数。
可以看出,生成式AI产品的收费已经是大势所趋。这是因为训练和运行大型模型需要大量的计算资源,包括高性能服务器、大规模数据集和专业的算法工程师团队。因此,没有任何一家企业能够持续地提供免费服务。
例如,今年2月,OpenAI推出了ChatGPT的付费订阅版——ChatGPT Plus,每月收费为20美元。而微软在9月21日宣布,Microsoft 365 Copilot将于11月1日起向企业用户提供服务。这项服务将为Word、Excel、PowerPoint等应用添加生成式AI功能,每个用户每月需要支付30美元的费用,按年付费。
总体来说,阿里云和百度都在大模型的行业应用和商业化方面取得了一定的成果。阿里云的通义千问2.0版本在办公、文旅、电力等多个领域都有成功的应用案例,而百度则通过文心一言在搜索、地图、文库等领域为用户提供了更智能的服务。
先从宏观的愿景来看,阿里云要“打造一朵AI时代最开放的云”,百度移动生态决定开启大模型的下一程,“从AI人人可用,到生态共荣”。
10月31日,阿里巴巴董事会主席蔡崇信在云栖大会开幕式上致辞。“开放”成为其致词中最高频的词语。他坚信“不开放就没有生态,没有生态就没有未来。”
再从微观数据来看,中国超过一半的大模型公司都在阿里云上运行,包括百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等。截至目前,中国众多头部主流大模型都已通过阿里云对外提供API服务,包括通义系列、Baichuan系列、智谱AIChatGLM系列、姜子牙通用大模型等,大模型厂商与阿里云一同面向客户。
在国内,阿里云是头部大厂中最早做模型开源的公司,坚定选择开源开放。从今年8月开始,阿里云陆续开源了通义千问7B、14B参数的通用模型与对话模型。在今年云栖大会上,周靖人再次宣布通义千问72B模型即将开源,将成为中国参数最大的开源模型。
值得一提的是,阿里云自研大模型与第三方模型并非竞争关系。恰恰相反,阿里云为所有大模型提供开放的社区,还提供免费的GPU算力帮助开发者去体验三方大模型,截至目前阿里云已免费提供超3000万小时的免费GPU算力。
大模型也在反哺阿里云,阿里云成为一朵走向“自动驾驶”的云。周靖人表示,“基于阿里云通义大模型,我们对云上产品也进行了AI化改造,超过30款云产品具备了大模型的能力,带来了开发效率的大幅提升。”
此外,阿里云还发布了一款AI开源社区“魔搭”,短短一年后便汇聚了280万开发者、2300多个优质模型以及超过一亿的AI模型下载量。这些成果展示了阿里云在大模型领域的领先地位和强大的生态优势。
周靖人表示,阿里云要通过训练及推理平台PAI、开放的模型社区魔搭、一站式模型服务平台“百炼”,来系统地服务和满足大模型生态中所有人的需求,共同促进生态繁荣。
随着大模型应用落地进入下半场,百度也在不断发力“大模型生态”ag旗舰厅网的建设。“我们希望这片土壤可以长出更多树、更多花、更多草。”百度集团资深副总裁、百度移动生态事业群组总经理何俊杰表示。
至今,百度的内容生态已有64万创作者使用AI工具生产了1400万条内容 , 获得300亿播放量。在商业生态,目前“轻舸”已经覆盖400余家企业,平均广告创编时间由2小时缩短到5分钟,平均转化量提升10%。
今年9月,百度还正式发布了文心一言插件生态平台——灵境矩阵。李彦宏表示,插件是⼀种特殊的AI原⽣应⽤,也是⻔槛最低,最容易上⼿的AI原⽣应⽤,能让开发者、创业者快速加⼊到⽣态中。目前,灵境插件平台已有2.7万开发者申请入驻,覆盖20多个领域。千帆大模型平台有42个主流大模型入驻,有17000家企业客户,覆盖了各行各业的近500个场景。这些展示了百度智能云在大模型领域的实力和生态建设成果。
此外,在2023百度云智大会上,百度发布了四个生态伙伴支持计划,包括与10+综合伙伴共同成长、与100+应用伙伴专项发展、与10000+创新企业应用服务以及代理伙伴转型升级计划。
双方对比分析来看,在生态建设方面,阿里云通过打造开源社区、汇聚大量开发者、推出优质模型等举措,形成了强大的生态优势。而百度智能云则通过发布四个生态伙伴支持计划、搭建插件平台与大模型平台等手段,积极构建大模型的生态体系。
在合作模式方面,阿里云注重与合作伙伴的协同创新,通过共同研发、优化和推广大模型应用来实现合作共赢。而百度智能云则更加注重与产业链上下游企业的合作,通过发布综合伙伴共同成长计划、应用伙伴专项发展计划等举措,建立起了较为完善的大模型合作体系。
2023年,云计算市场以及大模型之战中,依然充满了不确定性,但确定的是,随着大模型进入下半场,国内市场会带来新的一轮角逐。而阿里云与百度仍然有着毫无争议的身位优势,这些优势中既包括云计算软硬件系统的技术研发能力,也包括盈利能力。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。