“我们做模型不是为了和其他模型竞争。”
在2023年世界人工智能大会期间,阿里云CTO周靖人这样说道。这似乎和许多人津津乐道的“百模大战”有些出入,不是无论大厂小厂都在开发自己的模型,然后彼此竞争么?阿里云也是其中之一啊。
这种痴迷于零和游戏的刻画其实有些粗糙而一厢情愿。它忽视了阿里云作为一家云计算厂商的本质,和它在提出模型即服务的模式后真正在一步步建设的东西。
也就是,云计算服务是它一切动作的出发点。
通义系列的模型只是其中一部分。在这之外,周靖人提醒人们关注阿里云做模型的逻辑。“我们有多重身份。”周靖人说。“我们自己的大模型是为了服务好云上的企业和ISV,让他们可以更简单地调用模型,或把大模型集成到他们的业务体系里,这样我们可以期待应用的爆发。同时,我们也要服务自研模型的创新者和模型开发者,给他们提供工具和生态。”
而无论是直接满足自己平台上的已有客户的需求,还是给更多的模型创造者们提供高质量的算力和工具等基础设施,归根到底,阿里云要通过降低门槛来让生态繁荣,让模型真正发挥作用,来解决实际问题。没人想要让大模型仅仅停留在一种被讨论被神化或被妖魔化的概念了。
更多的积木
为达到这个目标,阿里云的一个做法是,要通过各种工具建设让模型的研发和使用像搭积木一样简单。
当天周靖人公布了阿里云提供的更多的“积木”。
首先是通义大模型体系的新积木,文生图的模型通义万相。
和此前出现的通义千问,通义听悟一起,它们组成目前阿里云自己的大模型系列,并且成员肯定还会继续扩充,沿着阿里云多模态的既定路线继续进行。
据介绍,通义万相基于阿里研发的组合式生成模型Composer,简单说,它通过把图片的元素进行拆解的方法来控制生成的稳定性,这是一种基于扩散模型的组合式生成框架。周靖人参与其中的Composer 相关论文已被国际 AI 顶会 ICML 2023 收录。
在这样的新思路下,它在产品侧除了提供传统的基于提示词的文生图功能,还提供了相似图生成,可以提供想要的风格的图片来帮助生成;以及风格迁移功能,可以更直观的把一个给定图片的风格实现在另一张生成图片上。这些很明显都在解决用户生成图片的稳定性和可用性的问题。
在自研体系之外,阿里云也在为百模市场造积木,比如灵积模型服务平台。
它给模型创造者提供标准上云接口,也给要使用模型的应用开发者提供统一SDK。
对模型,它提供一系列自动化的模型上云工具链路,支持模型的自主接入,把它们引向阿里云积累的模型推理微调拓展以及自适应弹性部署等各种服务能力,并且可以根据需求进行公共部署或用户自定义独占部署等。这使得模型不仅能通过推理API被集成,也能通过训练微调API实现模型定制化。
对AI开发者,可以通过统一的SDK方便地获取不同模型并集成到自己的应用中。
当前灵积平台上托管了很多业界领先大语言模型,除了阿里云自己的通义千问,更多的是ChatGLM-v2、百川、姜子牙、Dolly等三方模型。
灵积背后是阿里云强大的算力和AI开发平台,包括传说中拥有十万卡GPU的国内最强智算集群,以及支持万卡的单任务分布式训练规模的机器学习平台PAI。
这些积木将会降低大模型的研发和使用门槛,让中国的模型市场生态更自由、更活跃。而AI开发者社区魔搭,是未来的大模型自由市场的预演。
模型自由市场的预演
魔搭社区是阿里去年推出的AI模型社区,上线以来增长惊人,短短半年多已经是国内最大的AI模型社区,目前集聚了180多万开发者和900多个优质AI模型,这些模型由20多家顶尖人工智能机构贡献,累计下载量突破3600万。这其中,有约100个参数规模在10亿以上的大模型。
在魔搭,所有模型生产者都可上传模型,验证模型的技术能力,探索模型的应用场景和商业化模式。魔搭社区打通了与灵积平台的部署链路,支持社区的模型通过灵积来实现服务化。
大会当天,阿里云又推出了一个新工具ModelScope GPT(魔搭GPT),它能任意组合、自由调度魔搭平台所有大小模型。
魔搭GPT是一个听得懂人话的工具,你只需要跟它对话,提出需求,它就可以通过中枢大模型去寻找调用小模型,组队完成你给的任务。
事实上它也是今天被越来越多模型开发者重视的AI Agent技术路线的一种,简单说就是可以基于理解自主决策的助手。
“它也是一种模型,更多是AI Agent,它通过对其他模型,甚至是对其他整个互联网的各种工具的理解,结合自然语言和多模态的能力,能够更智能化地拆解复杂问题,在每一个子问题里调用相关模型去解决。”周靖人说。
“我们需要一个通用的Agent,结合模型力量去帮我们完成各种任务。我相信这个想象空间是非常巨大的。”他说。
ModelScope GPT可以视作一种“打样”,基于魔搭社区的生态基础,开发一款工具,增加开发者与模型社区的互动,增加模型社区的要素流动,激发整个社区的创新。
据介绍,ModelScope GPT现已能够调用魔搭社区十多个核心AI模型的API,包括地址解析,信息抽取,翻译,语音视频合成等等,未来它的模型API清单会不断扩容,能力也会不断增强。
阿里云决定把ModelScope GPT的数据集和训练方案开放,供开发者自己上手,制作趁手的模型调用工具,用到任何想用的地方。
有生态,自然会有商业化
今年的人工智能大会上,大模型已经成为绝对焦点,穿梭展区和论坛,你会发现MaaS(模型即服务)概念已无处不在。
去年11月,阿里云率先在业界提出“Model as a service”概念,同时推出AI模型社区魔搭。彼时行业还响应者不多,而今天它已经衍生出各种理解。
大模型正在重塑云计算行业。云计算服务商,需要围绕AI模型这个中心,提供包括模型训练、推理、部署、精调、测评、产品化落地等全方位服务。
“阿里云在践行MaaS开发范式,围绕AI模型,重新定义和设计云产品的方方面面。”周靖人说。
某种程度上,在MaaS的思路下,阿里云平台不止服务自研模型,而更像是一个大模型的“天猫”,这是一个所有模型都可以通过它直接提供给潜在用户的平台,而非以自营为主、所有其他东西都服务于自营的模式。
“阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务。”周靖人说。只有真正让模型带来的技术能力深入群众,解决真正的问题,才能让生态繁荣。
MaaS范式也许并不直接通向某个具体的商业模式。周靖人认为,当模型自由市场的生态开始繁荣,当我们真正开始用大模型解决实际问题,商业化的模式会自然生成,而这个过程一定是基于公共云路线之上的。
“今天我们希望一个模型能够触达更多的开发者,或者说产生更多的真实价值,而它只有通过公共云的方式才能触达到全社会,今天如何利用好公共云的技术优势和价值,是企业和开发者能够实现业务突破的重要方面。”
云计算就是以基础设施的方式让更多人享用计算能力,大模型归根结底也是计算能力的一次进步,而让更多人以更低门槛获得新技术带来的新计算能力,才是云厂商该扮演的角色。