东方网—“流程编排”化算力为“算利”

正文

“流程编排”化算力为“算利”

2024-4-2 15:29 来源:解放日报作者:俞陶然选稿:潘子慧

　　人工智能大模型的兴起，让GPU（图形处理器）算力成为极其重要的资源。在这个领域，GPU算力云服务扮演着重要角色，可以实现算力资源跨地区、跨行业的自由流动。最近，国家级专精特新“小巨人”企业——上海道客，联合行业伙伴发布了“d.run算力一体化方案”。这个方案包括上海、合肥等地的算力中心服务，算法开发、模型微调等模型开发工具以及智能应用、流程编排等应用开发工具，为用户提供一个AI算力生态平台。

　　AI基础设施

　　近5年来，我国算力产业规模快速增长，年均增速超过30%，但还存在核心芯片和国产基础软件生态不强、传输能力不足、无效算力增多等挑战。上海道客创始人、首席执行官陈齐彦认为，大模型兴起后，除了GPU芯片供给不足，我国人工智能产业还面临协同服务、落地应用等方面的问题。如何提高国内已有算力的使用效率？这需要包括云服务供应商在内的算力产业链上所有企业的共同努力，打造出全方位的算力一体化解决方案。

　　2014年，来自易安信EMC中国研究院的陈齐彦团队走上创业道路，他们专注于云原生领域，使上海道客逐渐成长为这一领域的头部企业。所谓云原生，是一系列云技术和开发管理方法的集合，它们试图在动态环境中寻找最优解，可通过调度发挥算力的最大效能，实现算力资源的灵活按需分配。在云原生开源社区，道客对核心开源项目Kubernetes的贡献度排名全球第三，仅次于谷歌和红帽公司。

　　如今，这家上海企业基于云原生技术，与猴子无限等企业联手开发了旨在让算力更自由的“d.run算力一体化方案”。访问d.run，记者看到4个板块：算力集群、模型应用、模型工具和管理。在算力集群板块，用户可购买上海、合肥等地的GPU算力；在模型应用板块，可使用语料库、各种插件和数据分析工具，对垂直类模型应用进行训练和评测；在模型工具板块，多种算法开发、模型微调类工具供用户选择，包括训练大模型所必需的数据集。

　　“我们希望借助这个平台打通从GPU供应到协同服务，再到落地应用的产业链，让AI基础设施像水和电一样流向客户，助力提升我国人工智能产业的有效算力，化算力为‘算利’。”陈齐彦在发布会上说。

　　“智能体工作流”

　　作为上海道客的合作伙伴，北京猴子无限公司为d.run开发了流程编排模块。这家企业获得了奇绩创坛创始人、百度原总裁陆奇的投资，专注于模型调优。公司创始人、首席执行官尹伯昊介绍，斯坦福大学教授、著名人工智能专家吴恩达最近在社交平台X上表示：“智能体工作流”今年将推动人工智能快速发展，其智能水平可能超过下一代基础大模型。

　　什么是“智能体工作流”？目前，大语言模型根据提示词输出一篇文章，是直接生成的，这相当于人类写文章时不做任何修改，所以文章质量往往并不是很高。“智能体工作流”则与人类写文章的过程很接近，将工作流程分为写提纲、收集信息、写初稿、修改初稿等若干步骤。在执行每个步骤时，用户都可以介入，让“智能体工作流”生成的内容更符合自己的要求。

　　对于吴恩达的观点，尹伯昊十分认同：“流程数据是通向智能体的钥匙，流程驱动可以让大模型更优、更快地落地。”为此，他带领团队正在构建以流程为中心的大模型落地平台，并与上海道客合作，将“流程编排”模块嵌入d.run平台。在云原生的高可用环境中，很多企业可以为AI开放生态平台赋能，构建一套体系化流程，助力用户更快地开发出高质量的AI大模型应用。

　　吴恩达团队的实验研究发现：在零样本条件下，GPT-3.5生成内容的正确率为48.1%，GPT-4的正确率达到67.0%；如果采用“智能体工作流”模式，GPT-3.5的正确率高达95.1%，远超GPT-4。这个对比实验给尹伯昊团队带来了很大信心，而在“实战”环境中，以流程为中心的大模型落地平台能否催生高质量的AI大模型应用？还有待用户检验。