近日,《中国教育网络》杂志开展了一项关于高校算力建设情况的问卷调查,旨在了解人工智能融入高等教育趋势下,高校算力平台建设的现状与规划,挑战与机遇,以及如何促进其可持续发展。
调查结果显示,在生成式人工智能出现后,84.38%的受访者表示学校计划建设或将持续投入建设智算平台,显示出对智能计算能力的强烈需求,可能与当前人工智能的发展密切相关。当前,高校算力平台的服务功能覆盖广泛,表现为以科研计算为核心,扩展多元化服务。然而,高校算力平台普遍存在可持续发展挑战,主要体现在资金、生态、人才、体制机制等方面。要促进算力平台的可持续发展,就需要在管理体系优化、人才队伍建设、硬件环境提升等方面做出持续努力。
本次问卷调查通过小程序链接的形式,在人数为496人的高校高性能计算(HPC)技术讨论社群中发出调查邀请,该社群的主要成员为高校的算力平台负责人和运营人员。共收到36份答卷,去除重合高校、非高校机构的答卷,有效答卷数量为32份。本次调查的样本来源为HPC社群成员,调查结果仅代表该社群内高校算力平台建设情况,无法反映全国高校的算力平台建设情况。
建设现状与规划
调查显示,所有受访者(100%)都表示自己所在的高校已有自建的算力。其中,96.88%的高校建设了超算,59.38%的高校建设了智算,28.13%的高校建设了通算。
未来,84.38%的高校计划或将持续投入建设智算,50%的高校计划建设超算,28.13%的高校计划建设通算(图1)。
图1 高校算力平台未来建设规划
每年,各高校的算力平台所获得的资金投入从0到1000万不等。有的受访者表示学校每年投入100万元;有的受访者表示运维费30万,建设费用单独规划;有的受访者表示平均1000万以上,投入年份不均匀;有的受访者表示2019年~2021年共投入了4000万左右;不少受访者表示投入金额为0,学校暂无持续的投入。
自从生成式人工智能大模型出现后,将人工智能与高校的教学、科研、管理相结合是大势所趋,这对学校的算力提出了新要求。在本次问卷调查中,有78.13%的受访者表示学校对算力的需求显著增加,15.63%的受访者表示学校对算力的需求并未显著增加。
运营机制
虽然所有受访高校都建设了算力平台,但算力的来源并不单一,在高度依赖自建平台(93.75%)的同时,通过外部算力予以补充也很常见。外部算力通常包括国家超算中心或区域算力枢纽接入、校企合作共建算力平台、云服务,6.25%的受访者表示其所在高校的算力还有其他来源(图2)。
图2 高校算力资源的主要来源渠道
高校算力平台所提供的服务覆盖范围较为广泛,表现为以科研计算为核心,拓展多元化支持。调查结果显示,所有高校的算力平台都提供科研计算支持服务,75%提供教学与实验支撑服务,65.63%提供用户培训服务,56.25%提供数据存储与管理服务,43.75%作为跨学科协作平台,3.13%提供其他服务(图3)。
图3 高校算力平台提供的服务类型
高校算力平台的运营单位差异显著,部分高校的算力平台由多单位联合运营。超80%的算力平台由信息中心或其下辖团队管理,凸显了技术部门的核心优势与主导地位。然而院系分散管理与外包运营的情况在部分高校中依然存在,多头管理可能导致效率低下(图4)。
图4 高校算力平台运营单位
56.25%的受访者表示算力平台由信息中心运营,25%的受访者表示由信息中心下辖算力团队运营,21.88%的受访者表示由独立算力团队运营,由计算机学院运营、院系分散管理、外包运营的均占9.38%。
各高校算力平台的运营团队规模呈现巨大差异。近七成高校算力平台运营团队人员不足5人(68.75%),甚至存在“一人多岗”现象,反映出多数高校对算力服务的运维投入严重不足(图5)。
图5 高校算力平台运营团队规模
数据显示,68.75%的受访者表示运营队伍人数为0~5人,12.5%的受访者表示运营队伍人数为5~10人,运营队伍人数为10~20人、20~30人、30人以上的均占6.25%。
高校算力平台的运营资金来源较为多元。数据显示,超六成受访者表示算力平台依赖财政拨款(62.5%),部分高校的资金来源于用户付费(46.88%)和科研经费(37.5%)。12.5%的高校选择了“其他”。其中,有的高校表示资金来自部门运维经费;有的表示缺乏资金购买服务器,也缺乏资金用于运营(图6)。
图6 高校算力平台运营资金来源
高校算力资源的利用率呈不同的分布。数据显示,半数高校的算力资源利用率高于75%,资源利用效率高的原因可能是进行了校级平台整合。少数高校的资源利用率低于25%,可能存在“算力孤岛”,资源难以得到有效利用(图7)。
图7 高校算力资源利用率情况
具体数据为,一半的高校算力利用率高于75%,利用率为50%~75%的高校占比37.5%,利用率为25%~50%的高校占比6.25%,利用率在25%以下的高校占比3.13%。
高校算力资源分配以“先到先得”为主,其次是由需求主导的分配策略。数据显示,近七成高校(65.63%)采用“排队先后”的分配原则,部分高校依据项目紧急度(18.75%)和学科优先级(9.38%)调整资源供给,反映当前高校的算力调度大都为按顺序分配的模式,部分高校探索了效率或学科发展优先的分配模式(图8)。
图8 高校算力资源分配机制
促进高校算力平台的可持续发展
高校算力平台可持续发展的挑战主要集中在资金、生态、人才、体制机制短板等方面,并呈现多种压力并存的态势(图9)。
图9 高校算力平台可持续发展面临的挑战
数据显示,超九成高校(93.75%)将“资金的可持续性”列为核心挑战。同时,半数以上高校的算力平台面临软件生态(56.25%)、专业人才缺口(56.25%)及体制机制不完善(53.13%)的制约。此外,硬件技术壁垒(46.88%)与用户经验不足(31.25%)等问题也不容忽视。除此之外,还有高校反映“领导重视程度不够”(3.13%),“算力尤其显卡目前代际之间性能差距较大,完成立项采购建成后算力可能不再领先”(3.13%)等问题。
高校与外部机构算力合作方面,主要聚焦能力共建与资源共享,形成“人才-资源-项目”协同。数据显示,超七成高校计划通过联合培养人才(75%)和共享算力资源(62.5%)深化外部合作,半数高校推进联合项目开发(50%),体现高校正在以技术能力互补、资源集约利用为核心,构建产学研深度融合的算力生态体系(图10)。
图10 高校与外部机构的算力合作形式
调查显示,当前高校算力的可持续发展面临多重挑战,主要包括人才队伍建设不足、资金投入不够、人才培养体系不完善等。同时,由于缺乏有效的管理和协调机制,导致资源配置不均。此外,校领导的重视程度和政策支持方面的不可预测性也影响了发展的持续性和稳定性。
图11 可持续发展的建议
当被问及如何促进算力平台的可持续发展时,受访者的回答体现出一种共识,那就是制度、人才、设备、系统都很重要。
具体而言,自身定位与资金投入方面,需要得到校领导的高度重视,在政策扶持和资源配置方面予以适度倾斜,同时给予持续投入的资金。体制机制方面,要增强制度的包容性,健全培养体系和奖励机制。人才队伍建设方面,要建立一支高水平的、具有专业背景的人才队伍。用户服务方面,要协助用户取得更高水平的成果。基础设施保障方面,要提供必要的空间与电力保障,确保设备正常运转。
来源:《中国教育网络》
撰文:陈茜