面向自主计算的存算传融合架构及技术挑战
摘要:传统云或边缘计算模式下, 数据的存储、计算和传输分离: 终端负责指定具体的计算和关联存储节点, 网络仅在这些节点间提供传输路径而并不感知所承载的计算任务. 这种模式不仅导致海量异构存算平台难以感知识别彼此的可用资源并形成协同合力、数据存储与计算孤岛化现象严重, 还面临拓扑时变、计算节点失效等不确定性导致的任务执行时间长甚至中断等挑战. 为此, 本文提出一种面向自主计算的存算传融合网络架构, 通过构建耦合但差异化管理存算传多维资源的控制面, 以及支持形式化计算任务路由和调度的数据面, 赋能自主计算的全流程实现. 基于所提架构, 提出了多维资源状态探测、任务联合调度与服务协同部署方法, 实现任务需求拟合与环境适变的高效自主计算. 此外,本文还探讨了该架构下的挑战以及可能的未来研究方向.
