
引入
延迟显著影响元宇宙用户体验,边缘计算因地理距离近延迟低具有优势,且分布式特性相比云系统有较好的安全性
元宇宙要求高效故障管理以保障用户体验连贯一致,对边缘计算是一种挑战,因此总结了近6年(18-24)的容错研究
贡献:故障模式与影响总结、容错技术总结、容错技术针对边缘计算元宇宙的有效性、研究方向与解决方案
方法
略
边缘计算中的故障类型
节点故障:
硬件故障、操作系统崩溃、虚拟机失效、进程中断及边缘设备故障。与传统云环境相比,节点故障在边缘环境中更为频发,因为地理位置、异构资源、可靠性退化等特点
表现:用户断连、高延迟、数据不一致
通信故障:
链路故障、网络拥塞、调用失败、信号波动以及延迟差异
表现:严重时信息丢失,数据流被破坏,用户被迫登出
拜占庭故障:
恶意行为相关
故障管理技术
主动监控与资源优化:
异常监测、资源分配优化
任务调度与负载迁移
节点协作、服务迁移与负载分配优化
冗余与复制
节点备份、任务检查点复制、消息复制
机器学习预测性维护
任务迁移影响预测、QoS预测、主备份任务分配
共识算法
略
未来研究方向
高效故障预测
资源感知的机器学习,提高预测精度且降低复杂度
联邦学习故障预测,保护隐私
确定性故障针对性处理,提前规避异常
任务迁移
LLM摘要,源节点保存数据关键信息摘要
数据预取预测,迁移前将必要数据预取至目标节点
结合用户反馈
数据安全与完整性
略
评论区