副教授 博士生导师 硕士生导师
研究方向:边缘智能系统
围绕“让大模型和生成式AI在资源受限的边缘环境中高效、可靠地运行”这一核心问题,研究工作沿“边缘基础设施→模型推理加速→智能体系统架构→空天地协同场景”逐层展开,形成四个相互支撑的具体方向:
1)边缘AI推理服务优化。面向边缘侧AI推理请求的高效处理,研究云-边-端协同的请求路由与负载均衡策略、资源感知的推理任务调度与容器编排机制,以及面向多模态推理的自适应任务规划方法,为上层模型服务和智能体系统提供高性能的运行基础设施。
2)边缘大模型推理加速。针对大语言模型和扩散模型等生成式AI模型在边缘部署时面临的算力与显存瓶颈,研究KV Cache优化与跨请求复用、推理轨迹缓存与重用、动态早退等推理加速技术,以及跨边缘节点的分布式并行推理策略,在有限资源条件下提升模型服务的吞吐量与响应效率。
3)边缘LLM Agent系统。在高效推理能力的基础上,研究面向边缘环境的大模型智能体系统架构,包括端侧多智能体协同与通信机制、Agent记忆与技能管理、资源感知的智能体编排与调度,以及端侧检索增强生成(RAG)与上下文状态压缩等关键技术,支撑复杂任务的自主规划与协作执行。
4)空天地协同智能计算。将上述边缘智能技术拓展至卫星-空中-地面异构算力网络场景,研究空天地一体化环境下生成式AI服务的协同调度与资源优化方法,结合数字孪生技术构建仿真与决策平台,推动边缘智能在低空经济、海洋监测、工业物联网等广域覆盖场景中的落地应用。