北京师范大学教师主页唐志清科学研究中文主页

研究领域

研究方向：边缘智能系统

围绕“让大模型和生成式AI在资源受限的边缘环境中高效、可靠地运行”这一核心问题，研究工作沿“边缘基础设施→模型推理加速→智能体系统架构→空天地协同场景”逐层展开，形成四个相互支撑的具体方向：

1）边缘AI推理服务优化。面向边缘侧AI推理请求的高效处理，研究云-边-端协同的请求路由与负载均衡策略、资源感知的推理任务调度与容器编排机制，以及面向多模态推理的自适应任务规划方法，为上层模型服务和智能体系统提供高性能的运行基础设施。

2）边缘大模型推理加速。针对大语言模型和扩散模型等生成式AI模型在边缘部署时面临的算力与显存瓶颈，研究KV Cache优化与跨请求复用、推理轨迹缓存与重用、动态早退等推理加速技术，以及跨边缘节点的分布式并行推理策略，在有限资源条件下提升模型服务的吞吐量与响应效率。

3）边缘LLM Agent系统。在高效推理能力的基础上，研究面向边缘环境的大模型智能体系统架构，包括端侧多智能体协同与通信机制、Agent记忆与技能管理、资源感知的智能体编排与调度，以及端侧检索增强生成（RAG）与上下文状态压缩等关键技术，支撑复杂任务的自主规划与协作执行。

4）空天地协同智能计算。将上述边缘智能技术拓展至卫星-空中-地面异构算力网络场景，研究空天地一体化环境下生成式AI服务的协同调度与资源优化方法，结合数字孪生技术构建仿真与决策平台，推动边缘智能在低空经济、海洋监测、工业物联网等广域覆盖场景中的落地应用。

科研项目

论文成果

专利成果