KVCache成智能体记忆中枢

admin2周前 (05-16)62
大模型推理新范式:KVCache从临时缓存升级为智能体工作记忆,Mooncake框架实现Prefill与Decode解耦,提升多智能体协同效率。...