作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑
基于自适应张量交换和重算的大模型推理优化
梁绪宁, 王思琪, 杨海龙, 栾钟治, 刘轶, 钱德沛
Adaptive Tensor Swapping and Re-computation for Efficient Large Language Model Inference
LIANG Xuning, WANG Siqi, YANG Hailong, LUAN Zhongzhi, LIU Yi, QIAN Depei
计算机工程 . 0, (): 0 -0 .  DOI: 10.19678/j.issn.1000-3428.0070644