首页
旧时光
心安此处
向远方
技术手记
轻量化大模型部署到边缘设备的可行路径
大模型训练中的混合精度与梯度累积配置
大模型训练中的混合精度与梯度累积配置 随着深度学习模型规模的不断扩大,训练诸如GPT、BERT等大型模型对计算资源和内存提出了前所未有的挑战。为了在有限的硬件条件下高效训练这些模型…
blog
2026年2月4日