拖延症终于更了…这篇文章 25 年春节前首发在我的公众号,后来又发在了知乎。那时候关于 DeepSeek v3 量化的系统性解读还不算多,这篇算是比较早做分享的,后来也意外收获了一些关注。
DeepSeek-V3 横空出世,不仅效果惊人,训练和推理成本也极低。
一个重要的原因就是采用了 FP8 进行训练和推理。
今天我们来一起探究其中的原理:
Group/Block-wise 量化
分块量化(Block-wise Quantization),也称为分组量化(Per-group Quantization),是一种细粒度量化方法。
more >>