新闻中心
-
07-19DeepSeek如何实现模型量化压缩 DeepSeek轻量化部署技术详解模型量化是通过降低模型参数精度来压缩模型的技术。它将传统32位浮点数(FP32)转换为16位浮点数(FP16)、8位整数(INT8)甚至4位整数,从而减少模型体...
-
03-07ICLR 2025 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低bit,以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言,模型...
-
01-15交互方式的定义:模型量化与边缘人工智能的交互人工智能与边缘计算的融合为许多行业带来了革命性的变化。其中,模型量化的快速创新起到了关键作用。模型量化是一种通过提高可移植性和减小模型大小来加快计算速度的技术重...
-
共1页 3条

