模型量化_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

07-19

DeepSeek如何实现模型量化压缩 DeepSeek轻量化部署技术详解

模型量化是通过降低模型参数精度来压缩模型的技术。它将传统32位浮点数（FP32）转换为16位浮点数（FP16）、8位整数（INT8）甚至4位整数，从而减少模型体...
03-07

ICLR 2025 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术，其将模型权重与激活值量化至低bit，以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言，模型...
01-15

交互方式的定义：模型量化与边缘人工智能的交互

人工智能与边缘计算的融合为许多行业带来了革命性的变化。其中，模型量化的快速创新起到了关键作用。模型量化是一种通过提高可移植性和减小模型大小来加快计算速度的技术重...

1

3

: 电话

: 客服

: 地图

: 搜索