‌华为申请AI模型量化专利,减少内存占用‌

大模型之家讯 2月7日消息,天眼查App显示,华为技术有限公司近日公布了“人工智能模型的量化方法、处理系统和量化单元”专利。该专利的量化单元可根据计算设备的处理粒度,将量化矩阵分割成适用于各计算单元的分块量化矩阵,并进行量化处理。此方法可减少AI模型占用的内存,且量化过程不依赖于张量级别的离群值统计,实现了对权重矩阵和激活矩阵的实时量化。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注