——您现在访问的是:苏州工业动画公司,3D打印服务,场景仿真数字沙盘,上海多媒体模型定制

常见问题

一种最直观的裁剪方式就是用更少位数的数值类型来存储网络参数,比如常见的做法是将 32 位浮点数模型转换成 8 位整数模型,模型大小减少为 1/4,而运行在特定的设备上其计算速度也能提升为 2~4 倍,这种模型转换方式叫做量化(Quantization)。