Инструмент сжатия и развертывания моделей
Эффективность выполнения, объем используемой памяти и энергопотребление являются решающими факторами при развертывании модели. Чтобы обеспечить переносимость на устройства с жесткими вычислительными средами, мы внедрили методы сжатия моделей, такие как квантование, сокращение и дистилляция, и включили их в конвейер производства моделей. Такие методы могут преобразовать обученную модель в облегченную модель, которая быстрее работает на периферийных устройствах и потребляет меньше памяти, сохраняя при этом сопоставимую точность.