Recraft AI — это инструмент проектирования, работающий на основе фирменных моделей диффузии. Их новая модель Red Panda превосходит все существующие модели преобразования текста в изображение, включая Midjourney, DALL-E 3, FLUX. Recraft сочетает уникальный пользовательский опыт для дизайнеров с передовыми инструментами ИИ. Для поддержки миллионов пользователей модели диффузии требуют надежной инфраструктуры вывода — объединения мощного оборудования с эффективным программным обеспечением. В этой статье мы рассмотрим, как инструменты ускорения ИИ TheStage помогли инженерам и исследователям ИИ Recraft достичь двукратного увеличения производительности на графических процессорах Nvidia с помощью интуитивно понятного интерфейса Python!
Модели диффузии показали исключительные результаты в последние годы для генерации контента, включая изображения, музыку, видео и 3D-сетки. Эти модели используют затраты времени на вычисление вывода для итеративного улучшения результатов генерации, слегка обновляя вывод на каждом шаге вывода. Теперь мы можем увидеть аналогию в LLM, которые используют рассуждения через многошаговый вывод для предоставления высококачественного ответа.
В TheStage AI мы создаем общую математическую структуру для произвольных моделей PyTorch для полностью автоматической обработки сложного потока ускорения модели. Наша система автоматически обнаруживает существующие оптимизации на вашем оборудовании (квантизация, разрежение) и выбирает для каждого слоя подходящий алгоритм для достижения наилучшего качества с желаемым размером модели и ограничениями по задержке или нахождения наилучшего ускорения с ограниченными ограничениями по качеству. Это сложная математическая задача, которую мы можем решить высокоэффективным способом! В этой статье рассматривается, как мы применяем эти инструменты в рамках нашего партнерства с Recraft AI.
При разработке наших инструментов мы решили руководствоваться следующими принципами:
Учитывая эти исходные условия, мы стремились создать инструменты со следующими характеристиками:
На каждой итерации процесса диффузии нейронная сеть шумоподавляет изображение в скрытом пространстве вариационного автокодировщика. Затем вновь полученное изображение снова смешивается с шумом, но с постепенно уменьшающимся весом. Во время начальных итераций модель диффузии рисует основную сцену, используя значительный вес шума для внесения существенных улучшений. На более поздних итерациях она уточняет высокочастотные детали. Это наблюдение позволяет нам проектировать определенные конвейеры ускорения, стратегически распределяя пропускную способность сети по слоям от итерации к итерации, сохраняя качество. Однако такое распределение требует специализированных инструментов, которые сочетают математические идеи со звуковой инженерией — вот где TheStage AI может оказать существенную помощь!
Ускоряющиеся модели диффузии можно рассматривать как ускорение произвольных DNN, но нам нужно учитывать определенные проблемы. Например, статическое квантование, которое обычно обеспечивает значительное ускорение, вносит проблему в модели диффузии, поскольку распределения активации изменяются от итерации к итерации. Чтобы решить эту проблему, нам нужно либо правильно оценить оптимальные значения для всех итераций, либо использовать разные настройки квантования для каждой итерации.
Модели диффузии сложно обучить и достичь высокой производительности. Тем не менее, результаты , продемонстрированные командой Recraft, превосходят все современные модели преобразования текста в изображение . Проверка деградации таких моделей может быть сложной, поэтому крайне важно использовать методы ускорения, которые сохраняют исходную семантику признаков. Алгоритмы квантования могут быть хорошим выбором, если они могут справиться с проблемой изменения распределений активации. Давайте рассмотрим наши автоматические конвейеры, которые мы опишем в следующих разделах.
Профилирование заданной модели с определенными данными позволяет:
После того, как профилировщик соберет все необходимые данные, мы можем запустить нашу доску ANNA и переместить ползунок для создания различных оптимизированных версий модели. Затем наши пользователи могут выбрать лучших кандидатов на основе компромисса между качеством и стоимостью вывода. Наши инструменты обрабатывают эти субъективные решения о качестве простым способом.
Как упоминалось ранее, мы не используем JIT-компиляцию, поскольку она увеличивает время холодного старта нового узла. Мы также не используем готовые компиляторы. Вместо этого мы компилируем нашу собственную сложную ускоренную конфигурацию, которая может смешивать различные алгоритмы. Чтобы добиться этого, мы разработали наш собственный внутренний протокол для определения слоев с ускорением DNN аппаратно-независимым способом. Одним из ключевых преимуществ фреймворка ускорения ИИ TheStage является то, что одна контрольная точка может быть скомпилирована для широкого спектра оборудования, решая проблему кроссплатформенной совместимости для программного обеспечения ИИ. Эта функция будет особенно важна для развертывания периферийных устройств при разработке приложений.
Цели компиляторов DNN:
Серверы вывода и конвейеры автоматического масштабирования играют важную роль в экономически эффективной и производительной обработке входящих запросов. Они также могут включать конкретную группировку запросов и сбор статистики для настройки предиктивного масштабирования для автомасштаберов. В наших будущих статьях мы более подробно обсудим эффективные серверы вывода!
Применяя весь конвейер, мы можем достичь производительности, которая лучше, чем у компилятора PyTorch ( torch.compile
) и, конечно, значительно лучше, чем float16 жадное выполнение PyTorch. Более того, поскольку компилятор PyTorch использует подход JIT-компиляции при каждой инициализации модели, он требует перекомпиляции для большого количества входных размеров, что делает холодный старт достаточно долгим для практических приложений, где задержка имеет большое значение.
Вот основные бизнес-преимущества ускорения продукта Recraft:
Инструменты оптимизации ИИ TheStage позволяют нам ускорить преобразование текстовых моделей в изображения без ухудшения качества, создавая лучший пользовательский опыт для наших клиентов.
Генеральный директор Recraft Анна Вероника Дорогуш
Эти результаты обеспечивают отличную проверку наших инструментов и исследований в области продуктов с высокой рабочей нагрузкой. Команда TheStage AI продолжает работать над достижением еще большей производительности. Чтобы достичь этого, мы сотрудничаем с выдающимися партнерами! Мы глубоко признательны:
Не стесняйтесь обращаться к нам по любым вопросам! Мы можем помочь вам сократить расходы на инфраструктуру вывода!
Наш адрес электронной почты: hello@thestage.ai
Главная страница TheStage AI: thestage.ai
Платформа оптимизации вывода TheStage AI: app.thestage.ai