Recraft AI, tescilli difüzyon modelleri tarafından desteklenen bir tasarım aracıdır. Yeni modelleri Red Panda, Midjourney, DALL-E 3, FLUX dahil olmak üzere mevcut tüm metinden görüntüye modellerini geride bırakıyor . Recraft, tasarımcılar için benzersiz bir kullanıcı deneyimini son teknoloji AI araçlarıyla birleştiriyor. Milyonlarca kullanıcıyı desteklemek için difüzyon modelleri, güçlü donanımları verimli yazılımlarla birleştiren sağlam çıkarım altyapısı gerektirir. Bu makalede, TheStage AI hızlandırma araçlarının, Recraft'ın AI mühendislerinin ve araştırmacılarının sezgisel bir Python arayüzü aracılığıyla Nvidia GPU'larında 2 kata kadar performans elde etmelerine nasıl yardımcı olduğunu inceleyeceğiz!
Yayılma modelleri, son yıllarda görseller, müzik, videolar ve 3B ağlar dahil olmak üzere içerik üretimi için olağanüstü sonuçlar göstermiştir. Bu modeller, üretim sonuçlarını yinelemeli olarak iyileştirmek için çıkarım zamanı hesaplama maliyetlerini kullanır ve her çıkarım adımında çıktıyı hafifçe günceller. Artık çok adımlı çıkarım yoluyla akıl yürütmeyi kullanarak yüksek kaliteli yanıtlar sağlayan LLM'lerde benzetme görebiliyoruz.
TheStage AI'da, karmaşık model hızlandırma akışını tamamen otomatik olarak ele almak için keyfi PyTorch modelleri için genel matematiksel çerçeve oluşturuyoruz. Sistemimiz, donanımınızda mevcut optimizasyonları (kunatizasyon, seyreltme) otomatik olarak algılar ve istenen model boyutu ve gecikme kısıtlamalarıyla en iyi kaliteyi elde etmek veya kısıtlı kalite kısıtlamalarıyla en iyi hızlandırmayı bulmak için her katman için uygun algoritmayı seçer. Bu, son derece verimli bir şekilde çözebileceğimiz zor bir matematiksel problemdir! Bu makale, Recraft AI ile ortaklığımız aracılığıyla bu araçları nasıl uyguladığımızı inceliyor.
Araçlarımızı tasarlarken aşağıdaki ilkelere uymaya karar verdik:
Bu başlangıç koşulları göz önüne alındığında, aşağıdaki özelliklere sahip araçlar yaratmayı amaçladık:
Difüzyon sürecinin her yinelemesinde, bir sinir ağı Varyasyonel OtoKodlayıcının gizli uzayındaki görüntüyü gürültüden arındırır. Yeni elde edilen görüntü daha sonra tekrar gürültüyle karıştırılır, ancak giderek daha az ağırlıkla. İlk yinelemeler sırasında, difüzyon modeli ana sahneyi çizer ve önemli yükseltmeler yapmak için önemli gürültü ağırlığından yararlanır. Daha sonraki yinelemelerde, yüksek frekanslı ayrıntıları iyileştirir. Bu gözlem, yinelemeden yinelemeye katmanlar arasında ağ kapasitesini stratejik olarak tahsis ederek belirli hızlandırma boru hatları tasarlamamızı ve kaliteyi korumamızı sağlar. Ancak, böyle bir tahsis, matematiksel içgörüleri sağlam mühendislikle birleştiren özel araçlar gerektirir - TheStage AI'nın önemli ölçüde yardımcı olabileceği yer burasıdır!
Hızlanan difüzyon modelleri, keyfi DNN'leri hızlandırmak olarak görülebilir, ancak belirli zorlukları hesaba katmamız gerekir. Örneğin, tipik olarak önemli bir hızlanma sağlayan statik kantizasyon, aktivasyon dağılımları yinelemeden yinelemeye değiştiğinden difüzyon modellerinde bir zorluk ortaya çıkarır. Bunu ele almak için, tüm yinelemeler için en uygun değerleri doğru bir şekilde tahmin etmemiz veya her yineleme için farklı kantizasyon kurulumları kullanmamız gerekir.
Difüzyon modellerinin eğitilmesi ve yüksek performans elde edilmesi zordur. Yine de, Recraft ekibi tarafından gösterilen sonuçlar tüm modern metinden görüntüye modellerden daha iyi performans göstermektedir . Bu tür modellerin bozulmasını doğrulamak zor olabilir ve bu da orijinal özellik semantiğini koruyan hızlandırma tekniklerinin kullanılmasını önemli hale getirir. Niceleme algoritmaları, değişen aktivasyon dağılımlarının zorluğunun üstesinden gelebiliyorlarsa iyi bir seçim olabilir. Aşağıdaki bölümlerde açıklayacağımız otomatik boru hatlarımıza bir göz atalım.
Belirli bir veriyle belirli bir modelin profilini çıkarmak şunları sağlar:
Profil oluşturucu gerekli tüm verileri topladıktan sonra, ANNA panomuzu başlatabilir ve kaydırıcıyı farklı optimize edilmiş model sürümleri üretmek için hareket ettirebiliriz. Kullanıcılarımız daha sonra kalite ile çıkarım maliyeti arasındaki dengeye göre en iyi adayları seçebilir. Araçlarımız bu öznel kalite kararlarını basit bir şekilde ele alır.
Daha önce de belirtildiği gibi, yeni bir düğümün soğuk başlatma süresini artırdığı için JIT derlemesini kullanmıyoruz. Ayrıca hazır derleyiciler de kullanmıyoruz. Bunun yerine, farklı algoritmaları karıştırabilen kendi karmaşık hızlandırılmış yapılandırmamızı derliyoruz. Bunu başarmak için, DNN hızlandırılmış katmanlarını donanımdan bağımsız bir şekilde tanımlamak için kendi dahili protokolümüzü geliştirdik. TheStage AI hızlandırma çerçevesinin temel faydalarından biri, tek bir kontrol noktasının çok çeşitli donanımlar için derlenebilmesi ve AI yazılımı için platformlar arası uyumluluğu çözebilmesidir. Bu özellik, uygulama geliştirmede uç cihaz dağıtımı için özellikle önemli olacaktır.
DNN derleyicilerinin hedefleri şunlardır:
Çıkarım sunucuları ve otomatik ölçekleme hatları, gelen isteklerin maliyet etkin ve verimli bir şekilde işlenmesinde önemli bir rol oynar. Ayrıca, otomatik ölçekleyiciler için tahmini ölçeklemeyi ayarlamak üzere belirli istek gruplandırma ve istatistik toplamayı da içerebilir. Gelecek makalelerimizde, verimli çıkarım sunucularını daha ayrıntılı olarak ele alacağız!
Tüm boru hattını uygulayarak Pytorch derleyicisinden ( torch.compile
) ve tabii ki float16 istekli PyTorch yürütmesinden önemli ölçüde daha iyi bir performans elde edebiliriz. Dahası, PyTorch derleyicisi her model başlatmada JIT derleme yaklaşımını kullandığından, çok sayıda giriş boyutu için yeniden derleme gerektirir, bu da gecikmenin oldukça önemli olduğu pratik uygulamalar için soğuk başlatmayı yeterince uzun hale getirir.
Recraft'ın ürünü için ortaya çıkan hızlanmanın temel ticari faydaları şunlardır:
TheStage AI optimizasyon araçları, metinden resme dönüştürme modellerimizi kalite kaybı olmadan hızlandırmamızı sağlayarak müşterilerimiz için daha iyi bir kullanıcı deneyimi yaratıyor.
CEO Recraft, Anna Veronika Dorogush
Bu sonuçlar, yüksek ölçekli iş yükü ürünlerine yönelik araçlarımızın ve araştırmalarımızın mükemmel bir şekilde doğrulanmasını sağlar. TheStage AI ekibi, daha da yüksek performans sunmak için çalışmaya devam ediyor. Bunu başarmak için olağanüstü ortaklarla iş birliği yapıyoruz! Şunlara derinden minnettarız:
Herhangi bir sorunuz varsa bizimle iletişime geçmekten çekinmeyin! Çıkarım altyapısı maliyetlerini azaltmanıza yardımcı olabiliriz!
E-postamız: hello@thestage.ai
TheStage AI ana sayfası: thestage.ai
TheStage AI çıkarım optimizasyon platformu: app.thestage.ai