Alibaba Group представила фреймворк ArtAug для генерации изображений из текста
Исследователи Alibaba Group разработали фреймворк ArtAug, который улучшает качество генерации изображений из текстовых описаний без дополнительных вычислительных затрат на этапе инференса. Архитектура использует взаимодействие между генеративными и понимающими моделями, реализуя мультиагентную систему Chain of Thought с тремя специализированными компонентами: Data-CoT для интеграции данных, Concept-CoT для аналитического рассуждения.