> оно выдает хорошую фотореалистичность Разумеется. Все SD-модели от Stability начиная с 1.4 имеют приоритет на фотореализм и инпейнтинг реальных изображений. С аниме сложнее.
> Но я так и не понял, что мешает инверснуть процесс - не картинка после магических слов, а слова по картинке Почему, для этого и сделан CLIP Interrogator. А здесь https://huggingface.co/spaces/shi-labs/Versatile-Diffusion все направления преобразования вообще сделаны в рамках одной модели.
>Почему так нельзя сделать с уже имеющимися моделями?