
요즘 AI 이미지 생성기가 대세인데 대부분 저해상도 이미지 생성에 국한되거나 하드웨어에 비디오 메모리가 부족합니다. 이제 이에 대한 수정 사항이 하나 있습니다. 바로 “txt2imghd”라는 Stable Diffusion의 수정된 버전입니다.
새로운 txt2imghd 프로젝트는 Stable Diffusion의 또 다른 파생물에서 나온 “GOBIG” 모드를 기반으로 하며, 최근에 본 대부분의 AI 아트를 만드는 데 사용된 모델입니다. txt2imghd로 생성된 이미지는 대부분의 다른 생성기로 생성된 이미지보다 클 수 있습니다. 데모 이미지는 1536×1536인 반면 Stable Diffusion은 일반적으로 1024×768로 제한되고 Midjourney의 기본값은 512×512입니다(선택적으로 1664로 확대 x 1664).

Txt2imghd에는 이미지를 확대하는 영리한 방법이 있습니다. 프로젝트 문서에 따르면 “먼저 프롬프트에서 이미지를 생성하고 확대한 다음 확대된 이미지의 더 작은 조각에서 img2img를 실행하고 결과를 원본 이미지와 다시 혼합하여 상세한 고해상도 이미지를 만듭니다.” 비디오 카드의 한계에 대한 영리한 해결 방법이지만 예상할 수 있듯이 결과는 단일 저해상도 이미지보다 생성하는 데 시간이 더 오래 걸립니다.
업데이트된 버전은 최소 10GB의 비디오 메모리(VRAM)가 있는 그래픽 카드를 권장하는 일반 Stable Diffusion과 거의 동일한 시스템 요구 사항을 가지고 있습니다. 사용해 보고 싶다면 브라우저에서 모델을 실행할 수 있습니다(무료 GitHub 계정 필요). 아래 소스 링크에서 자신의 컴퓨터에서 실행할 코드를 다운로드할 수도 있습니다.
출처: GitHub








