HD에서 안정적인 확산을 원하십니까? 이 AI Art Generator는

요즘 AI 이미지 생성기가 대세인데 대부분 저해상도 이미지 생성에 국한되거나 하드웨어에 비디오 메모리가 부족합니다. 이제 이에 대한 수정 사항이 하나 있습니다. 바로 “txt2imghd”라는 Stable Diffusion의 수정된 버전입니다.

새로운 txt2imghd 프로젝트는 Stable Diffusion의 또 다른 파생물에서 나온 “GOBIG” 모드를 기반으로 하며, 최근에 본 대부분의 AI 아트를 만드는 데 사용된 모델입니다. txt2imghd로 생성된 이미지는 대부분의 다른 생성기로 생성된 이미지보다 클 수 있습니다. 데모 이미지는 1536×1536인 반면 Stable Diffusion은 일반적으로 1024×768로 제한되고 Midjourney의 기본값은 512×512입니다(선택적으로 1664로 확대 x 1664).

프롬프트와 함께 생성된 이미지: "마을의 눈 덮인 밤에 손에 작은 불덩이를 들고 있는 숨 막힐 듯한 장엄하고 아름다운 갑옷을 입은 빨간 머리 여성 마법사의 55mm 근접 촬영 손 사진. 손을 확대합니다. 손에 초점을 맞춥니다. dof. 보케. 예술 greg rutkowski와 luis royo 제작. 극도로 사실적. 극도로 세밀하고. 니콘 d850. 시네마틱 후처리." — txt2imghd에 의해 생성된 이미지

Txt2imghd에는 이미지를 확대하는 영리한 방법이 있습니다. 프로젝트 문서에 따르면 “먼저 프롬프트에서 이미지를 생성하고 확대한 다음 확대된 이미지의 더 작은 조각에서 img2img를 실행하고 결과를 원본 이미지와 다시 혼합하여 상세한 고해상도 이미지를 만듭니다.” 비디오 카드의 한계에 대한 영리한 해결 방법이지만 예상할 수 있듯이 결과는 단일 저해상도 이미지보다 생성하는 데 시간이 더 오래 걸립니다.

업데이트된 버전은 최소 10GB의 비디오 메모리(VRAM)가 있는 그래픽 카드를 권장하는 일반 Stable Diffusion과 거의 동일한 시스템 요구 사항을 가지고 있습니다. 사용해 보고 싶다면 브라우저에서 모델을 실행할 수 있습니다(무료 GitHub 계정 필요). 아래 소스 링크에서 자신의 컴퓨터에서 실행할 코드를 다운로드할 수도 있습니다.

출처: GitHub