모든 VRAM 최적화 완벽 가이드! Wan2.1으로 성능 폭발!
게시일:
작성자: 자청의 유튜브 추출기
GPU 메모리(VRAM) 아끼고 영상 더 빨리 만드는 법! (중학생 눈높이 설명)
요즘 '원 비디오' 같은 신기한 영상 만드는 모델들이 많이 나왔는데, 이걸 내 컴퓨터에서 돌리려면 그래픽카드 메모리(VRAM)가 부족해서 버벅거리거나 아예 안 되는 경우가 많을 거야. 그래서 오늘은 VRAM을 아끼고 영상 만드는 속도를 높이는 방법을 알려줄게!
1. 모델 종류 선택하기
- FP16 vs FP8: 모델마다 FP16, FP8 이런 식으로 숫자가 붙어있는데, 숫자가 낮을수록 용량이 작고 VRAM을 덜 먹어. 대신 화질이 조금 떨어질 수 있어. VRAM이 부족하면 FP8 모델을 쓰는 게 좋아.
- FP8 모델 바로 쓰기: FP16 모델을 FP8으로 변환해서 쓰는 것보다, 처음부터 FP8으로 나온 모델을 쓰는 게 더 빠르고 좋아.
2. 모델 불러오는 방식 바꾸기
- Torch Compile: 이걸 쓰면 VRAM을 약 30% 정도 아낄 수 있어. 대신 '트라이튼'이라는 게 필요한데, 리눅스에서는 쉽게 설치되지만 윈도우는 조금 복잡할 수 있어. (그래도 윈도우용 설치 파일이 나왔으니 찾아봐!)
- Block Swap: 모델을 여러 조각(블록)으로 나눠서, 필요 없을 때는 VRAM에서 빼서 컴퓨터 메모리(RAM)에 잠시 저장해두는 거야. VRAM을 아낄 수 있지만, 데이터를 옮기는 시간이 걸려서 영상 만드는 속도는 느려질 수 있어. VRAM에 딱 맞게 블록을 조절하는 게 중요해.
- VRAM Management Args: Block Swap보다 더 VRAM을 아껴주지만, 영상 만드는 속도는 더 느려져. 정말 VRAM이 부족할 때 최후의 수단으로 써봐.
- Load Device (Offload Device): 모델을 불러올 때 'Offload Device'를 선택하면 VRAM을 가장 적게 사용해. 'Main Device'는 더 빠르지만 VRAM을 많이 먹으니까, VRAM이 아주 넉넉하지 않다면 Offload Device를 쓰는 게 좋아.
3. 모델을 다른 곳으로 옮기기
- 텍스트 인코더 오프로드: 모델을 불러올 때 '텍스트 인코더'라는 것도 같이 VRAM에 올라가는데, 이걸 다른 곳으로 옮기면 VRAM을 더 아낄 수 있어.
4. 영상 크기랑 프레임 수 조절하기
- 영상 크기: 영상이 클수록 VRAM을 많이 써. 1280x720 같은 고화질 영상은 VRAM을 엄청 잡아먹으니까, VRAM이 부족하면 영상 크기를 줄여보는 게 좋아.
- 프레임 수: 영상의 프레임 수가 많을수록 VRAM을 더 많이 써. 영상이 한 번에 여러 프레임을 같이 만들기 때문이야. VRAM이 부족하면 프레임 수도 줄여봐.
5. VAE 종류 선택하기
- FP32 VAE: 영상의 화질을 가장 좋게 만들어주지만, VRAM을 많이 써. VRAM이 부족하면 더 작은 VAE를 써야 해.
6. 디코딩 방식 조절하기
- Tiling (타일링): 영상 디코딩할 때 '타일링' 기능을 켜면 VRAM을 아낄 수 있지만, 영상에 미세한 줄무늬가 생길 수도 있어. VRAM이 부족하면 켜고, VRAM이 넉넉하면 꺼도 돼.
7. 긴 영상 만들 때 팁
- Context Options: 긴 영상을 만들고 싶은데 VRAM이 부족하면, 'Context Options' 기능을 써봐. 이건 '컨텍스트 창 슬라이딩'이라는 방식으로 작동하는데, 영상이 조금씩 어색해질 수는 있지만 긴 영상을 만들 수 있게 도와줘.
이런 방법들을 잘 활용하면 VRAM 걱정 없이 신기한 영상들을 더 쉽게 만들 수 있을 거야! 혹시 더 궁금한 점이 있다면 댓글로 남겨줘!