Vietnam.vn - Nền tảng quảng bá Việt Nam

새로운 AI 도구, 기존보다 9배 더 빠르게 고품질 사진 생성

MIT와 NVIDIA의 과학자들은 HART를 성공적으로 개발했습니다. HART는 매우 빠른 속도로 고품질 이미지를 생성하는 도구로, 노트북이나 스마트폰에서 직접 실행할 수 있을 만큼 리소스 소모가 적습니다.

VietNamNetVietNamNet26/03/2025

그림 1.jpg

말을 타고 있는 우주인의 이미지는 두 가지 유형의 생성적 AI 모델을 결합한 것입니다. 사진: MIT 뉴스


속도와 품질이 더 이상 상충되지 않을 때

AI 이미징 분야에는 현재 두 가지 주요 접근 방식이 있습니다.

확산 모델을 사용하면 선명하고 세부적인 이미지를 얻을 수 있습니다. 하지만 각 픽셀에서 노이즈를 제거하려면 수십 개의 처리 단계가 필요하므로 매우 느리고 계산 집약적입니다.

반면에 자기회귀 모델은 이미지의 작은 부분을 순차적으로 예측할 수 있기 때문에 훨씬 빠르게 작동합니다. 하지만 이런 방식은 종종 세부 묘사가 부족한 이미지를 만들어내고 오류가 발생하기 쉽습니다.

HART(하이브리드 자기회귀 변압기)는 두 가지를 결합하여 "두 가지의 장점"을 제공합니다. 첫째, 자기회귀 모델을 사용하여 이미지를 개별 토큰으로 인코딩하여 전체 이미지를 구성합니다. 그러면 가벼운 확산 모델은 인코딩 중에 손실된 자세한 정보인 잔여 토큰을 추가합니다.

그 결과 생성된 이미지는 최첨단 확산 모델과 비슷하거나 더 나은 품질을 가지지만, 처리 속도가 9배 빠르고 컴퓨팅 리소스는 31% 더 적게 사용합니다.

고속으로 고품질 이미지를 생성하는 새로운 접근 방식

HART의 주목할 만한 혁신 중 하나는 자기회귀 모델을 사용할 때 정보 손실 문제를 해결하는 방법입니다. 이미지를 개별 토큰으로 변환하면 작업 속도는 빨라지지만 객체의 모서리, 얼굴 특징, 머리카락, 눈, 입 등과 같은 중요한 세부 정보가 손실됩니다.

HART의 솔루션은 확산 모델이 잔여 토큰을 통해 이러한 세부 사항을 "패치"하는 데만 집중하도록 하는 것입니다. 그리고 자기회귀 모델이 대부분의 작업을 수행했기 때문에 확산 모델에는 이전의 30단계가 넘는 대신 8단계의 처리 단계만 필요합니다.

공동 저자인 하오티안 탕은 "확산 모델은 구현하기 쉬워 효율성이 더 높다"고 설명했습니다.

구체적으로, 7억 개의 매개변수를 갖는 자기회귀 변환기 모델과 3,700만 개의 매개변수를 갖는 경량 확산 모델을 결합하면 HART는 최대 20억 개의 매개변수를 갖는 확산 모델과 동일한 성능을 제공하지만 9배 더 빠릅니다.

처음에 연구팀은 확산 모델을 영상화의 초기 단계에 통합하려고 시도했지만, 이로 인해 오류가 누적되었습니다. 가장 효율적인 방법은 확산 모델이 마지막 단계를 처리하고 이미지의 "누락된" 부분에만 집중하는 것입니다.

멀티미디어 AI의 미래를 열다

연구팀의 다음 방향은 HART 아키텍처를 기반으로 한 차세대 시각 언어 AI 모델을 구축하는 것입니다. HART는 확장 가능하고 다양한 유형의 데이터(멀티모달)에 적응 가능하므로 비디오 생성, 오디오 예측 및 기타 여러 분야에 적용할 수 있을 것으로 기대됩니다.

이 연구는 MIT-IBM Watson AI 연구소, MIT-Amazon 과학 센터, MIT AI 하드웨어 프로그램, 미국 국립과학재단을 포함한 여러 기관의 자금 지원을 받았습니다. NVIDIA는 또한 모델을 훈련하기 위해 GPU 인프라를 기부했습니다.

(MIT 뉴스에 따르면)


출처: https://vietnamnet.vn/cong-cu-ai-moi-tao-anh-chat-luong-cao-nhanh-gap-9-lan-2384719.html


댓글 (0)

No data
No data

같은 태그

같은 카테고리

4월 30일 퍼레이드를 위해 36개 군·경찰 부대가 훈련하고 있다.
베트남뿐만 아니라..., 그리고...!
빅토리 - 베트남에서의 인연: 최고의 음악과 세계의 자연경관이 어우러진 순간
4월 30일 기념행사를 위해 전투기와 1만 3천 명의 군인이 처음으로 훈련을 실시했습니다.

같은 저자

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품