DragGAN AI 툴 소개
사용자의 요구를 충족하는 시각적 콘텐츠를 합성하려면 생성된 개체의 포즈, 모양, 표정 및 레이아웃에 대한 유연하고 정밀한 제어가 필요한 경우가 많습니다. 기존 접근 방식은 종종 유연성, 정밀도 및 일반성이 부족한 이전 3D 모델 또는 수동으로 주석이 달린 훈련 데이터를 통해 GAN(Generative Adversarial Networks)의 제어 가능성을 얻습니다.
이 작업에서 우리는 그림 1과 같이 사용자 상호 작용 방식으로 대상 지점에 정확하게 도달하기 위해 이미지의 모든 지점을 "드래그"하는 GAN을 제어하는 강력하지만 훨씬 더 쉬운 방법을 연구합니다.
이를 달성하기 위해 다음과 같은 두 가지 주요 구성 요소로 구성된 DragGAN을 제안합니다.
1) 핸들 포인트를 대상 위치로 이동하도록 구동하는 기능 기반 모션 감독,
2) 차별적 GAN 기능을 활용하여 핸들 포인트의 위치를 계속 파악하는 새로운 포인트 추적 방식.
DragGAN을 통해 누구나 픽셀의 위치를 정밀하게 제어하여 이미지를 변형할 수 있으므로 동물, 자동차, 인간, 풍경 등과 같은 다양한 범주의 포즈, 모양, 표현 및 레이아웃을 조작할 수 있습니다.
GAN의 생성 이미지 매니폴드는 가려진 콘텐츠를 환각시키고 개체의 강성을 일관되게 따르는 모양을 변형하는 것과 같은 까다로운 시나리오에서도 사실적인 출력을 요구하고 있습니다.
정성적 및 정량적 비교 모두 이미지 조작 및 점 추적 작업에서 이전 접근 방식에 비해 DragGAN의 이점을 보여줍니다. 또한 GAN 반전을 통해 실제 이미지를 조작하는 방법도 보여줍니다.
새로운 AI 연구를 통해 이미지를 클릭하고 드래그하여 몇 초 만에 조작할 수 있는 툴이 나왔습니다.
Photoshop의 Warp 도구와 비슷하지만 훨씬 더 편리하고 좋습니다. 주변의 픽셀을 스매싱하는 것이 아니라 AI를 사용하여 기본 개체를 다시 생성합니다. 이미지를 3D처럼 회전할 수도 있습니다.
아래 링크를 클릭하시면 동영상으로 어떤 기능인지 정확하게 확인할 수 있습니다.
댓글