
최근 AI 기술을 활용한 립싱크 노래 쇼츠가 유튜브에서 폭발적인 인기를 끌고 있습니다. 한 달 만에 15만 구독자를 달성하고 단일 영상이 4,600만 조회수를 기록하는 등 놀라운 성과를 보여주고 있습니다. 이러한 콘텐츠는 특별한 기술 없이도 10분 안에 제작할 수 있다는 점에서 많은 창작자들의 관심을 받고 있습니다. 하지만 실제 수익화와 지속 가능성 측면에서는 신중한 접근이 필요합니다.
수노 AI를 활용한 커스텀 AI 노래 제작
AI 립싱크 쇼츠 제작의 핵심은 고품질의 AI 노래를 만드는 것입니다. 수노 AI는 이러한 작업에 가장 효과적인 도구로 평가받고 있습니다. 먼저 유튜브에서 원하는 스타일의 팝송을 찾아 링크를 복사한 후, ChatGPT에 해당 링크를 붙여 넣고 비슷한 분위기의 한국어 노래를 만들어 달라고 요청합니다. 이때 제목과 가사는 한국어로, 수노 AI에 사용할 스타일 설명은 영어로 작성해 달라고 구체적으로 명시하는 것이 중요합니다.
수노 AI의 상업적 사용을 위해서는 프로 플랜 구독이 필요합니다. 하지만 프로모션 코드 '사운드웨어'를 입력하면 2개월 동안 총 20달러의 구독료를 할인받을 수 있습니다. 월 결제로 전환한 후 프로모션 코드를 적용하면 실질적으로 두 달간 무료로 사용할 수 있습니다. 다만 3개월 차부터 자동 결제가 되므로, 원치 않는다면 미리 좌측 하단 업그레이드 메뉴에서 캔슬 플랜을 클릭하여 구독을 취소해야 합니다.
수노 AI 메인 홈페이지에서 크리에이트를 클릭하고 버전 4.5를 선택합니다. 이는 최근 업데이트된 버전으로 이전 버전보다 훨씬 향상된 퀄리티를 제공합니다. ChatGPT에서 생성한 가사를 복사하여 붙여 넣고, 스타일 설명 프롬프트와 제목을 순서대로 입력한 후 크리에이트 버튼을 클릭하면 AI 노래가 생성됩니다. 실제로 한국어 가사를 자연스럽게 소화하는 여성 보컬의 팝송을 10분 이내에 완성할 수 있습니다. 생성된 여러 버전 중 가장 마음에 드는 것을 선택하여 다운로드하면 됩니다.
하지만 이러한 AI 생성 음악의 상업적 활용에는 한계가 있습니다. 수노 AI로 만든 노래는 창의성은 있지만 저작권 이슈나 유튜브의 AI 콘텐츠 정책 변화에 취약할 수 있습니다. 무료 크레디트로 20~30개의 샘플을 먼저 제작하여 알고리즘 반응을 테스트해 보는 것이 현명한 접근법입니다.
소라 AI와 미드저니를 통한 고품질 이미지 생성
AI 립싱크 쇼츠의 시각적 완성도는 이미지 퀄리티에 달려 있습니다. 먼저 참고할 예시 채널에서 마음에 드는 이미지를 찾아 캡처합니다. 해당 이미지를 ChatGPT에 업로드하고 "이런 한국 여성 이미지를 만들고 싶은데 이미지 프롬프트를 작성해 달라"라고 요청하면 상세한 AI 이미지 프롬프트가 생성됩니다.
소라 AI에 접속하여 하단 프롬프트란에 ChatGPT가 생성한 프롬프트를 붙여 넣습니다. 화면 비율을 2대 3으로 설정한 후 이미지를 생성하면 됩니다. 퀄리티 비교를 위해 같은 프롬프트를 미드저니에서도 사용해 볼 수 있습니다. 미드저니에서는 프롬프트를 입력한 후 세팅에서 화면 비율을 9대 16으로 설정하고 이미지를 생성합니다.
실제 비교 결과, 같은 프롬프트를 사용했을 때 소라 AI가 생성한 이미지가 미드저니보다 더 자연스럽고 립싱크 영상에 적합한 결과물을 제공하는 경우가 많습니다. 특히 한국인 여성의 얼굴 특징을 더 정확하게 표현하며, 기타를 치는 포즈나 표정의 자연스러움에서 우위를 보입니다. 다만 이는 프롬프트 작성 방식과 원하는 스타일에 따라 달라질 수 있으므로, 두 도구를 모두 활용하여 최적의 결과물을 선택하는 것이 좋습니다.
이미지 생성 단계에서 중요한 점은 립싱크에 적합한 정면 또는 측면 각도의 얼굴이 선명하게 나와야 한다는 것입니다. 너무 멀리서 촬영한 듯한 구도나 얼굴이 가려진 이미지는 이후 립싱크 작업에서 자연스러운 결과를 얻기 어렵습니다.
헤드라 AI로 완성하는 자연스러운 립싱크 영상
AI 립싱크 영상 제작의 최종 단계는 이미지에 노래를 입히는 것입니다. 이 과정에서 클릭 AI, 픽스버스, 헤드라 AI 등 여러 도구를 비교해 볼 수 있습니다. 먼저 클릭 AI를 사용하면 좌측에서 비디오를 클릭하고 소라 AI에서 다운로드한 이미지를 업로드합니다. 영상 프롬프트는 자동 생성 기능을 사용하면 해당 이미지에 맞는 프롬프트가 만들어집니다.
하지만 클릭 AI의 립싱크 기능에는 60초 이내 노래만 업로드할 수 있다는 제한이 있습니다. 이를 해결하기 위해 캡컷을 실행하여 수노 AI에서 다운로드한 노래를 업로드하고, 앞뒤의 불필요한 부분을 잘라내어 원하는 길이로 조정합니다. 왼쪽 삭제와 오른쪽 삭제 기능을 활용하면 노래의 핵심 부분만 남길 수 있습니다. 편집이 완료되면 동영상 체크는 해제하고 오디오만 체크하여 저장합니다.
클릭 AI에서 생성한 립싱크 영상은 아쉽게도 예시 쇼츠만큼 자연스럽지 않은 결과를 보여줍니다. 이에 비해 픽스버스는 좀 더 나은 결과를 제공합니다. 파파고에서 "기타를 치면서 노래를 부르는 아시안 여성"을 영어로 번역하여 프롬프트를 입력하면 입모양과 손 움직임이 클릭 AI보다 상당히 자연스러운 영상이 생성됩니다. 픽스버스는 30초 이내 노래만 업로드 가능하므로 이 점을 고려해야 합니다.
가장 자연스러운 결과물을 제공하는 것은 헤드라 AI입니다. 비디오를 클릭하고 업로드 이미지를 선택하여 소라 AI 이미지를 업로드합니다. 오디오 스크립트에서 업로드 오디오를 클릭하여 수노 AI 노래를 업로드하고, 프롬프트란에는 파파고에서 생성한 번역본을 붙여 넣습니다. 헤드라 AI로 생성된 립싱크 영상은 입모양, 표정 변화, 신체 움직임 모두에서 가장 실제 사람에 가까운 자연스러움을 보여줍니다.
하지만 현실적으로 이러한 AI 쇼츠 채널들의 성공률은 생각보다 낮습니다. 빠르게 성장하는 채널도 대부분 수만 구독자 수준에 머무르며, 유튜브가 AI 양산형 콘텐츠에 수익 정지 조치를 내리고 있어 수익화 가능성도 불확실합니다. 조회수 쏠림 현상이 심해 초기 진입 장벽도 높아진 상황입니다. 따라서 큰 수익을 기대하기보다는 재미있는 실험이나 포트폴리오 용도로 접근하는 것이 현실적입니다.
AI 립싱크 쇼츠 제작은 기술적으로는 매우 흥미롭고 접근성 높은 콘텐츠 형식입니다. 수노 AI, 소라 AI, 헤드라 AI 등 다양한 도구를 활용하면 10~30분 안에 퀄리티 있는 영상을 만들 수 있습니다. 하지만 타 채널의 성공 사례에 현혹되지 말고, 무료 크레디트로 충분히 테스트한 후 꾸준히 콘텐츠를 업로드하며 알고리즘 반응을 확인하는 것이 중요합니다. 창의적인 아이디어와 일관된 노력이 결합될 때 진정한 가능성이 열립니다.
[출처]
전 세계에서 난리 난 AI 립싱크 쇼츠, 10분 만에 만드는 방법 / AI 머니
https://www.youtube.com/watch?v=296yFtqa9M4&list=PLqEV_LPWk2ZtipUtCSO8_0G3OxmtX_02P&index=18