Newsletter

창의성의 역설: 인공지능, 저작권, 그리고 인류의 미래

"기분이 우쭐하지 않습니다. 수년간 쌓아온 무언가를 도둑맞은 기분입니다." - 120만 건의 Stable Diffusion 프롬프트에 이름이 등장한 Greg Rutkowski의 말입니다. '지브리 스타일'은 진정한 차이점을 보여줍니다. 반 고흐는 일본의 미적 원리를 이해했고, AI는 픽셀 간의 통계적 상관관계를 추출합니다. 스탠포드는 모델이 거의 동일한 이미지를 3%의 확률로 재생성한다는 것을 보여줍니다. 영감이 아니라 암기입니다. 25만 명 이상의 아티스트가 자신을 방어하기 위해 Glaze와 Nightshade를 채택했습니다.

인간적 창의성과 인공적 창의성: 그 차이의 실체와 지브리 스타일이 우리에게 주는 교훈 (그리고 지브리 스타일이 우리에게 무언가를 가르쳐주는 이유)

인공지능과 저작권에 대한 논쟁은 2024~2025년에 극적으로 격화되었습니다. 더 이상 이론적인 논의가 아닙니다. 뉴욕 타임즈가 저작권 침해로 OpenAI를 고소했고(2023년 12월), 게티 이미지가 Stability AI를 고소했으며, 수천 명의 아티스트가 집단 소송을 제기했습니다. AI 기업들은 자신들의 시스템이 인간처럼 '학습'한다고 답하지만, 과연 그럴까요?

인간의 창의성은 항상 연결을 통해 발전해 왔습니다: 셰익스피어는 역사 연대기나 민담에서 영감을 받았고, 반 고흐는 일본 판화를 공부했으며, 비틀즈는 미국 록을 연주하는 것에서 시작했죠. 예술가들은 항상 이전 작품을 재해석합니다. 기술 회사들이 말하는 인공지능도 마찬가지입니다. 하지만 '지브리 스타일'의 사례는 이 내러티브가 얼마나 단순한지를 보여줍니다.

지브리 사건: 스타일이 논란이 될 때

미드저니나 달-E에 '지브리 스타일'을 입력하면 파스텔 색상, 뭉게구름, 몽환적인 풍경, 큰 눈을 가진 캐릭터 등 미야자키 하야오의 명작과 놀라울 정도로 유사한 이미지가 표시됩니다. 기술적으로는 인상적입니다. 하지만 심각한 문제도 있습니다.

스튜디오 지브리는 정확한 색상 팔레트 선택, 전통적인 애니메이션 기법, 일본 문화와 미야자키 감독의 개인적인 비전에 뿌리를 둔 예술적 철학 등 독특한 미학을 개발하는 데 수십 년이 걸렸습니다. AI 모델이 몇 초 만에 이러한 '스타일'을 재현할 때, 미야자키가 디즈니 애니메이션과 일본 만화에서 배운 것처럼 정말 '학습'한 것일까요? 아니면 단순히 수천 개의 지브리 프레임에서 추출한 시각적 패턴을 무단으로 재조합한 것일까요?

이 차이는 철학적인 것이 아니라 법적, 경제적입니다. arXiv에 발표된 스탠포드 분석(Carlini 외, 2023)에 따르면, 안정적 확산과 같은 확산 모델은 특정 프롬프트가 표시되면 약 3%의 사례에서 훈련 세트와 거의 동일한 이미지를 재생성할 수 있습니다. 이것은 '영감'이 아니라 저장과 재생산입니다.

폴란드의 디지털 아티스트 그렉 루트코프스키는 자신의 이름이 스테이블 디퓨전의 120만 개의 프롬프트에 등장한 것을 발견했는데, 의도치 않게 동의나 보상 없이 가장 많이 요청된 '스타일' 중 하나가 되었습니다. 그는 MIT 테크놀로지 리뷰와의 인터뷰에서 "우쭐한 기분이 들지 않습니다. 제가 수년간 구축한 무언가를 도둑맞은 기분입니다.

교육 논쟁: 2024~2025년의 숫자

AI 학습의 규모는 전례 없는 규모에 이르렀습니다. 이미지 모델에 가장 널리 사용되는 데이터 세트 중 하나인 LAION-5B에는 저작권이 있는 저작물을 포함하여 인터넷에서 수집한 58억 5천만 개의 이미지-텍스트 쌍이 포함되어 있습니다. GPT-4는 유료 기사, 서적, 독점 소프트웨어 코드 등 인터넷의 방대한 부분을 학습했습니다.

주요 법적 소송이 진행 중입니다:

  • 뉴욕타임스 대 OpenAI/마이크로소프트 (2023년 12월): 수십억 달러의 손해배상 요구, 수십 년 동안 보호된 기사에 대한 GPT 교육 혐의 고발
  • 게티 이미지 대 안정성 AI (2023년 2월): 라이선스 없이 1,200만 개 이상의 게티 이미지를 사용한 혐의로 기소됨
  • 아티스트의 집단 소송 대 Stability AI/Midjourney/DeviantArt (2023년 1월): 수천 명의 아티스트가 조직적인 저작권 침해로 소송을 제기했습니다.
  • 유니버설 뮤직 대 수노 및 유디오 (2024년 6월): 보호 대상 카탈로그에 대한 교육 혐의로 기소된 음악 생성 플랫폼

인공지능 기업들은 미국 법률에 따른 '공정 사용'을 내세워 이러한 관행을 옹호합니다. 즉, 이러한 훈련은 '혁신적'이며 기존 시장을 대체하지 않는다고 주장합니다. 그러나 여러 법원에서 이러한 해석에 이의를 제기하고 있습니다.

캐서린 포레스트 판사는 2024년 1월 Getty 대 Stability AI 소송에서 기각 신청을 기각하고 소송 진행을 허용했습니다. "AI 모델의 학습이 공정 사용에 해당하는지 여부는 복잡하고 사실에 대한 철저한 검토가 필요합니다. 번역: AI 회사는 단순히 공정 사용을 주장하고 끝낼 수 없습니다.

무역 협정: 시장 솔루션의 등장

법적 압박에 직면한 AI 기업들은 라이선스 협상을 시작했습니다. OpenAI는 다음과 계약을 체결했습니다:

  • AP 통신 (2023년 7월): 라이선스 대가로 뉴스 아카이브에 액세스
  • 악셀 스프링거 (2023년 12월): 폴리티코, 비즈니스 인사이더의 콘텐츠 사용 동의
  • 파이낸셜 타임즈 (2024년 4월): 교육용 콘텐츠 라이선스
  • News Corp (2024년 5월): 5년간 2억 5천만 달러 계약, 월스트리트 저널, 배런스, 뉴욕 포스트에 액세스 가능

Google은 Reddit, Stack Overflow 및 다양한 퍼블리셔와 유사한 계약을 체결했습니다. Anthropic은 출판사와 도서 사용에 대한 협상을 진행했습니다.

하지만 이러한 계약은 협상력이 있는 대형 퍼블리셔에게만 적용됩니다. 아티스트, 사진작가, 프리랜서 작가 등 수백만 명의 개인 크리에이터는 이미 완료된 교육에 사용된 작품에 대한 보상을 받지 못하고 있습니다.

인간과 기계 학습: 실제 차이점(통계 그 이상)

'AI가 인간처럼 학습한다'는 이야기는 기술적으로 오해의 소지가 있습니다. 근본적인 차이점을 살펴보겠습니다:

규모와 속도: 인간 아티스트는 일생 동안 수백, 수천 개의 작품을 연구합니다. GPT-4는 수조 개의 단어로 학습되었습니다. 수십억 개의 이미지에 대한 안정적인 확산. 그 규모는 비교할 수 없을 정도이며 '영감'에 대한 합리적인 정의를 뛰어넘습니다.

의미론적 이해: 반 고흐는 일본 판화를 공부할 때 시각적 패턴을 기계적으로 모방한 것이 아니라 근본적인 미학적 원리(여백의 사용, 비대칭 구도, 자연 강조)를 이해하고 유럽의 인상주의 이후 시각을 통해 재해석했습니다. 그의 작품은 의식적인 문화적 종합체입니다.

인공지능 모델은 인간의 의미에서 '이해'하지 못합니다. 산타페 연구소의 멜라니 미첼 교수는 "인공 지능: 생각하는 인간을 위한 가이드"에서 "딥러닝 시스템은 패턴 인식에는 탁월하지만 인과적 이해, 추상적 추론 또는 세계에 대한 정신적 모델이 부족하다"고 설명합니다. 스테이블 디퓨전은 '지브리 스타일'이라고 표시된 수백만 개의 픽셀 사이에서 통계적 상관관계를 추출하는 등 지브리만의 특징을 '이해'하지 못합니다.

창의적 의도성: 인간 예술가는 개인적인 비전, 전달하고자 하는 메시지, 불러일으키고자 하는 감정에 따라 의도적인 창의적 선택을 합니다. 미야자키는 환경주의 주제, 평화주의, 페미니즘을 영화에 반영하여 도덕적, 예술적 선택을 의식합니다.

AI는 통계적 확률에 기반하여 "프롬프트 X와 훈련 세트 Y가 주어졌을 때 어떤 픽셀 구성이 가장 가능성이 높을까요?"라는 질문을 생성합니다. 여기에는 의도도, 메시지도, 비전도 없습니다. 뉴요커에서 Ted Chiang이 쓴 것처럼 "ChatGPT는 웹의 흐릿한 JPEG"이며, 원본 콘텐츠의 가치를 만드는 특성을 정확히 잃어버리는 손실 압축입니다.

변형 대 재조합: 파블로 피카소는 아프리카 가면을 연구했지만 회화에서 공간 표현을 재창조한 완전히 새로운 예술 사조인 입체주의를 창시했습니다. 그 변화는 급진적이고 독창적이었습니다.

생성형 AI 모델은 잠재 공간에서 보간을 통해 작동하며, 학습 세트의 요소를 새로운 구성으로 재조합하지만 학습된 데이터의 통계적 분포에 얽매이게 됩니다. 학습된 통계적 규칙성을 위반하는 진정으로 새로운 미학을 발명할 수는 없습니다. MIT 연구(Shumailov 외, 2023)에서 입증된 바와 같이, 이전의 AI 결과물에 대해 반복적으로 훈련된 모델은 '모델 붕괴'라는 현상으로 점진적으로 퇴화합니다.

'독창성' AI의 역설

인공지능은 독창적으로 보이지만(인간은 이전에 지브리 스타일의 특정 이미지를 본 적이 없음) 통계적으로 파생된 결과물(기존 패턴을 보간한 것)을 생성할 수 있다는 것이 핵심 역설입니다. 이는 근본적인 혁신이 없는 피상적인 형태의 독창성입니다.

여기에는 깊은 의미가 있습니다. 철학자 존 설이 유명한 '차이니즈 룸 논쟁'에서 주장했듯이 인지 과정을 시뮬레이션하는 것은 그것을 소유하는 것과는 다릅니다. AI는 인간적 의미의 창의성 없이도 창의성을 시뮬레이션할 수 있습니다.

새로운 기술 및 규제 솔루션

이러한 논란에 직면하여 다양한 솔루션이 개발되고 있습니다:

아티스트를 위한 보호 도구:

  • Glaze (시카고 대학교): 이미지에 눈에 보이지 않는 교란을 적용하여 스타일을 학습하려는 AI 모델을 '트릭'하는 소프트웨어입니다.
  • Nightshade (같은 팀): 훈련 데이터를 '독살'하여 무단으로 사용하는 모델을 손상시키는 공격적인 버전입니다.
  • 첫해에 25만 명 이상의 아티스트가 이 도구를 채택했습니다.

옵트아웃 등록:

  • 훈련받았습니까 (AI 생성): 아티스트가 자신의 작품이 LAION 및 기타 데이터 세트에 있는지 여부를 확인할 수 있는 데이터베이스, 옵트아웃 메커니즘 포함
  • 일부 최신 모델은 이러한 옵트아웃을 준수합니다(Stability AI는 부분적으로 준수한다고 발표했습니다).

보상 프레임워크:

  • AI 라이선스 생성: 학습에 작품을 사용할 때 아티스트에게 보상하는 마이크로 라이선스 시스템
  • 아직 실험 단계로 널리 채택되지는 않았습니다.

정부 규제:

EU 인공지능법 (2024년 8월 발효)에 따라 생성형 인공지능 모델 제공업체는 사용된 저작권이 있는 학습 데이터에 대한 자세한 요약을 공개해야 합니다. 이는 투명성을 강화하기 위한 최초의 규제 시도입니다.

테네시 엘비스 법 (2024년 3월)은 AI를 우선시하는 미국 주에서 음성 및 초상 연기자를 무단 사용으로부터 보호하기 위해 딥 보이스 및 비주얼 페이크에 대한 구체적인 법률을 제정했습니다.

미국 의회에 제출된 제안서에는 저작물에 대한 명시적 동의(옵트아웃 대신) 요청과 교육 데이터 세트의 공개 레지스트리 생성 등이 포함되어 있습니다.

크리에이티브의 미래: 하이브리드 또는 대체?

미래에 대한 두 가지 비전이 서로 대립합니다:

낙관적 전망(AI 기업): AI는 포토샵이나 음악 신디사이저처럼 인간의 창의력을 증폭시키는 도구입니다. 아티스트는 AI를 사용하여 워크플로우를 가속화하고, 변형을 모색하고, 창의적 장애물을 극복할 것입니다. 인간은 비전을 제시하고 AI는 기술적인 부분을 수행하는 하이브리드 예술 형식이 등장할 것입니다.

영화 '더 프로스트'(2023)는 AI를 사용해 배경과 텍스처를 생성하고, 인간 아티스트가 아트 디렉팅을 담당했습니다. 음악가들은 즉흥 연주를 위한 백킹 트랙을 생성하기 위해 Suno와 Udio를 사용합니다. 작가들은 내러티브 아이디어를 논의할 때 GPT를 '고무 오리'로 사용합니다.

비관적 견해(많은 크리에이터): AI는 창의성을 상품화하여 뛰어난 기술을 가진 엘리트만 살아남을 때까지 창의적인 작업의 경제적 가치를 약화시킬 것입니다. 19세기 산업 자동화로 장인이 사라진 것처럼 '평균적인 창의성'은 값싼 발전기로 대체되어 창의적인 중산층을 파괴할 것입니다.

Fiverr과 같은 프리랜서 플랫폼에서 일러스트레이터와 카피라이터에 대한 요청은 2023년에 21% 감소한 반면(Fiverr 2023년 4분기 데이터), 'AI 아트 생성' 제안은 폭발적으로 증가했다는 예비 증거가 이러한 우려를 뒷받침합니다. 그렉 루트코프스키의 경우, 자신의 스타일이 스테이블 디퓨전에서 인기를 얻은 이후 직접 커미션이 40% 감소했습니다.

일부 형태의 크리에이티브 작업은 자동화될 것이고(일반적인 스톡 일러스트, 기본적인 카피 마케팅), 매우 독창적이고 개념적이며 문화적으로 뿌리를 둔 크리에이티브는 인간의 영역으로 남을 것입니다.

최종 고찰: 완벽한 모방 시대의 진정성

사람과 AI 콘텐츠의 구분은 점점 더 어려워질 것입니다. 이미 오늘날에는 워터마크나 공개가 없으면 GPT-4 텍스트와 사람의 텍스트, 또는 미드저니 이미지와 사진의 구분이 불가능한 경우가 많습니다. Sora(OpenAI 동영상 생성기)가 공개되면 이러한 구분은 동영상으로까지 확대될 것입니다.

이는 진위 여부에 대한 심오한 질문을 제기합니다. AI로 생성된 지브리 스타일의 이미지가 원본과 동일한 감정을 불러일으킨다면 동일한 가치를 가질 수 있을까요? 철학자 발터 벤야민은 '기술적 재현성 시대의 예술 작품'(1935)에서 기계적 재현성이 원작의 시공간적 고유성과 진정성 등 '아우라'를 약화시킨다고 주장했습니다.

제너레이티브 AI는 이 주장을 극단적으로 발전시켜 기존 작품을 복제하는 것이 아니라 원본이 아닌 원본을 모방하는 무한한 변형을 만들어냅니다. 이것이 바로 보드리야르식 시뮬라크르, 즉 원본이 없는 복사본입니다.

하지만 전달하고자 하는 바를 알고 붓질 하나하나를 선택하는 화가, 특정한 감정을 불러일으키기 위해 문구 하나하나를 만들어내는 작가, 의도적으로 긴장감과 결말을 만들어내는 작곡가 등 의식적인 창작 행위에는 환원할 수 없는 인간적인 무언가가 있습니다. AI는 결과는 시뮬레이션할 수 있지만 과정은 시뮬레이션할 수 없으며, 어쩌면 창의성의 진정한 가치는 과정에 있는지도 모릅니다.

스튜디오 지브리는 성명서(2023년 11월)에서 '우리 영화의 영혼은 모방할 수 있는 시각적 스타일이 아니라 우리가 하고자 하는 이야기를 위해 프레임 단위로 내리는 창의적인 결정에 있다'고 썼습니다. 이는 자동화할 수 없습니다.

예술의 가치는 궁극적으로 인간의 경험과 깊이 연결되는 능력, 즉 이해와 도전, 변화를 느끼게 하는 능력에서 비롯됩니다. 인공지능이 이를 달성할 수 있을지는 아직 미지수입니다. 하지만 예술이 인간을 위해 인간에 의해 만들어지는 한, 인간의 조건에 대해 이야기하는 한, 예술은 어떤 알고리즘도 복제할 수 없는 것, 즉 미적 형태로 변환된 생생한 경험의 진정성을 간직하게 될 것입니다.

출처:

  • 칼리니, 니콜라스 외 - '확산 모델에서 훈련 데이터 추출', arXiv:2301.13188 (2023)
  • 미첼, 멜라니 - '인공 지능: 생각하는 인간을 위한 가이드' (2019)
  • 치앙, 테드 - 'ChatGPT는 웹의 흐릿한 JPEG', 뉴요커 (2023년 2월)
  • 슈마일로프, 일리아 외 - '재귀의 저주: 생성된 데이터에 대한 훈련은 모델을 잊게 만든다', arXiv:2305.17493 (2023)
  • MIT 테크놀로지 리뷰 - '이 아티스트는 AI로 생성된 예술을 지배하고 있습니다. 그리고 그는 그것에 만족하지 않습니다' (2022년 9월)
  • EU AI 법 - 규정(EU) 2024/1689
  • 벤야민, 월터 - '기술적 재현성 시대의 예술 작품'(1935)
  • 공공 기록 소송: NYT 대 OpenAI, 게티 대 Stability AI
  • Fiverr 2023년 4분기 수익 보고서

비즈니스 성장을 위한 리소스