AI 아트 생성기로부터 이미지를 보호하는 방법

2023/02/03

AI 생성기로 반 고흐나 프리다 칼로와 같은 오래 전에 사라진 예술가의 작품을 모방하는 것은 재미있지만 살아있는 예술가에게는 그렇지 않습니다. 거의 모든 사람이 아티스트의 “스타일로” 이미지를 만들 수 있도록 허용하면 해당 시장이 모조품으로 넘쳐날 수 있습니다. 진정성과 잠재적인 소득 손실에 대한 혼란을 가중시킵니다.

이에 대해 사람들은 AI 예술 생성기로부터 자신의 이미지를 보호할 방법을 찾고 있습니다. 답변이 완벽하거나 확실하지 않을 수 있지만 AI 아트 생성기가 이미지를 사용하지 못하도록 방어할 수 있는 방법이 있습니다.

AI 생성기가 이미지를 얻는 방법

AI 예술 생성기는 텍스트 프롬프트가 주어졌을 때 이미지를 생성하는 방법을 배우기 위해 “훈련” 기간을 거칩니다. 학습 과정의 일부로 수억 개의 이미지-텍스트 쌍을 연구하여 예술 기법 및 스타일과 함께 실제 사물, 색상 및 장면의 정확한 이미지를 생성해야 합니다.

공교롭게도 AI 모델은 인간의 창의성에서 배워야 합니다. 예를 들어, Midjourney와 Stability Diffusion은 오픈 소스 LAION-5B 데이터 세트에서 훈련된 두 개의 AI 아트 생성기로 인터넷에서 가져온 수십억 개의 이미지를 포함합니다.

웹 크롤러를 사용하여 웹 사이트에서 데이터를 “스크래핑”하면 이러한 데이터 세트는 거대한 Excel 스프레드시트와 유사한 이미지 URL 목록과 캡션을 생성합니다. 귀하의 예술이 이미지 데이터 세트에 포함되기 전에 온라인에 게시하여 귀하의 동의 여부와 상관없이 AI 훈련에 사용된 경우.

1. AI 교육 데이터 세트 거부

Spawning은 유명한 웹사이트인 Have I Been Trained? 를 소유한 아티스트 그룹입니다. , 이미지가 LAION-5B 데이터 세트에 있는지 확인하는 데 사용할 수 있습니다. 나중에 데이터 세트에서 옵트아웃하는 기능을 추가했습니다. 계약에 따라 Spawning은 요청을 존중하고 컬렉션에서 해당 이미지를 제거하겠다고 말한 LAION에 사용자 옵트아웃 목록을 전달할 것입니다.

작성 당시 한 번에 여러 이미지를 추가할 수 없기 때문에 Spawning의 옵트아웃 도구는 여전히 약간의 개발이 필요합니다. AI 모델을 교육하는 데 사용될 수 있는 다른 데이터 세트와의 옵트아웃 계약도 없습니다.

많은 AI 회사가 AI 모델 구축 방법에 대한 세부 정보를 공개하지 않기 때문에 어떤 데이터 세트를 사용하고 있는지 명확하지 않은 경우가 있습니다. DALL-E는 이 정보를 공유하지 않는 인기 있는 AI 예술 생성기 중 하나입니다.

또는 DeviantArt를 사용하여 아트워크를 공유하는 경우 이제 기본적으로 이미지가 AI 교육 데이터 세트에 사용되지 않도록 보호됩니다. 이미지에 “noai” 태그를 지정하여 작동합니다. 즉, AI 모델이 이미지를 훈련에 사용한 것으로 밝혀지면 DeviantArt의 서비스 약관을 위반하게 됩니다.

물론 이러한 옵트아웃 조치는 강제되지 않으므로 제3자가 선택한 경우 이를 무시할 수 있습니다. 이것이 가장 효율적인 솔루션은 아니지만 아티스트의 작업을 보호하기 위해 더 많은 규칙과 규정을 만드는 데 앞장서고 있습니다.

이상적인 세상에서는 사람들에게 옵트아웃이 아니라 옵트인 옵션이 제공됩니다. 앞으로 이런 일이 일어나기를 바랍니다. 데이터세트에서 이미지를 제거하는 방법에 대한 자세한 내용은 AI 교육에서 이미지를 옵트아웃하는 방법에 대한 가이드를 참조하세요.

2. 저작물의 저작권

인터넷에서 이미지를 스크랩하는 관행이 합법적인지 여부가 법원의 관심을 끌었습니다. 그리고 예술가들이 그들 편에서 증거를 제시하도록 돕는 것이 그들이 소유한 이미지 저작권입니다.

Have I Beeen Trained 웹사이트를 사용한 아티스트 Sarah Andersen의 결과

2023년 초, 유명 만화가 사라 앤더슨( Sarah Andersen )은 AI 회사인 스태빌리티 AI(Stability AI)와 미드저니(Midjourney), 예술 공유 웹사이트 데비안트아트(DeviantArt)를 상대로 작품을 스크랩한 것에 대해 소송을 제기한 예술가 그룹의 일원이었습니다. 무수히 많은 다른 예술가들의 예술을 포함하여 그들의 예술을 동의 없이

또 다른 예는 스톡 이미지 웹사이트인 게티 이미지(Getty Images)로, 라이선스 없이 이미지를 스크랩한 것에 대해 Stability AI를 상대로 소송을 제기했습니다. 저작권 이미지가 사용되고 있음을 발견한 방식은 AI가 생성한 이미지가 Getty Images 워터마크와 함께 나타나기 시작했을 때였습니다.

합법성은 적절한 시기에 결정되겠지만, 저작권은 우리가 언급한 사례에서 볼 수 있듯이 예술가의 작품에 대한 권리를 위해 싸우는 데 사용할 수 있는 몇 안 되는 것 중 하나입니다. 최신 AI 기술이 아닐 수도 있지만 앞으로 나아가는 방어에 추가할 수 있습니다.

AI가 관련되어 있는지 여부에 관계없이 작업을 도난당하지 않도록 보호할 수 있도록 어쨌든 학습할 가치가 있는 방법입니다. 모든 것이 어떻게 작동하는지 자세히 살펴보려면 사진에 저작권을 부여하는 방법에 대한 가이드를 따르세요.

3. robots.txt로 웹사이트 크롤러 차단

이미지 데이터 세트는 웹 크롤러라는 것을 사용하기 때문에 많은 수의 이미지만 인덱싱할 수 있습니다. 이름에서 알 수 있듯이 특정 정보를 찾기 위해 웹사이트를 크롤링합니다.

일부 크롤러는 유용하며 Google과 같은 검색 엔진이 검색 결과 페이지에 표시할 가장 관련성이 높은 정보를 찾고 색인을 생성하도록 도와줍니다. 다른 것들은 AI 훈련 데이터 세트에 포함할 이미지를 위해 웹사이트를 스크랩하는 데 사용됩니다.

여기에서 Robots.txt가 등장합니다. Robots.txt는 웹 크롤러가 무엇을 스캔할 수 있고 무엇을 스캔할 수 없는지 알려주기 위해 웹사이트의 백엔드 코드에 배치할 수 있는 텍스트 파일입니다. 이를 사용하여 크롤러가 특정 페이지나 파일을 보지 못하도록 할 수 있습니다. 이는 AI에서 이미지를 사용하지 않으려는 경우에 유용합니다.

더 알고 싶다면 웹 크롤러가 무엇이고 어떻게 작동하는지에 대한 가이드를 읽어보세요. 웹 사이트가 있는 사용자의 경우 웹 개발자에게 웹 사이트 코드에 Robots.txt를 포함하도록 요청하여 이미지가 AI 교육 데이터 세트에 의해 스크랩되는 것을 방지하십시오.

미래에 기대할 수 있는 것

AI 모델과 경쟁해야 하는 것이 답답하지만 더 많은 솔루션이 제공되고 있습니다.

한편, 개발자들은 새로운 기술을 사용하여 문제를 해결하는 방법을 생각하고 있습니다. 한 유망한 연구에서 연구에 따르면 AI 교육 데이터 세트에 “학습할 수 없는” 이미지를 렌더링하여 AI를 사용하여 스스로와 싸울 수 있습니다.

University of Melbourne 의 Sarah Monazam Erfani 박사는 다음과 같이 설명합니다. 변화는 매우 작고 인간의 눈으로는 감지할 수 없지만 이미지에 충분한 ‘노이즈’를 도입하여 AI 훈련에 쓸모가 없게 만듭니다.”

AI 이미지 생성기의 영향을 받는 사람이라면 이러한 회사가 관행을 변경하도록 압력을 받을 수 있도록 목소리를 낼 가치가 있습니다. 새로운 옵트아웃 기본 설정이 생성된 것은 DeviantArt 커뮤니티의 강력한 피드백 때문이었으므로 아트 공유 플랫폼 및 AI 회사에 피드백을 제공하십시오.

AI로부터 이미지 보호

AI가 학습할 수 없도록 이미지를 눈에 띄지 않게 조정하는 방법을 포함하여 새로운 도구가 진행 중입니다. 그동안 포기하지 마십시오. AI 아트 생성기로부터 이미지를 보호하는 방법은 여전히 있습니다.