저작권 정책

[논문리뷰] 챗(Chat) GPT의 이용과 저작권 쟁점 고찰 - 정윤경(2023)

VirtualJin 2026. 4. 13. 22:51

논문의 핵심 문제의식

이 논문은 ChatGPT로 대표되는 생성형 AI 서비스가 급속히 확산되면서 발생하는 저작권 쟁점을 실용적 관점에서 분석합니다. 게티이미지의 Stability AI 소송(2023.1), 일론 머스크의 MS 상대 소송 예고(2023.4) 등 실제 분쟁이 이미 발생하고 있음에도 관련 법 체계가 정비되지 않은 상황을 문제의 출발점으로 삼고, 데이터 이용 단계와 생성물 보호 단계로 나누어 쟁점을 체계화합니다.

Ⅱ. Chat GPT 생성물의 특성

생성형 AI의 개념과 기술 기반

생성형 AI는 빅데이터 학습을 바탕으로 소설·시·이미지·영상·코딩 등 새로운 원본 콘텐츠를 스스로 만들어내는 시스템입니다. 기존 AI가 데이터와 패턴을 인식하는 데 그쳤다면, 생성형 AI는 기존 데이터와 새로운 정보의 비교 학습을 통해 창작물을 제작할 수 있다는 점이 핵심적 차이입니다.

논문은 생성형 AI를 구동하는 다섯 가지 핵심 기술을 정리합니다. 딥러닝(Deep Learning)은 인공신경망(ANN)을 바탕으로 스스로 데이터를 학습하고 결과를 예측합니다. 자연어 처리(NLP)는 문맥에 따른 의미 파악과 자연스러운 답변 생성을 담당합니다. 컴퓨터 비전(Computer Vision)은 이미지와 영상에서 의미 있는 정보를 추출합니다. 강화학습(Reinforcement Learning)은 행동에 대한 보상 원리로 최적 전략을 선택하게 합니다. 생성적 적대 신경망(GAN)은 생성자와 판별자 두 모델의 경쟁을 통해 데이터 품질을 점진적으로 향상시킵니다.

ChatGPT의 데이터 수집·생성 기술을 정리하면, 데이터 수집 단계에서는 크롤링·스크래핑·ETL·Open API 등이 사용되고, 데이터 생성 단계에서는 NLP·GAN·RLHF·Transformer 등이 적용됩니다. 특히 ChatGPT는 인간 피드백 기반 강화학습(RLHF)을 통해 보다 맥락에 맞는 답변을 생성하며, 사전에 수집된 데이터에 한정되어 실시간 대화 내용을 새로운 학습 데이터로 저장하지는 않습니다.

Ⅲ. Chat GPT의 저작물 이용 문제

1. 데이터 수집·생성의 문제점

논문은 ChatGPT의 데이터 수집 관련 세 가지 문제를 지적합니다.

첫째, OpenAI가 데이터 수집 방법을 공개하지 않아 크롤링·스크래핑이 금지된 콘텐츠를 무단 수집했는지 검증하기 어렵습니다. 판례에 따르면 무단 사용 경고 문구가 있는 웹사이트에서 크롤링한 행위는 저작권 침해로 인정된 바 있고, HTML 소스 자체가 저작물이 아니더라도 이를 체계적으로 배열한 데이터베이스를 무단 이용하면 데이터베이스 제작자의 권리 침해가 성립할 수 있습니다.

둘째, ChatGPT가 답변에 출처를 표기하지 않는다는 점입니다. YouChat이나 Bing GPT가 출처를 병기하는 방식을 참고하여, 영업비밀 침해 범위를 벗어나는 한도에서 데이터 출처를 공개할 필요가 있다고 논문은 제안합니다.

셋째, 저작권 침해·표절 검증 프로그램을 거쳤는지 알 수 없는 상태에서 생성물이 타인의 저작물과 동일·유사한 표현을 포함할 가능성을 배제하기 어렵습니다.

2. 저작물 이용허락

ChatGPT가 학습 목적으로 타인의 저작물을 이용하려면 원칙적으로 저작권자의 허락이 필요합니다. 현실적으로는 저작권 신탁관리단체나 대리중개업체를 통한 이용허락이 가능하지만, AI 개발업체가 정식으로 라이선스를 체결한 사례는 아직 거의 없습니다.

공정이용 해당 여부에 대해 논문은 ChatGPT에 불리한 세 가지 요소를 지적합니다. 이용의 목적과 성격 측면에서 변형적 이용이라는 점은 공정이용에 유리하지만, 궁극적으로 영리 목적 서비스라는 점은 불리하게 작용합니다. 이용된 부분의 비중 측면에서는 타인의 저작물 전체를 복제하여 학습에 이용하는 방식이 불리하게 평가됩니다. 시장 대체성 측면에서는 AI 생성물이 원저작물과 동일하거나 유사한 용도로 경쟁할 가능성이 있어 역시 불리합니다. 결론적으로 ChatGPT의 저작물 이용을 공정이용으로 포섭하기는 어려우므로, 별도 면책 규정이 없는 한 합법적 이용허락 계약이 필요하다고 봅니다.

3. TDM 면책 범위

텍스트·데이터 마이닝(TDM)에 대한 각국 입법은 다음과 같이 비교됩니다. 영국(2014년)은 합법적으로 취득한 저작물에 대해 비상업적 연구 목적의 TDM을 면책하며, TDM 금지 약정은 무효로 규정합니다. 프랑스(2016년)는 연구기관 및 공개 접근 가능 디지털 자료에 한해 TDM을 허용하되, 생성된 복제물은 마이닝 후 파기해야 합니다. 독일(2017년)은 분석용 코퍼스 구축을 위한 자동 복제와 학술 연구 품질 검증 목적의 공개 접근을 면책 요건으로 명시합니다. EU(2019년)는 연구기관과 문화유산기관의 학술연구 목적 TDM을 허용하며, 생성된 사본은 보안 수준을 갖춰 연구 목적으로 보유할 수 있습니다. 미국은 별도 TDM 면책 조항 없이 공정이용 조항으로 포섭합니다.

우리나라에는 아직 TDM 면책 규정이 도입되지 않았습니다. 2021년 도종환 의원 발의 저작권법 전부개정안 제43조(정보분석을 위한 복제전송)가 영리 목적을 포함한 광범위한 TDM 면책을 담고 있으나 국회에 계류 중입니다. 논문은 ChatGPT가 민간사업자로서 영리적 목적의 서비스를 위해 TDM을 수행한다는 측면에서 현행법 하의 각국 TDM 면책 범위에 모두 포함된다고 보기 어렵다고 결론 짓습니다.

Ⅳ. Chat GPT 생성물의 저작권 침해 판단 및 보호 방안

1. 저작자 및 권리 귀속

현행 저작권법상 저작물은 인간의 사상·감정을 표현한 창작물이고, 저작권은 창작 시점부터 어떠한 절차 없이 발생합니다(무방식주의). 따라서 AI가 생성한 창작물은 현행법상 저작물로 보호받기 어렵습니다. 업무상저작물 규정도 AI에는 적용하기 어렵고, 미국·중국·영국 모두 인간 저작자 요건을 명시하거나 전제합니다.

우리나라에서는 주호영 의원 발의 저작권법 일부개정안이 AI 저작물 개념을 도입하고 저작자를 AI 서비스 이용자 또는 창작적 기여를 한 AI 제작자·서비스 제공자로 정의하고 있으나, 검토보고서는 사회적 합의 부족, AI와 인간 창작물 구분 어려움, AI 창작 활성화 시 인간 창작물 가치 저하 우려 등의 문제점을 지적합니다.

논문은 세 가지 권리 귀속 방안을 제시합니다. AI와 인간의 창작 기여도를 1단계(인간이 모든 기획 주도)부터 10단계(AI가 완전 자율 창작)까지 단계별로 구분·표기하고, 이를 연도와 함께 명시하는 기준안을 마련하는 방안입니다. 기여도에 따라 AI 개발업체와 인간이 1:N으로 공동 저작권을 소유하는 방안, 또는 이용약관·개별 계약으로 권리자를 정하는 방안도 검토됩니다. 다만 어느 방식이든 인간의 창작 개입 정도에 따라 권리 비중을 달리해야 한다는 점은 공통적입니다.

2. 실질적 유사성 판단

저작권 침해 성립에는 의거성과 실질적 유사성이 모두 요구됩니다. ChatGPT의 경우 다양한 데이터에 접근하여 수집·생성하였으므로 의거성 요건은 원칙적으로 충족된다고 볼 수 있어, 핵심 쟁점은 실질적 유사성이 됩니다.

실질적 유사성은 특정 행·절을 그대로 이용하는 부분적·문언적 유사성과, 저작물의 근본적 구조를 복제하는 포괄적·비문언적 유사성 두 유형으로 분류됩니다. 실제로 구글·딥마인드·프린스턴 공동 연구팀이 AI 생성 이미지를 분석한 결과, 훈련 데이터와 동일한 이미지가 100장 이상 생성된 것이 확인된 바 있습니다.

논문은 AI 생성물의 창작성 보호 범위를 기능적 저작물 기준에 준해 인간 창작물보다 제한적으로 평가하되, 일반성·보편성을 넘는 표현에 한해 엄격히 보호해야 한다고 봅니다. 아울러 기존의 청중테스트가 AI 생성물에는 적용하기 어려운 한계가 있으므로, 표절 검증 프로그램이나 저작권 침해 판단 프로그램을 개발·적용하여 유사 표현의 중첩 여부, 기존 작품과의 동일 표현 사용 여부 등을 객관적으로 검증하는 시스템 도입을 제안합니다.

3. 저작권 보호 기간

일반 저작물의 저작재산권은 저작자 사망 후 70년간 존속하지만, 데이터베이스제작자의 권리는 제작 완료 후 5년간만 보호됩니다. 주호영 의원 발의안은 AI 저작물의 보호기간을 공표 후 5년으로 규정하고 있습니다.

논문은 이 5년 기한이 적정하다고 평가합니다. 다만 고품질 AI 창작물이 5년 후 무상 공개될 경우 인간 창작 활동을 위축시킬 우려가 있다는 점을 고려하여, 이중적 보호 구조를 제안합니다. 5년이 지나 AI 개발자의 저작권료가 만료된 이후에도, AI 학습에 사용된 인간 원저작물에 대한 저작권은 여전히 유효하게 유지시켜 사용자가 낮은 수수료를 지급하고 작품을 이용하되 그 수익이 인간 창작자에게 귀속되도록 하는 방안입니다.

4. 민·형사상 법적 책임

AI에 독립된 법인격을 부여할지, 형사책임을 인정할지에 대해 긍정론과 부정론이 갈립니다. 긍정론은 법인 이론을 차용한 '전자인격' 도입과 양벌규정 이론의 활용 가능성을 주장하고, 부정론은 범죄 성립요건이 인간 행위를 전제한다는 점과 형벌의 실질적 의미 부재를 근거로 듭니다.

논문은 현 단계에서 AI 개발자와 사용자의 연대 책임이 바람직하다고 봅니다. 제조물책임법상 제조업자 책임과 민법 제760조의 공동불법행위책임 법리를 참고하여, 개발자는 학습 데이터 제공·알고리즘 개발 책임을, 사용자는 생성물의 복제·전송 이용 책임을 각각 지도록 합니다. 나아가 저작권법 일부개정안은 AI 생성물임을 표기하지 않은 경우 3년 이하 징역 또는 3천만원 이하 벌금의 형사처벌 조항을 신설하고 있으며, 논문은 표절 방지 검증 과정 이행 여부와 인간의 지시·감독 개입 정도에 따라 민·형사 처벌 정도를 차등화하는 규정이 필요하다고 제안합니다.

Ⅴ. 결론 및 제언

논문은 네 가지 입법 과제를 도출합니다.

저작자 및 권리 귀속에 관해서는 AI와 인간의 창작 기여도를 단계별·연도별로 구분 표기하고, AI 개발업체와 인간이 1:N으로 공동 저작권을 소유하는 제도를 도입해야 합니다. 실질적 유사성 판단에 관해서는 기능적 저작물 기준을 참고하되, 청중테스트의 한계를 보완하는 저작권 침해 예방 프로그램 개발과 서비스 적용이 필요합니다. 저작권 보호기간에 관해서는 5년의 이중적 보호 구조를 통해 AI 개발자와 인간 창작자가 상생하는 방안을 마련해야 합니다. 민·형사 책임에 관해서는 제조물책임법과 공동불법행위책임 법리를 참고하여 개발자-사용자 연대 책임을 원칙으로 하되, 주의의무 위반·과실 여부에 따라 차등적으로 책임을 부여해야 합니다.

생각해 볼 문제

 저작권 규제를 먼저 설계하는 선발주자가 유리한 구조에서, 후발주자인 한국은 규범을 수용해야 하는가, 아니면 TDM 면책 입법 등으로 독자적 기준을 선제적으로 구축해야 하는가?