“네이버와의 소송을 준비하면서 KBS만의 콘텐츠가 어떻게 학습이 됐는지를 봤다. 검색을 하면 KBS 기자가 오랜 시간 심혈을 기울여 만들었다는 사실은 탈색된 채 ‘대한민국에서 리어카를 끄는 노인들의 삶은 이런 식으로도 볼 수 있다’고 제안하더라.”
최근영 KBS 지식재산권부장이 ‘한국 사회 노인빈곤 문제’를 네이버의 생성형 인공지능(AI) 검색 서비스인 클로바X에 검색했을 때 발견한 건 바로 2022년에 나온 KBS의 ‘GPS와 리어카’ 보도 내용이었다. 폐지수집 노동 실태를 밝히기 위해 노인 10명의 리어카에 한 달간 GPS를 달아 추적한 뒤 이들의 사회적 기여, 노동 가치를 재발견해낸 보도다.
최 부장은 28일 ‘생성형 AI 시대, 뉴스 콘텐츠 저작권 보호와 활용 방안’ 간담회에서 해당 보도에 대해 “기자가 오랫동안 자신의 분야에서 노하우와 인맥을 가지고 연구를 통해 발견해낸, 노력을 쏟아 부은 보도였다. 처음엔 뉴스 기사로 나갔다가 가치를 인정받아 다큐멘터리로 확장됐고, 방송대상까지 받은 작품”이라고 설명했다. 이어 “우리의 노동, 연구의 가치, 조직 전체가 쏟아 부은 의미들이 퇴색된 채로 그냥 어디서나 볼 수 있는 정보로 파편화된 것을 보고, 이 방향은 정말 아니다 싶었다”며 “이렇게 되면 저널리즘의 독창성과 창작 의욕이 위축될 수 있다”고 말했다.
1월 KBS·MBC·SBS 지상파 방송 3사는 기사를 생성형 AI 학습에 무단 활용한 네이버를 상대로 손해배상 청구 소송을 제기했다. 한국신문협회도 4월 네이버의 뉴스 콘텐츠 무단 AI 학습 등을 공정거래위원회에 신고했다. 이해민 조국혁신당 의원, 한국방송협회가 공동 주최해 서울 여의도 국회의원회관에서 진행된 이날 간담회는 네이버와 소송을 치르고 있는 언론사들이 어떤 위기감을 느끼는지 엿볼 수 있는 자리였다. “이 소송은 저작권자들의 이기주의나 밥그릇 지키기 측면만으로 봐선 안된다"는 것이다. AI 학습에 활용되는 뉴스콘텐츠에 대한 보상 문제, 가치 책정에 대한 고민도 나왔는데 이젠 AI 기업과 언론사 간 지속가능한 상생을 위해서라도 합리적 보상 체계를 구축할 합의를 만들어내야 한다는 데 이견은 없었다.
‘우리가 아무런 보상을 받을 수 없어서 더 이상 기사를 낼 수 없게 되면 (AI는)무엇을 학습할 것인가.’ 간담회 발제를 맡은 최승재 세종대 교수는 뉴욕타임스가 오픈AI와 마이크로소프트를 상대로 소송을 걸며 소장을 통해 던진 이 질문을 언급했다. 최 교수는 “앞으로는 인공지능이 토해낸 결과물, 그 아웃풋을 가지고만 계속 학습을 시키면 된다는 사람도 있다”면서도 “하지만 최근 네이처에서 나온 결과를 보면 자가 학습을 계속 반복하면 그 결과물의 퀄리티는 지속적으로 떨어지고 결국 유의미한 데이터 값이 나오지 않는다. 누군가는 인공지능을 위해서라도 계속 새로운 데이터를 내놔야 한다는 것”이라고 말했다.
이어 그는 “단기적으로 보면 네이버 입장에선 빨리 따라가야 되는데 자꾸 돈 달라고 하고, 안 된다고 하니 굉장히 갑갑할 것”이라면서 “하지만 이 문제는 ‘언론사들에게 돈을 줄 것인가 말 것인가’ 하는 문제에 그치는 게 아니다. 어떤 균형 값을 찾아나가자는 것인데, 한국 AI 산업의 발전이나 콘텐츠 산업 발전에도 바람직할 것”이라고 했다.
방송사들도 창작자들의 권리가 보장되지 않았을 때 콘텐츠 산업 전반은 유지되기 힘들어진다며 우려를 나타냈다. 최진웅 MBC 법무팀장은 “방송사는 하나의 프로그램을 만들기 위해서는 수많은 다른 권리자의 권리를 이용해야 되는 이중적 지위에 있다. 그래서 권리자나 방송사들이나 이런 (무단 학습 이용 같은) 무모한 선택을 하지 않는 것”이라며 “새로운 AI 시대의 가치로 이 입장이 공유됐으면 한다. 예술가, 저작자, 발명가 등의 권리, 권익을 왜 법률로 보호하는지 공감대를 구성한다면 한쪽을 일방적으로 공격하는 형태의 공멸의 길을 가지는 않을 것”이라고 말했다.
뉴스콘텐츠 AI 학습에 대한 합리적인 보상 체계를 구축하기 이전, AI 기업이 학습 데이터를 공개할 것인지 문제가 남아있다. 실질적으로 AI가 어떤 데이터를 학습해 결과를 도출했는지 이용자들은 알 수 없는 상황인데, 저작권자가 요청할 때만이라도 제한적 공개를 해야 한다는 제안도 나왔다.
백지연 국회 입법조사처 입법조사관은 “AI 사업자들은 학습 데이터를 모두 공개하게 되면 나의 영업 비밀을 공개하는 것과 같아 앞으로의 AI 산업 발전에 전혀 도움이 되지 않는다는 주장을 계속하고 있고, 저작권자는 당연히 내 저작물이 어디에 사용되었는지 정도의 알 권리는 있고, 추후 저작권 소송에서 의도성을 증명하는 기초 자료로 쓰일 수 있다는 주장을 하고 있는 상황”이라고 전했다.
이어 “유럽에선 인공지능법이 통과됐고 투명성 의무를 부과했다. 학습 데이터 공개에 관한 문제를 논의하면서 전체 공개를 하느냐, 공개하지 않느냐라는 이분법적인 논의에 빠져 있는 것 같다는 생각을 했다”며 “보상 체계를 마련하려면 결국 대략적이라도 어디에, 어느 정도가 사용되었다는 건 공개가 되어야 협상을 시작할 수 있다고 본다”고 말했다.
안재형 SBS 법무팀장도 “질문을 많이 받는 것 중에 하나가 왜 국내 기업인 네이버만을 상대로 소송을 제기했냐는 거다. 여러 배경 중 가장 큰 이유는 일단 네이버가 학습 데이터로 언론사의 기사를 사용했다고 인정했다는 것”이라며 “소송엔 입증 책임 문제 나오는데 미국은 증거 개시 제도라고 소송에 일단 들어가면 거기서 파악할 수 있는 제도적 장치가 있지만, 우리는 전무하다. 침해를 주장하는 권리자 입장에서 입증 책임을 해야 하는데, 그래서 데이터 학습 공개가 필요하다고 본다”고 말했다.
지난해 말 국회에서 통과된 AI 기본법이 ‘산업 육성’에만 초점을 두고 있다며 인공지능의 개발·활용에 사용되는 학습용 데이터 공개를 법적으로 의무화해야 한다는 요구도 나왔다. 신한수 한국신문협회 디지털협의회장은 “올해 정부의 AI 예산이 얼마 전 추경까지 해서 1조9000억원이 편성됐다고 하는데 주로 GPU 투자, AI 인재 육성, 모델 개발 등 기술 발전 쪽이고, 콘텐츠 산업 지원 정책은 눈에 띄지 않는다”며 “신문협회는 AI 학습용 데이터 공개를 법적으로 의무화 해야 하고, 저작권자들의 권리가 침해당할 가능성이 있는 TDM(텍스트·데이터 마이닝) 면책 도입에 대해서도 명백하게 반대하는 입장”이라고 말했다.
이날 간담회를 마치며 이해민 의원은 “AI와 뉴스콘텐츠 저작권 문제는 시장의 자율적 협상이 바람직하지만, 힘의 논리에 의해 협상이 제대로 작동하지 않을 경우를 대비한 법적 장치가 필요하다”며 “최소한의 규제가 있어야 진흥이 가능하듯 AI 산업과 저작권도 이분법적으로 사업자와 창작자간 대립구도를 만드는 것이 아니라 상생할 수 있는 지속가능한 생태계를 구축해야 한다”고 말했다.
방문신 방송협회장은 “생성형 AI의 비약적 발전의 이면에는 뉴스 콘텐츠를 비롯한 저작물의 무단 학습이라는 불편한 진실이 자리하고 있다”며 “가치와 신뢰성이 매우 높은 뉴스 콘텐츠가 무차별적인 AI의 학습으로 인해 가치를 인정받지 못하고 남용된다면 장기적으로 저널리즘 생태계의 지속가능성까지 위협할 수 있다”고 했다.
박지은 기자의 전체기사 보기
Copyright @2004 한국기자협회. All rights reserved.