25년치 뉴스 빅데이터 분석 가능하지만 갈 길 멀어

언론진흥재단 '빅카인즈' 서비스
3000만건 뉴스에 분석기술 접목
언론사들 빅데이터 경험 쉬워져
언론계, 사업 비전 회의적 시각

  • 페이스북
  • 트위치

한국언론진흥재단(언론재단)이 19일 출범시킨 뉴스 빅데이터 분석 플랫폼 ‘빅 카인즈(BIG KINDS)’를 두고 업계에서 기대와 의구심이 교차하고 있다. 기자들에게 데이터 저널리즘을 위한 ‘좋은 무기’가 생겼고, 뉴스의 활용성을 넓혔다는 점에 대해서는 평가하면서도 유용성과 장래성, 비전 등을 두곤 회의적인 목소리가 나온다.


언론재단은 이날 서울 중구 한국프레스센터에서 ‘뉴스 빅데이터, 뉴스미디어의 미래를 열다’ 행사를 개최하고 ‘빅 카인즈’의 면면을 공개했다. 25년 동안 축적한 3000만 건의 뉴스 데이터가 있는 공공DB ‘카인즈’에 빅데이터 분석기술을 접목했다. 언론사의 데이터 저널리즘을 지원하기 위한 목적으로 3년 간 총 60억원(매년 약 20억원)이 투입된다. 언론재단은 앞서 지난 3월호 ‘신문과방송’에서 ‘사장된’ 과거뉴스에 ‘분석 가치’를 부여해 재활용하고 뉴스 콘텐츠를 다시 보는 계기를 만들고자 한다는 요지를 밝힌 바 있다.


실제 빅 카인즈 서비스는 이런 취지에 맞춰 구축됐다. 언론사들이 실시간으로 보낸 기사 데이터를 형태소·개체명·네트워크별로 분석해 데이터베이스로 구축, 일반인과 전문가 등 대상에 따라 차별적으로 제공하는 식이다. 일반인은 키워드 검색을 기반으로 한 뉴스 분석 콘텐츠를 이용하고, 언론인 등 전문가는 직접 데이터마이닝을 해 분석결과를 얻고 시각화까지 할 수 있다. 이 모든 작업을 ‘원스텝’에 할 수 있고, 오픈 API를 통해 자사보도에 활용할 수 있다는 점은 분명한 강점이다.


▲한국언론진흥재단은 19일 서울 중구 프레스센터에서 ‘뉴스빅데이터, 뉴스미디어의 미래를 열다’행사를 열고 뉴스 빅데이터 분석시스템 ‘빅 카인즈’를 공개했다. 사진은 이를 활용한 한겨레21의 지난1월26일자 보도(오른쪽 3장)와 이날 행사장 모습.

언론재단 차원에서 범용도구가 마련돼 데이터 저널리즘의 ‘문턱’이 낮아졌다는 데 기자 등 언론사 관계자들은 호의적인 평가를 내리고 있다. 현 미디어환경에서 추락해버린 뉴스의 가치를 높일 수 있고, 뉴스의 활용성을 넓힌 채널이 확보됐다는 점에서도 의미가 적지 않다. 국내매체 디지털 분야 전문가 한 기자는 “뉴스가 지속적으로, 통시적으로, 전략적으로 관찰, 발굴, 개발할 수 있는 자원이란 걸 각인시킬 수 있다. 디지털 뉴스 속성상 이용자가 뉴스를 통해 얻을 수 있는 인사이트는 제한적이고 비공식적인데 활용성을 넓혔다는 데 의미가 있다”면서 “공공재에 걸맞은 위상과 가치를 비로소 부여받은 것”이라고 했다.


하지만 업계 관계자와 전문가들의 중론은 “절반의 출범”, “앞으로의 과제가 더 많다”는 평가로 모인다.
우선 ‘빅 카인즈’는 언론사들의 자발적이고, 적극적인 움직임을 유도하기에 부족한 배경을 지녔다. ‘빅 카인즈’는 언론사들에게 당장 실익을 가져다주는 사업이 아니다. 언론재단조차도 추진 과정에서 당장의 수익보다는 높은 취재 활용성과 참여 언론사들의 운영위 구성 및 유료화 등 비즈니스 모델 구축을 통한 차후 보상, 포털 대응 플랫폼으로서의 역할을 강조하며 참여를 유도하는 식이었다. 언론재단이 보장할 수 있는 것은 매달 50만원 가량의 전송료가 전부인데 언론사들은 자사 콘텐츠를 또 다른 플랫폼에 고스란히 넘겨줄지 고민해야 했다는 의미다. 더욱이 사업의 비전에 대한 업계의 전망 자체가 그리 긍정적이지 않다. 부정적이거나 ‘일단 지켜보자’는 유보적인 판단이 지배적이다.


언론재단 관계자는 “‘카인즈’ 시절 참여하지 않았던 조선일보, 중앙일보를 비롯해 총 41개사와 협의를 진행 중”이라고 밝혔는데, 이들 상당수는 사업 자체의 전망보다는 디지털 체질 전환 과정에서 드는 비용절감 같은 부수적인 효과에 관심을 뒀다. 종합일간지 한 관계자는 “환영하는 사업은 아니었다. 빅데이터를 경험할 분석툴을 제공하기 때문에 단기적으로 기자들에게 좋은 경험이 될 것으로 보고 우선 1년만 참여해보기로 한 것”이라고 전했다. 한 경제지 관계자는 “불확실한 비즈니스 모델 때문에 대부분 부정적이었는데 재단이 기자연수, 저작권사업 등을 진행하다보니 정무적으로 판단하게 된 거 같다”고 말했다.


또 사업의 근간인 뉴스 데이터의 가치에 대해서도 의문을 표하는 목소리가 나온다. 현재 빅 카인즈 뉴스데이터는 모두 종합일간지, 경제지, 지역지 등 신문사들의 ‘텍스트’다. 이미지나 통계자료 등은 제외됐고, 이를 해석한 텍스트만이 분석대상이 된다는 의미다. 또 다른 언론사 한 기자는 “데이터 저널리즘이 되려면 숫자와 표가 있어야 한다. 중복된 기사도 많고 25년치에 불과한데 과연 ‘카인즈’에 들어가 있는 텍스트 콘텐츠에서 유의미한 결과가 나올지 의문”이라고 지적했다.


‘빅 카인즈’의 또 다른 문제는 데이터 저널리즘에 친숙지 않은 국내 미디어환경에 기인한다. 빅데이터를 통한 취재과정이 우리나라 언론사와 기자들에게 생소하고, 분석·시각화도 초보적인 경우가 많아 재단의 사후 관리가 더 중요해지는 대목이다. ‘빅 카인즈’를 써본 기자들과 재단 관계자들 모두 “툴 사용이 좀 어렵다”는 얘기를 공통으로 하고 있는 상황에서 재단이 계획 중인 데이터마이닝, 시각화 등 활용교육 등은 재단과 언론사 양측에 필수적이다. 



최승영 기자의 전체기사 보기

배너

많이 읽은 기사