포털 뉴스다양성 낮아... '정치권 압박 등 통신사 높은 비중 영향'

19일 황용석 건국대 교수 '뉴스검색엔진을 통한 뉴스 소스 및 내용 다양성 평가' 연구

  • 페이스북
  • 트위치

국내 뉴스검색엔진의 다양성 수준이 구글과 비교해 낮다는 연구가 나왔다. 특정 이슈를 검색했을 때 국내 포털이 상위에 노출하는 언론사 종류, 토픽 수, 기사 내용 등이 덜 다양했다는 의미다. 특히 네이버와 다음에선 중립적인 통신사 기사 점유율이 높게 나타났는데, 정치권 압력에 대한 포털의 대응 일환으로서 다양성 부족의 원인이 되고 있다는 지적이다.

황용석 건국대 미디어커뮤니케이션학과 교수 연구팀(디지털커뮤니케이션 연구센터)은 지난 19일 한국방송학회 봄철정기학술대회에서 ‘뉴스검색엔진을 통한 뉴스 소스 및 내용 다양성 평가’ 연구결과를 발표했다. 해당 조사는 6개월에 걸쳐 시기별 대표 사안과 관련된 78개 검색 질의어를 입력한 후 결과로 나온 상위 30개 기사들 총 7020개를 다양성 지수(매트릭스)와 머신러닝 기법을 통해 분석, 언론사와 기사의 다양성을 살폈다.

황용석 건국대 미디어커뮤니케이션학과 교수가 지난 19일 한국방송학회 봄철정기학술대회에서 ‘뉴스검색엔진을 통한 뉴스 소스 및 내용 다양성 평가’ 연구결과를 발표하는 모습. /황용석 교수 연구팀 제공

조사결과 구글이 가장 많은 수의 언론사와 다양한 기사를 검색결과에 노출한 반면, 네이버와 다음에선 뉴스 다양성이 상대적으로 떨어지는 것으로 나타났다. 우선 ‘뉴스 검색엔진이 얼마나 많은 언론사를 검색결과 상위 30위에 분포시키는지’ 분석했을 때 구글은 358개 언론사를 노출했지만 네이버는 223개, 다음은 103개로 큰 폭의 차이를 보였다. 검색 질의어를 경제, 사회, 라이프스타일/문화, 엔터테인먼트/스포츠 등 5개 토픽으로 구분했을 때도 비슷한 유사한 결과가 나왔다.

연구진은 “검색결과에 많이 노출된 상위 10개 언론사의 누적 점유율(CR10)을 보면, 네이버가 40.77%로 가장 높았고, 다음은 40.51%, 구글은 34.06%로 가장 낮았다”며 “CR10이 높다는 의미는, 상위 10개 언론사의 검색 점유율의 집중 수준이 높은 반면, 다양성은 떨어진다는 것을 의미한다”고 해석했다.

‘뉴스검색엔진을 통한 뉴스 소스 및 내용 다양성 평가’ 연구 중 검색엔진별 검색결과에 많이 노출된 상위 10개 언론사 누적 점유율 비교 표.

특히 네이버와 다음에선 통신사 비중이 절대적으로 높게 나타났다. 네이버의 경우 상위 3개 언론사가 모두 통신사였고 합산 시 점유율은 22.91%에 달했다. 다음은 22.78%였다. 국내 양대 포털의 뉴스검색결과에서 대표적인 보수, 진보 신문사는 10위 안에 없었다. 구글에선 통신사 중 연합뉴스만 4.66%로 상위 10위에 포함됐다. 다양성을 측정하는 ‘허핀달-허쉬만’·‘심슨의 다양성’·‘샤논 다양성’·‘블라우’ 지수 값을 따져봤을 때 3곳 검색엔진 모두 ‘집중 상태’로 판단되진 않았지만 상호 간 비교했을 때도 다양성 수준은 상위 10개 언론사 합산 점유율 현황의 패턴으로 구글, 네이버, 다음의 순이었다.

‘뉴스검색엔진을 통한 뉴스 소스 및 내용 다양성 평가’ 연구 중 검색엔진별 상위 10개 각 언론사 점유율 비교 표.

황 교수는 뉴스제휴평가위원회를 통해 계약된 언론사 뉴스만 제공하는 네이버, 다음 여건에 따라 언론사 모수가 적은 점을 다양성이 뒤처진 이유로 지목했다. 또 보수-진보 편향 논쟁에서 멀어지려는 양사의 서비스 정책이 직·간접적으로 알고리즘에 반영됐을 여지도 있다고 했다.

그는 “언론사별로 제작되는 기사량의 차이, 뉴스 검색제휴와 같은 계약기반 서비스 등 공급구조가 1차적으로 영향을 미쳤을 것”이라며 “그러나 통신3사의 점유율이 높은 것은 이들 두 검색엔진의 알고리즘이 이념적 대립이 큰 언론사보다는 사실중심의 중립적인 통신사에 더 높은 비중을 둔다는 것을 의미한다”고 설명했다. 이어 “이 같은 결과는 정치권에서 네이버와 다음의 검색배열이 ‘정치적으로 편향’되어 있다고 비판했던 것과는 거리가 있는 것”이라며 “오히려 중립적인 통신사 의존도가 높아 다양성이 부족한 것이 문제임을 확인해준다”고 덧붙였다.

‘검색결과로 추출된 30개 기사들의 내용이 얼마나 유사한지’를 머신러닝 기법으로 분석한 결과에서도 구글의 다양성이 더 높게 나타났다. 이는 작성 언론사과 상관 없이 기사의 텍스트 내용이 얼마나 유사한지를 측정한 것인데, 구글의 검색결과가 경제, 엔터/스포츠, 라이프스타일/문화, 정치, 사회 등 모든 토픽에서 기사들 간 내용차이가 커 다양성 지수가 더 높은 것으로 조사됐다.

‘뉴스검색엔진을 통한 뉴스 소스 및 내용 다양성 평가’ 연구 중 검색어 토픽별 내용다양성 지수 표(수치 높을 수록 다양성 높다는 의미).

연구진은 이번 결과가 뉴스품질이나 공정성을 분석한 것이 아니고, 다양성 수준 자체로 검색엔진의 성능, 품질을 평가해선 안된다고 강조하면서도 국내 대표 뉴스검색엔진들이 스스로 서비스를 점검할 필요성을 강조했다. 황 교수는 “검색엔진은 서로 다른 다양한 정보에 접근할 수 있게 해주는 ‘정보 접근성’이 가장 중요한 기능”이라며 “우리 사회가 지나치게 검색엔진에 정치적 불편부당성을 요구하고 높은 품질의 정보를 재현하도록 규범 압력을 가하고 있다. 그로 인해 검색알고리즘의 공정성에 부정적인 결과를 낳을 수도 있음을 이번 연구결과로 추론할 수 있다”고 밝혔다.

이어 “그로 인해 검색알고리즘의 공정성에 부정적인 결과를 낳을 수도 있음을 이번 연구결과로 추론할 수 있다. 소수 또는 신생 언론사가 노출될 확률이 낮아져 이들 매체들이 공중에 접근하는 경로가 제한되는 부작용이 발생할 수 있따. 공정성의 하위 개념 중 하나인 다양성이 낮아진 것은 이미 연구 데이터에서도 확인되고 있기 때문”이라고 부연했다.

최승영 기자의 전체기사 보기

배너

많이 읽은 기사