다음뉴스 신규 입점 모델 본문

1배경: 뉴스 서비스와 이용자 선택권

2023년 12월 말 다음뉴스는 언론사가 직접 운영하는 편집판으로 구성한 ‘언론사탭’을 전면에 배치하고, ‘주요뉴스’ 배열을 추가하는 서비스 개편을 단행했습니다. 이용자 선택의 폭을 넓혀 다양한 뉴스를 접하고, 자신의 필요와 취향에 맞는 매체를 선택할 수 있도록 한 기획 의도입니다. 이에 따라 개편 초기에는 다음과 같은 유의미한 결과가 나타났습니다.

언론사탭,뉴스탭 클릭유저수 추이
언론사탭,뉴스탭 클릭유저수 추이
관련
다음뉴스 설명서-제3장 배열선택권 2.0

하지만 시간이 흐를수록 기사 노출 및 클릭, 구독, 피드 사용성 등 전반적인 이용자 활동성이 낮아지거나 둔화되는 현상이 나타났습니다. 이는 2022년 다음뉴스에 구독 모델을 첫 도입한 당시(My뉴스탭)에도 나타난 현상으로, 저희는 그 원인을 3가지로 판단합니다.

언론사탭 기사 노출-클릭-구독 추이
언론사탭 기사 노출-클릭-구독 추이

첫째, 새로운 채널 유입의 부재

뉴스제휴평가위원회(이하 제평위)에 매체 입점 권한을 넘긴 2015년부터 다음뉴스에는 연 1~2개 정도의 신규 매체가 입점하였습니다. 즉, 사용자는 근 10년간 매체 구성에 거의 변화가 없는 서비스를 이용하였고, 이는 곧 신규 탭(언론사탭)에서조차 활동성 하락을 낳은 원인으로 보입니다.

둘째, 대동소이한 언론사 편집판

‘천편일률적인 뉴스가 홍수처럼 쏟아지고 있다’는 지적은 학계 뿐만 아니라 고객 불만사항으로도 심심찮게 인입되고 있습니다. 포털 뉴스의 다양성이 부족하다는 목소리 또한 일맥상통한 평가입니다. 대다수의 언론사가 동일한 사안들로 편집판을 채운다면 사용자 역시 ‘언론사탭 피드를 내려도 비슷하다’는 인상을 받게 되고, 이는 자연스럽게 ‘구독 및 활동량’ 둔화로 나타날 수 밖에 없겠습니다.

셋째, 구독 이후 추가적인 유익 부족

사용자가 특정 언론사 채널을 구독한 전후, 즉 사용자 경험(UX)이 달라진다면 이에 따른 활동성도 기대해 볼 수 있겠으나 현시점에는 그런 유익이 부족한 것이 사실입니다. 구독을 통한 추가적인 유익이 언론사 뿐만 아니라 사용자에게도 명확히 제공하는 서비스 기획이 필요할 수 있겠습니다.

물론 뉴스 서비스가 통상적인 인식과 달리 ‘구독형 모델’에 적합하지 않을 수 있으며, 오랜 기간 포털 뉴스 기존 사용법에 익숙한 이용 패턴 때문일 수도 있습니다. ¹ 하지만 오랜 기간 변화 없는 매체수, 특히 카테고리별로 다채로운 전문 매체의 인입이 이뤄지지 못했던 대목은 분명 이용자 선택권을 저해하는 요소임은 확실해 보입니다. 따라서 언론사탭 사용성을 높이고 활성화하기 위해서는 기존 입점 방식을 재검토할 필요가 있습니다.

2 기존 방식: 뉴스제휴평가위원회를 돌아보며

카카오는 2015년 10월, 네이버와 함께 국내 온라인 뉴스 생태계의 건강한 발전, 그리고 언론과 포털의 상생과 협력을 위한 독립 기구로 제평위를 출범시켰습니다. 제평위 출범 이전 양 포털이 자율적으로 시행했던 뉴스 제휴 심사는 평가의 공정성과 투명성에 대해 지적 받고 있었으며, 당시의 뉴스 서비스 또한 어뷰징 기사의 남발로 저널리즘의 가치가 하락하고 뉴스 이용자의 사용성을 저해한다는 비판에 직면해 있었습니다. 이에 언론 유관단체 및 이용자 단체, 학계 및 전문가 단체 등 15개 단체에서 추천한 위원으로 구성된 독립적인 외부 기구에 제휴 평가에 대한 권한을 일임하여 뉴스 제휴 평가에 대한 공정성과 서비스의 품질을 확보하고자 했습니다.

출범 이후 7년간 운영된 제평위는 뉴스 생태계 교란 행위를 줄이는데 일조했다는 긍정적 평가를 받았습니다. 그러나 2021년 5월 ‘뉴스제평위 5년간의 공과’ 세미나에서도 지적되었듯이, 평가 과정의 불투명성과 평가 기준의 자의성, 높은 진입장벽, 평가-피평가자와의 이해충돌 가능성, 그리고 매체의 다양성을 측정하는 지표 부재 등 부정적 평가 역시 지속적으로 받아온 것이 사실입니다. 2023년에는 참여 단체를 18개로 확대하고 위원 자격 요건을 신설하는 등 그간 제평위가 받아온 문제를 개선한 ‘제평위 2.0’ 개편안을 공표했으나 근본적인 문제점에 대한 비판을 잠재우지는 못했고 결국 같은 해 5월 제평위 중단을 공지하게 되었습니다.

뉴스제휴평가위원회 출범 과정
뉴스제휴평가위원회 출범 과정
제평위 심사 규정
제평위 심사 규정

3 준비과정: ‘100% 투명하고 정량화된’ 입점 모델 가능할까?

제평위 중단 이후, 다음뉴스는 자문기구(뉴스투명성위원회)는 물론, 개별 언론사, 언론 유관단체의 의견을 수렴하고, ‘제평위 5년간의 공과’ 세미나에서 나온 연구진의 보고서를 검토하여 ‘100% 공개 가능하고(투명성), 100% 측정 가능한(정량화)’ 입점 모델을 구축해 보자는 목표를 세웠습니다. 이는 전에 없는 새롭고 신선한 접근 방식을 기대하는 사회의 기대에 기술기업이 화답하는 방식이기도 합니다.

측정 가능한 평가 항목을 확인하기 위해 그동안 심의위원회(제평위)의 입점 평가표를 비롯 매체, 기사, 기자, 이용자 피드백 등 주요 기사 구성요소에서 추출 가능한 지표를 하나하나 검토하여, 그 중 30가지 이상의 항목을 추려내고, 이중 일부를 정량화하고 조합하는 모델링 작업을 진행하였습니다.

물론 모델링 작업 과정이 마냥 순조롭지는 않았습니다. 정량화가 사실상 불가능한 평가항목도 있었고, 유의미한 측정값을 도출했더라도 요소별 가중치에 따라 결과가 급격히 변하는 경우도 발견했습니다. 예로, ‘사회적 가치성’, ‘윤리적 요소’는 저널리즘 관점에선 필수적인 평가 항목이지만 기계적 판단의 대상이 되기 힘들어 다른 방식으로 보완해야 함을 확인하였고, ‘보도의 공정성’, ‘정확성’, ‘객관성’은 기사 내용을 평가해야 하는 대목으로 플랫폼이 판단할 수 없는 영역이라 보았습니다. 무엇보다 제평위 심사방식이 여러 유형의 언론사 -지역지, 전문지, 방송사, 종합일간지 등-를 하나의 동일 잣대로 점수화하고 평가했던 탓에 언론사의 다양성을 반영하지 못한다는 문제점도 제기되었습니다.

신규 입점 모델 수립 과정
신규 입점 모델 수립 과정

4 새로운 입점-제재 모델의 세가지 원칙(방향성)

<신문 등의 진흥에 관한 법률(이하 신문법)> 제2조(정의) 2호² 에는 인터넷뉴스의 자격을 규정하는 핵심 개념을, 신문법 시행령 제2조(인터넷신문)에는 좀 더 자세하게 기준 요건을 명시하고 있습니다. 요약하면, 정치ㆍ경제ㆍ사회ㆍ문화 등 전체 혹은 특정 분야에 관한 독자적 기사 생산과 지속적인 발행을, 특히 주간 전체 기사의 30% 이상을 자체 생산기사로 게재할 것을 주문하고 있습니다. 수십 가지의 평가요소와 이를 배합한 다양한 모델링이 나올 수 있겠으나, 결국 ‘사회적 합의’, 즉 명문화된 법조항에서부터 모델 수립을 시작하는 것이 적절하다고 보았습니다. 특히 ‘생성형 AI’ 기술의 발달을 통해 손쉽게 뉴스를 찍어낼 수 있는(일명 처널리즘 churnalism³) 요즘의 환경에서 매체의 자체생산력은 그 어느 때보다 중요한 자격 요건이라 할 수 있습니다.

또한, 정량화하기 어려운 요소는 공신력을 갖춘 언론/기자 유관단체 소속 여부와 회원사로서 정관 및 윤리조항 준수 여부를 확인하는 방식으로 진행합니다. 이를 통해 아래와 같은 세가지 원칙에 입각한 모델링을 구축하고, 이를 실시간으로 분석 - 대응하고 리포트를 배포할 수 있는 ‘뉴스 분류시스템(KNOTS : Kakao News Organizing & Tagging System)’을 만들게 되었습니다.

첫째, 목표에 부합한 ‘핵심 요소’에 집중합니다.

전 과정의 투명성과 절차적 공정성을 목표로 한 만큼, 새로운 입점 모델은 언론사를 ‘평가’하는 개념을 배제하고 관련 법이 규정한 기준을 ‘충족’하는지 확인하는 절차로 구성합니다. 여러 평가항목을 하나하나 점수를 매겨 합산하는 방식을 지양하고, 핵심 요소(자체 생산력, 전문성, 지속성)의 충족 여부를 Pass/Fail로 판단합니다.

둘째, 입점 이후에도 지속적으로 준수 여부를 추적합니다.

입점 시 충족한 기준이 입점 이후에도 ‘유지’될 수 있도록, 즉, ‘핵심 요소’ 준수 여부를 시스템을 통해 실시간 확인하고 피드백을 제공합니다. 이를 통해 입점에서 제재(퇴출)까지 일관된 정책을 수립함은 물론, 구독자를 비롯한 다음뉴스 이용자의 만족도를 높이고 건강한 언론 생태계 유지에 플랫폼이 기여하고자 합니다.

셋째, 더 나은 입점 시스템을 위해 끊임없이 개선합니다.

제평위 운영에 관한 사회적 지적사항을 해결하는 데 초점을 맞춘 만큼, 보다 가치중립적이고도 투명성을 높이는 방향으로 시스템을 지속적으로 보완하고자 합니다. 이를 위해 외부 자문 기구(뉴스투명성위원회)를 통한 정기적인 감수를 받고, 다양한 언론 유관 조직의 의견을 정기적으로 청취하여 개선점을 점검합니다.

다음뉴스 신규 입점 프로세스
다음뉴스 신규 입점 프로세스

5 베타 테스트: 총선 특집 페이지 지역 언론사 입점

이러한 모델링 구축 이후 실제로 잘 동작하는지 확인하는 과정이 필요했습니다. 대학신문 입점 등 여러 아이디어가 있었으나, 시기적으로 22대 국회의원 선거 특집페이지 내 새로운 입점 모델을 테스트하는 것으로 결정하였습니다. 총선 특성상 지역 현안을 가장 잘 전달할 수 있는 지역 언론의 입점은 그 자체로 이용자에 유익한 특집이기도 하였습니다.

2024년 2월부터 서울을 제외한 6개 권역(인천/경기, 강원도, 충청도, 전라도, 경상도, 제주특별자치도)으로 모집 공고를 내고 총 30개의 지역 언론사의 입점 신청을 받았습니다. 평가 항목은 자체 기사와 전문 분야(지역) 기사 비율을 확인하는 방식이었으며 그 결과 신청 언론사 모두가 기준을 충족하여 입점을 하게 되었습니다.

권역별 입점 신청 매체의 자체기사 비율 검증
권역별 입점 신청 매체의 자체기사 비율 검증
22대 국회의원선거 특집 페이지 운영
22대 국회의원선거 특집 페이지 운영

4개월간 서비스를 하면서, 자체 기사와 전문 분야 기사 비율은 입점 판단요소로 적절했다는 대내외적 평가와 더불어 일부 평가항목은 지역 매체 현실을 반영하지 못했다는 지적도 있었습니다. 단신 기사 비중이 높아 평가 대상에서 제외되는 기사가 많은 경우도 있어 분류 시스템의 개선도 필요하였습니다.

다음 장부터는 이러한 개선점을 반영한 카카오만의 두 가지 정량평가 항목에 대해 자세히 소개하겠습니다.

6 정량 평가 1: ‘자체 기사’ 생산 비율

앞에서 언급 드린 신문법과 시행령은 독자적인 취재를 통한 자체 기사 생산을 인터넷신문의 핵심 자격으로 명시하고 있습니다만 무엇이 ‘자체 기사’인지 별다른 정의를 내리고 있지 않습니다. 학계에서도 해당 개념을 어떻게 규정할 것인지 논의가 거의 없고⁴, 정부 부처 및 공공 기관에서 진행한 인터넷신문 실태조사에서도 딱히 구체적인 규정을 제시하지 않은 채 진행했음을 알 수 있습니다.

관련
참고 기사

따라서 시행령 ‘주간 게재 기사 건수의 100분의 30 이상을 자체적으로 생산한 기사로 게재할 것’ 규정을 충족했는지 확인하기 위해서는 ‘자체 기사' 분류 규정과 방식을 자체적으로 만들어야 했습니다.⁵ 다만 뉴스는 학술논문, 출판도서 등 다른 지적 생산물과 달리 사실에 관한 기록을 기본으로 하고 또한 ‘공공재라는 측면에서’ 저작권이 느슨하게 인정되고⁶ 현장에서 뛰고 있는 기자들조차 ‘자체 생산기사' 인식이 제각각인 점⁷, 플랫폼은 언론사의 취재 과정을 직접 확인할 도구나 데이터, 제도적 장치가 없는 이유로 직접적으로 자체 기사를 찾아 그 비율을 계산하는 방식보다는 (사실상) 완전히 동일한 문장으로만 구성된 기사를 복제기사로 분류하고, 이를 제외한 나머지를 ‘자체 기사’로 판단하기로 하였습니다

이제 복제기사를 분류하기 위해서는 아래 두가지 질문을 해결해야 합니다.

1) 복제 문장, 즉, 완전히 동일한 문장이란?
2) 복제 기사, 즉, 완전히 동일한 문장이 기사 전체의 어느 정도여야 하는가?

1) 완전히 동일한 문장(이하 복제 문장)

복제 문장을 판단하기 위해서는 문장 간 유사도를 비교하는 알고리즘이 필요합니다. 이를 위해, 다음뉴스는 뉴스 데이터에서 추출한 문장쌍을 대상으로 0~5까지 총 6가지 레이블링을 진행 하고, 이를 학습한 언어 모델을 개발하였습니다. 레이블링의 기준은 아래와 같습니다.

문장 유사도 검증 방식 (1)
문장 유사도 검증 방식 (1)

이 언어 모델은 기사 내의 각 문장을 하나의 벡터로 변환하여 두 벡터 간 유사도를 0~1 사이의 값으로 나타냅니다. 자체 기사 판단 과정에서는 문장 간 유사도가 0.9 초과일 경우 복제 문장이라고 판단합니다. 모델은 레이블링 결과를 모사하도록 파인튜닝되어 있으므로, 문장 간 유사도 0.9 초과는 레이블링 기준에서 4.5 이상의 의미를 가진다고 볼 수 있습니다.

언론사의 기사가 다음뉴스에 인입되면 그 시점에서 이전 한 달간 송고된 모든 기사의 문장과 비교 분석을 진행합니다. 평균적으로 한 달간 입고되는 유의미한 기사 문장은 약 6백만 개인데(기사 본문이라 할 수 없는 문장, 예로 바이라인, 반복되는 언론사 문구, 그리고 길이가 매우 짧은 문장은 제외), 이 모든 문장과의 유사도를 매번 하나하나 비교하는 것은 비효율적입니다. 따라서 유사한 문장을 빠르고 정확하게 찾는 기술(HNSW⁸)을 활용해 비교할 문장을 선별하는 작업을 진행합니다.

문장 유사도 검증 방식 (2)
문장 유사도 검증 방식 (2)

2) 완전히 동일한 문장(복제 문장)의 기사 내 비중

자체 기사를 구분하려면 하나의 완결된 기사에서 복제 문장의 점유 정도, 즉 ‘기사 내 비중’을 정의해야 합니다. 뉴스 기사는, 앞에서도 언급한 특수성 -보도의 자유와 국민의 알 권리, 언론기관 상호의존의 필요성⁹ 등-을 이유로 학위 및 학술지 등과 같은 잣대로 볼 수 없다고 보았고(통상 각 대학원 학위논문의 경우 5~20% 이하로 표절률 기준이 제시되고 있습니다.), 따라서 수년간 다음뉴스에 인입된 기사를 토대로 다양한 시뮬레이션 해보는 신중한 접근이 필요했습니다.

이를 통해, 복제 문장이 0 혹은 100%에 가까울수록 기사 분포가 급속도로 많아짐을 확인하였습니다. 이는 다음뉴스에 인입된 기사들이 주로 자체 기사(거의 대부분의 문장이 자체 문장)이거나 복제 기사(거의 대부분의 문장이 복제 문장)로 구성되어 있음을 의미합니다. 또 복제 문장 비중을 달리해가며 변화를 살펴본 결과, 복제 문장의 비중 60%부터는 언론사별 자체기사 비중이 크게 변화하지 않는 점을 파악할 수 있었습니다. 따라서 60%를 기준으로 이를 초과한 복제 문장이 있으면 ‘복제 기사’로, 이를 넘지 않으면 ‘자체 기사’로 구분하기로 합니다.

기사 내 복제 문장의 비중 분포
기사 내 복제 문장의 비중 분포
자체기사 비중 전후 비교
자체기사 비중 전후 비교

7 정량 평가 2: 전문 기사 생산 비율

두 번째 핵심 평가요소는 전문 기사 생산 비율입니다. 제평위의 경우, ‘뉴스 콘텐츠 제휴' ‘뉴스 검색 제휴' 두 가지 트랙으로 입점 심사를 진행하였는데, 이는 뉴스와 검색, 즉 서비스별로 지원하여 입점 평가를 하는 구조입니다. 외견상 문제가 될 게 없는 입점 방식이지만, 언론사마다 다루는 전문 분야, 취재 커버리지, 콘텐츠 형식, 발행 주기 등이 다른데 심사는 동일한 잣대로 받게 되다 보니¹⁰ 해가 갈수록 ‘모든 분야를 다루는' 종합형 매체로 수렴하는 경향을 보이게 됩니다. 쉽게 비유하자면, 체급이 다른 선수가 같은 링 위에서 겨루는 꼴이 되다보니 다들 체격을 억지로 키우고 있다고 할까요?

결과적으로 이런 현상을 재조정하고 ‘이용자 선택권'을 높이는 방향으로 가려면, 입점 시점부터 다른 접근이 필요하다고 보았습니다. 즉, 새로운 다음뉴스 입점 모델은 한 번에 입점 심사를 진행하는 과거의 방식에서 벗어나 지역, 생활 경제, 환경, 테크(IT) 등과 같은 전문 분야별로 입점을 진행하면서, 해당 입점 분야의 기사 비중을 입점의 핵심 요소로 설정하는 것입니다.이를 통해 각 분야별로 전문성을 갖춘 다양한 언론사를 입점시켜 사용자의 선택권을 강화하고, 입점 시의 기준이 유지되는지 지속적으로 모니터링 하고자 합니다. 전문 분야의 기사가 지속적으로 유입된다면 그간 지적된 획일화 현상도 점차 개선되리라 생각합니다.

전문 기사 생산 비율을 확인하려면, 기사가 어떤 분야인지 분류하는 작업이 필요합니다. 이를 위해 언어 모델을 활용한 ‘카테고리 분류기’를 구축하게 되었고, 이를 통해 사회·정치·경제 등 기존 분류를 포함한 총 60가지 카테고리로 세분화하여 분류하였습니다. 이 분류는 다양한 사회 변화에 맞춰 새 분류가 필요한 경우 신규 학습 데이터를 통해 지속적으로 추가되며 그 정확도를 높이고자 주기적으로 작업이 진행됩니다.

입점 카테고리 분류 프로세스
입점 카테고리 분류 프로세스

8 마치며

‘포스트-팬데믹 시대’.
즉, 코로나19의 공포가 사그라든 이 시점, 이용자의 뉴스 소비는 다시 그 이전으로 돌아갔지만 ‘신뢰할 수 있는’ 뉴스가 필요한 순간이 오면 어김없이 뉴스 이용량이 증가하는 것을 확인하게 됩니다. 한반도와 멀리 떨어진 지역에서의 전쟁이 우리 밥상-생활 물가에까지 영향을 미칠 때, 온난화를 넘어 지구 열대화(Global Boiling) 현상으로 인한 경험해보지 못한 기후현상을 맞닥뜨릴 때, 대형 사건사고, 올림픽 등 주요 국민적 관심사가 있을 때 이용자는 다시금 뉴스를 찾고 있습니다. 이런 이유로 다음뉴스는 뉴스기사를 일반 콘텐츠와 구분하여 유통할 필요성을 여전히 느끼고 있으며, 이런 기조를 유지하면서도 ‘이용자 선택권’ 또한 증진시킬 방안을 찾는 여정을 지속하고 있습니다.

2015년부터 햇수로 9년간 외부 독립기구(제평위)에게 맡겼던 입점 방식을 변경하는 첫해입니다. 입점 기준 및 방식, 활용 기술, 절차, 결과 등 모든 것을 투명하게 공개하여 진행하는 만큼 어떤 예상치 못한 부작용이 나올지 알 수 없으나, 지속적으로 관련 기술을 개선해 나갈 뿐만 아니라 참여 언론사는 물론 다양한 목소리를 귀담아듣고 발전시켜 나갈 것을 약속드립니다.

사람과 사회를 이해하는 기술로 ‘사회적 필요’를 개선하는데 온 힘을 다하는 다음뉴스가 되겠습니다. 감사합니다.

뉴스투명성위원회 리뷰

다음뉴스는, 이번 다음뉴스 설명서 감수는 물론, 신규 입점 모델을 준비하면서 총 세 차례(2024년 1월 31일, 5월 23일, 9월 4일) 위원회 의견을 청취하였습니다. 회차별 상세 내용은 <카카오 정책산업 연구> 브런치 채널을 참고하기 바라며, 여기서는 입점 모델 관련한 발언 중심으로 정리하여 소개합니다.

총론
  • 자체기사 비율, 전문기사 비율을 중시함으로써 자연스럽게 특종, 원천보도, 심층보도가 많은 언론사가 입점에 유리해지는 방향, 뉴스의 다양성과 질을 동시에 높일 수 있는 방향 환영.
  • 해당 모델이 입점 뿐만 아니라 노출, 추천 등에도 적용되어 타사 기사를 도용하는 언론사가 부당한 이익을 얻는 것을 막는 방향까지 가야한다고 봄. 즉, 자체기사 생산 언론사의 권리를 보호하여 나아가 이용자와 건강한 언론 생태계 유지에 도움될 것으로 보임.
  • 뉴스 품질 향상을 위해 포털 사업자가 저널리즘 기술 개발하는 것이 긍정적인 기여를 한다는 점, 언론사와 플랫폼이 공동으로 뉴스 환경을 개선하자는 메시지가 잘 전달되면 좋겠고, ‘원천보도'를 높이고 ‘분야의 다양성’을 높이는 2가지의 지향점을 언론사가 명확하게 이해할 수 있도록 할 필요가 있겠음. 집계한 자료를 언론사에 투명하게 공개하면 흔쾌히 기준에 동의할 것으로 보임.
  • 포털의 책임 회피 방식으로 제평위가 남용된 것이 문제이기도 했던 만큼 이번 계기로 포털 사업자의 자율권과 의무를 대외에 명료하게 제시할 필요가 있음.
  • 제평위 제도 마련 당시에도 많은 고민을 하고 만든 만큼, 문제가 있었다고 치부하지만 말고 준용할 수 있는 항목이 있는지 검토해 볼 필요 있음.
  • 복제문장 탐지와 전문기사 비율 등은 기존 입점 매체에도 적용하는 것이 바람직.
입점 기준 및 프로세스
  • 시행령 기준(전체기사의 30% 이상을 자체기사로 함)이 지나치게 낮아보임. 더 양질의 언론사가 입점하도록 기준을 높일 필요 있어보임.
  • 모든 언론사에 일괄 동일한 조건으로 적용하기보다 분야별 특성, 언론사별 특성에 따라 입점 기준 제시하면 어떨지. 예로, 지역언론학회에서 좋은 언론사를 추천 받는 등 일반 기준을 미달하는 매체를 위한 보완 방식을 고민해봤으면.
  • 100% 정량 평가라는 것이 객관적이라는 장점이 있지만 ‘정성 평가’를 완전히 배제하는 것에 대한 위험성도 있을 것으로 보임. 따라서, 기자협회 소속사가 아닌 경우 양질의 뉴스를 지속적으로 생산해왔다는 것을 소명할 수 있는 창구를 열어주고 검토할 수 있는 기회를 줘야하지 않을지
  • 카테고리별 입점 신청 받을 시, 다음 번엔 어떤 분야 차례인지 미리 알려서 불확실성을 줄여주면 좋겠음.
  • 인당 기사 생산량, 생산 품질을 나타내는 다른 지표를 검토해서 기회를 확대할 것을 사전 공개하는 것도 방법임.
기술 설명 및 고도화
  • 자체기사와 전문기사 분류 알고리즘을 고도화하길 바람. 예를 들어, 취재원 취재 문장을 선별하는 모델을 트레이닝 하여 적용한다던지, 전문 영역 언어를 별도로 학습하여 이를 활용하는 안도 좋겠음.
  • 자체기사 분류방식, 특히 적용 기술(HNSW)에 대해 일반인들도 이해할 수 있도록 좀 더 쉽게 설명할 필요 있음.
  • 어떤 산출 기술을 쓰냐에 따라 결과가 달라질 수 있는 만큼 다양한 유사도 비교 로직을 함께 활용해서 점검해보면 좋을 듯.
  • 탐사보도, 심층보도의 분류 방식을 추가로 개발하여 가산점 항목을 만들면 좋겠음.
  • 지역 언론은 기술 투자 자원이 부족한 상황인만큼 카카오가 기술 지원 고려하면 좋겠고, 어떤 기술 지원 가능한지
제재 및 추후 관리
  • 입점 선정 시점에 맞춰 자체기사 인플레이션 현상, 기사 한 건을 서너 건으로 늘리는 등 오남용, 편법이 나타날 수 있음. 따라서 기준 미달 시 퇴출 등 시행할 수 있도록 입점시 동의 절차 필요.
  • 입점 이후에는 해당 카테고리 외 기사를 많이 쓸 것으로 보임. 계약서상 일정 비율 이상 유지해야 한다 내용 넣어야 할 듯.
  • 매체가 확대되는 만큼 기사 검수 인력/시스템 제반 확충되어야 할 것.
  • 선정성, 폭력성, 복제 등 매체 부정행위에 대한 대외 공개 제안.
  • 제평위 입점 심의 당시 자체 심의기구(신문윤리위, 인터넷신문윤리위 등)에 가입하면 가산 점수를 줬었는데, 가입 여부를 주요하게 평가하면 좋을 것. 외부 심의기구와 연계를 많이 했으면 함.
  • 쫓아내기보단(계약 종료) 안에서 도태되는 방식이 좋겠고, 잘 하는 곳에 가산점을 더해주는 방식이 더 효과적일 듯.
관련
카카오 정책산업 연구 브런치

9 질문과 답변

Q. 자체(생산)기사란?
A. 독자적인 취재 과정을 통해 직접 생산한 기사를 말하며, 이런 언론사의 자체 생산력을 신문법(및 신문법 시행령)에서는 인터넷신문의 자격을 규정하는 핵심 개념으로 보고 있습니다.
Q. 자체 기사 비중이 사실상 유일한 기준인 셈인데, 왜 자체 기사에 주목했나?
A. ‘독자적 기사 생산 능력’은 법적 요건으로 규정된 핵심요소이자 가치중립적인 항목입니다. 또한 '생성형 AI' 기술 발달 등 그 어느 때보다 중요한 가치로 자리잡고 있습니다. 자세한 설명은 본문 <4. 새로운 입점 모델의 세 가지 원칙(방향성)> 참고 바랍니다.
Q. 플랫폼의 자체/복제 기사 분류는 언론사의 권리를 침해하는 것은 아닌가?
A. 실시간 생산되는 언론 기사를 모두 동일하게 유통하는 것은 원천적으로 불가능합니다. 만연하고 있는 기사 도용, 이를 통한 부당 이익을 막는 방향이 곧 자체 기사를 생산하는 언론사를 보호하고, 더 나아가 이용자와 건강한 언론 생태계 유지에 기여하는 일이라고 보았습니다. 이번 분류 기준은 오랜 기간 다음뉴스가 확보한 데이터를 기반으로 가치중립적인 요소들로 설계하였고, 또한 지속적으로 보완해나갈 예정입니다. 언론계나 학계에서 관련 기준을 정립한다면 따를 용의가 있습니다.
Q. 송고를 빨리 하면 자체, 최초 기사인가?
A. 다음뉴스는 언론사와 달리 보도자료를 받지 않을뿐더러 모든 원본을 확보하는 것은 원천적으로 불가능하기 때문에 인입되는 기사를 비교하는 방식으로 복제 여부를 판단합니다. 따라서 송고를 가장 빨리 한 기사는 (비교 대상의 똑같은 기사와 문장이 없다는 가정 하에) 복제 기사에서 제외됩니다. 자체/복제 기사 분류 시스템을 만든 이유는 더욱 더 빨리 송고하라는 취지보다는 남(타 매체)과 다른 기사를 분류하여 입점뿐만 아니라 향후 기사 추천 등에서 존중받게 하고자 하는 취지에 있습니다
Q. 기존 제평위 자체 기사 기준과 어떤 차이가 있나?
A. 제평위는 자체 기사를 ‘언론사가 직접 기획하고 취재해 생산한 기사 또는 보도자료 등에 대하여 직접 분석 및 추가 취재, 평가, 비교, 의견 등을 담아 재생산한 기사’로 규정하고 있습니다. 그러나 세부 요건으로 기사의 내용 혹은 실체에 접근해야만 판단이 가능한 부분을 포함하고 있기에 100% 정량화를 목표로 한 새로운 입점 모델에는 차용하기 힘들다고 보았습니다.
Q. 보도자료를 활용했더라도 취재한 내용이 있으면 자체 기사라고 봐야 하지 않나?
A. 6장(‘자체 기사’ 생산 비율)에서 상세히 설명하였듯이, 보도자료 활용 여부를 떠나 독자적인 취재 내용이 일정 이상 포함되어 있다면 자체 기사로 분류됩니다. 다만, 독자적인 취재 여부를 플랫폼이 판단하는 것은 (기자의 취재노트와 통화 기록을 일일이 확인할 수 없듯이) 불가능한 일이기에 기사 내 ‘문장 단위’의 비교 분석을 통해 ‘복제 문장’을 찾고자 하였고, 독자적인 취재 내용에 의해 작성한 문장은 그 자체로 고유할 것이므로 다른 기사의 문장과 완전히 동일할 확률은 매우 희박합니다. 그럼에도 불구하고 예외적 상황을 고려하여 피해를 입는 언론사가 있지 않도록 기준 설정에 신중을 기했고 정교화하기 위한 검토 작업을 진행하였습니다.
Q. 텍스트 기사만 판단 대상인가? 영상 기사,포토 기사는?
A. 다음뉴스에 유통되는 절대량의 기사가 글로 된 만큼 ‘텍스트 기사’가 대상입니다. 향후 영상, 포토 기사로 충분히 확대 가능하리라 판단하고 있습니다.
Q. 어떤 기사가 왜 복제 기사로 판단됐는지 알 수 있는지?
A. 가능합니다. 모든 기사에 대해서, 전체 문장과 판단 대상 문장, 복제 문장을 각각 파악할 수 있고, 문장 복제 여부의 근거가 된 문장이 어떤 기사의 어떤 문장인지 파악할 수 있는 시스템이 구축되어 있습니다.
Q. 패러프레이징(몇 개의 단어를 바꾸거나 문장, 단락 재배열 하는)은 허용하나?
A. 복제 문장 판단에 사용되는 로직은 본문(6장)에서 언급한 레이블링 기준을 따르기 때문에 문장 내 순서가 다르더라도 내용이 완전히 동일한 경우 ‘같은 문장’으로 판단하고 있습니다. 즉, 중요하지 않은 세부 내용의 일부 변경 만으로는 복제 문장 판단을 회피할 수 없습니다. 또한 복제 기사를 판단하는 최종 기준은 전체 중 ‘복제 문장의 비중’이므로 일부 문단, 문장 단위의 재배열로는 역시 회피할 수 없습니다
Q. 지역 언론 등 규모가 작은 언론사가 소외될 가능성이 있는 것이 아닌지?
A. ‘이용자 선택권’ 강화를 목표로 새로운 입점 모델을 고안한 만큼 이전 대비 문호가 넓어질 것으로 기대하고 있습니다. 지역 언론을 대상으로 사전 평가(5. 베타 테스트 : 총선 특집페이지 지역 언론사 입점 참고)를 한 이유 역시, 다채로운 전문 매체의 인입에 신규 입점 모델이 적합한 지 체크해 보기 위함이었습니다. 입점의 핵심 평가요소 두 가지 모두 언론사의 규모와는 무관합니다.

참고

1.장윤재, 「[뉴스 떠나가는 이용자들, 원인은] 변화된 뉴스 환경 이용자도 변하고 있다」, 신문과방송 2023년 11월호, p16, 2023 에서 과거부터 이어진 ‘뉴스 구독’에 대해 아래와 같이 언급한다. “가정에서 구독하는 신문과 잡지, 텔레비전 등은 개인적 취향보다는 가장의 선택과 취향의 영향을 더 받았다. (...) 이처럼 즐길 수 있는 콘텐츠의 양, 형식, 기회가 다양해진 만큼 사람들은 더 풍부하게 콘텐츠를 즐기는 동시에 넘쳐나는 정보와 상호작용에 피로를 느끼고 있다. (...) 그렇다보니 사람들은 자신이 애써 뉴스를 찾아보지 않더라도 중요한 뉴스라면 결국 내가 보게 될 것이라는 인식을 갖게 된다.”

2.신문법 제2조 (정의) 2. “인터넷신문”이란 컴퓨터 등 정보처리능력을 가진 장치와 통신망을 이용하여 정치ㆍ경제ㆍ사회ㆍ문화 등에 관한 보도ㆍ논평 및 여론ㆍ정보 등을 전파하기 위하여 간행하는 전자간행물로서 독자적 기사 생산과 지속적인 발행 등 대통령령으로 정하는 기준을 충족하는 것을 말한다.

3.보도 자료나 다른 기자가 작성한 기사를 적당히 바꾸어 자신의 기사로 만드는 행위 (출처 : 다음 백과사전)

4.김춘식 · 이강형, 「인터넷신문의 '자체 생산 기사' 개념 정의 및 측정」, 커뮤니케이션 이론 17권 3호, p163, 2021

5.제평위는 ‘자체 생산 기사’ 관련하여 10가지 판단 기준이 있으나, 정성적 판단이 필요한 항목이 대부분인 관계로 준용하기 어려웠다. (참고기사 : 김춘식, “집단적 베껴쓰기 관행 규제해야”, 기자협회보, 2018년 11월 7일)

6.안수찬, 「저널리즘의 새로운 과거와 오래된 미래, 복제 보도와 원천 보도」, 고려대학교 대학원 박사학위 논문, p36, 2021. 저작권법은 ‘사실의 전달에 불과한 시사보도'를 저작권 보호 대상에서 제외하고 있다.

7.박수선 기자, 인터넷신문 기자 33% “보도자료 통째로 베껴도 내 기사”, PD저널, 2018년 11월 23일

8.HNSW(Hierarchical Navigable Small World graphs) : 검색 대상 벡터의 유사 벡터를 빠르게 검색하는 알고리즘 중 하나로 NSW(Navigable Small World)의 local minimum 문제를 해결하기 위해 레이어를 계층화함.

9.김재협, 「타매체 기사 인용의 문제점과 법적 책임」, 언론중재, p38, 1998. 이해를 돕고자 일부 문장을 소개한다. “(...) 세계의 어떤 유수한 언론기관도 자신의 조직과 인력 및 장비만으로 이러한 요구를 충족시켜줄 만큼 능력을 갖추지는 못하고 있다. 아니 그런 능력을 갖출 수도 없고 갖출 필요도 없다. 왜냐하면 세계 다수의 언론기관이 협력을 통하여 상대방이 가진 조직과 능력을 적절히 이용함으로써 이러한 문제점을 해결할 수 있고, 또한 그러한 방향이 바람직하기 때문이다. 이러한 현상은 시간이 흐를수록 가속화될 것으로 본다.”

10.이런 지적사항을 개선하고자 일간지 200건, 주간지 50건, 월간지 20건, 인터넷신문 100건, 전문지 20건, 방송사 200건으로 매월 기사 생산량(및 자체 기사 생산 비율) 요건을 달리 정했으나, 그 외 항목은 동일하다. 출처 : 제평위 심사규정집

Copyright © Kakao Corp. All rights reserved.