다음뉴스 배열 설명서 본문
1 배열 설명서 작성 배경
다음뉴스는 서비스를 시작한 2003년부터 이용자의 편리하고 균형 있는
기사 소비에 초점을 맞춰 진화해왔습니다.
2015년, 다음뉴스 편집자가 기사를 선별 배치하던 오랜 관행에서
벗어나 국내 처음으로
‘루빅스(RUBICS : 실시간 이용자 반응형 콘텐츠 추천
시스템)’를 도입했습니다. 그 결과 다음뉴스 이용자는 똑같은 기사 배열을
보던 방식에서 벗어나 개인마다 맞춤형 기사를 접할 수 있었습니다.
2021년, 다음뉴스는 이용자 누구나 큐레이터가 되어
편집판(카카오뷰)을 발행하는 서비스를 시작했습니다. 이로써 언론사는
기사 송고를 넘어 기사를 직접 배열하고 이용자는 개인의 선호에 맞춰
편집판을 선택할 수 있었습니다.
그럼에도 다음뉴스는 기사 배열의 3가지 문제를 고민합니다.
첫째, 다음뉴스가 현재 140여 개 언론사에게 공급받는 2만여 건의 기사 중, 이용자에게 제공하는 기사는 한정적일 수밖에 없는 점을 고민합니다.
둘째, 머신러닝에 기반한 추천 알고리즘은 오늘날 모든 서비스에 적용하는 추세지만, 뉴스 알고리즘이 편향된 데이터를 학습하거나 일부 변수를 과대/과소 반영해 기사를 제공할 우려가 있습니다.
셋째, 개인화된 뉴스 추천이 야기할 수 있는 정보의 편식 현상에 대한 우려를 완화하고, 자치(self-governing)에 필요한 정보를 제공한다는 저널리즘 본연의 가치를 구현할 수 있는 기술적 대안을 고민합니다.
2022년, 다음뉴스는 이러한 고민을 바탕으로 기사 품질과 이용
편리성을 유지하면서도 한층 진화한 기사 배열 모델을 적용해 서비스
개편을 단행했습니다.
이와 함께 다음뉴스의 기사 배열 기준과 구성요소를 투명하게
공개하고, 이용자 눈높이에서 이해 가능하도록 기사 배열에 관한
설명서를 제공합니다. 이는 2018년, 카카오가 국내 최초로
‘알고리즘 윤리 헌장’에서 밝힌 ‘이용자 신뢰를 위한
뉴스 알고리즘 설명’ 원칙과도 부합합니다.
다음뉴스는 한국언론학회가 추천한, 윤호영 (이화여대 커뮤니케이션미디어학부 교수)·이종혁 (경희대 미디어커뮤니케이션학과 교수)·임종섭 (서강대 지식융합미디어대학 교수)·한지영 (KAIST 문술미래전략대학원 교수) 전문가(가나다 순)에게 내용과 표현 방식을 감수받았습니다.
이번 다음뉴스 배열 설명서는 뉴스 서비스 투명성을 강화하기 위한 첫걸음입니다. 다만 이용자 누구나 쉽게 이해할 수 있는 완벽한 설명서라고 하기엔 한계가 있습니다. 그럼에도 다음뉴스는 이용자 신뢰를 최우선으로 하고 설명서의 지속적인 수정과 보완 작업에 최선을 다하겠습니다.
2 기존 배열에 관한 고민
주목 경쟁 그리고 특정 정보 편식언론사가 보내온 기사가 다음뉴스 첫 화면에 노출되기까지 ‘선별’과 ‘배열’ 과정을 거칩니다. 다음뉴스는 이 과정에서 이용자가 모든 정보에 주목할 수 없기에 한정적인 지면 안에서 최대한 신뢰할 수 있고 시의적절한 기사 제공을 중요하게 여깁니다.
다음뉴스는 이용자에게 다양하고 알맞은 기사를 제공하기 위한 여러 가지 방법을 고민해왔고 추천 알고리즘 기술은 그 시도 중 하나입니다.
추천 알고리즘 도입은, 이용자에게 기존에 사람이 편집하던 방식에 비해 더 많은 기사를 제공했고 정보 다양성 측면에서도 진일보한 성과를 가져왔다고 자부합니다. 또한 모든 이용자가 동일하게 배열한 기사를 봐야 했던 것과 달리 이용자 별 관심사에 따른 맞춤형 기사를 추천할 수 있게 됐습니다. 실제 추천 알고리즘 도입 이후 첫 화면에 노출되는 기사량은 도입 전 대비 3.5배 증가했습니다. 또한 과거 이슈 중심의 기사 소비로 소외됐던 분야의 뉴스도 이용자 관심사에 따라 첫 화면에 배치되면서 IT·과학 뉴스는 3.3배, 국제 뉴스는 5.1배, 문화생활 뉴스는 5.5배 이상 노출량이 늘었습니다.
다만 이러한 이용자 편의에도, 다음뉴스가 직접 기사를 선별하고 추천 알고리즘으로 배열하는 과정엔 우려의 시선이 공존했습니다. 대표적인 지적은 포털 중심 기사 선별 과정은 언론사 간 주목을 끌기 위한 경쟁을 부추길 수 있고, 이는 곧 선정적이고 자극적인 기사로 저널리즘 질을 떨어뜨릴 수 있다는 것입니다. 또한 다양한 기사 공급량으로 정보 다양성이 증가했을지라도 여전히 이용자의 특정 정보 편식을 경계하고 적극적으로 개선해야 한다는 것입니다.
다음뉴스는 우려가 담긴 시선을 겸허히 수용합니다. 그리고 다음과 같이 언론사와 상생해 더 좋은 저널리즘 생태계를 구축하고, 동시에 이용자에게 다양한 기사를 제공할 수 있는 방법들을 모색했습니다.
3 새로운 배열 방향성
언론사에게 ‘주요뉴스’ 기사 선택 편집권을,이용자에게 배열 선택권을 제공합니다.
다음뉴스는 언론사에게 다음뉴스 영역에 ‘주요뉴스’를 배치할 수 있는 기사 선택 편집권을 제공하고, ‘배열’ 기준을 다양화해 이용자 배열 선택권을 확대합니다.
앞으로 다음뉴스는 언론사가 ‘주요뉴스’로 선택한 기사만을 첫 화면에 활용합니다. ‘주요뉴스’란 다음뉴스 첫 화면을 비롯해 ‘이용자가 기사를 접하는 주요 영역에 노출되기 적합한 뉴스’를 의미하며, 언론사 자체적인 판단에 따라 다음뉴스 이용자가 알아야 할(또는 알아두면 유용할) 이슈를 직접 취재 및 검증한 기사를 대상으로 합니다.
또한 다음뉴스는 정보의 편식 우려를 막기 위해 ‘한 개’ 배열이 아닌 ‘최신순, 개인화순, 탐독순’ 세 개의 배열로 기사를 제공하며, 이용자에게 필요하다면 배열 선택권을 개선하거나 새롭게 추가할 수 있습니다.
다음뉴스는 기사 배열의 다양화로 이용자 개개인의 관심사에 부합하는 기사, 일상생활에 유용한 기사, 팬데믹과 같이 시의성이 높은 기사가 더 빠르고 정확하게 이용자에게 닿기를 기대합니다.
4 새로운 배열 과정
A. 언론사 ‘주요뉴스’ 선택
첫 화면에 노출하는 기사는언론사가 직접 선택하고 편집하는 과정을 거칩니다.
다음뉴스는 국내외 주요 이슈를 전달하고자 140여 개 언론사와 제휴 계약을 맺고 하루 2만여 건의 기사를 공급받습니다. 제휴 계약을 맺은 언론사는 ‘주요뉴스’를 직접 선택해 보내옵니다.
다음뉴스 첫 화면 ‘뉴스탭’ 실시간 뉴스 영역과 ‘My뉴스탭’에서는 언론사가 직접 선택한 ‘주요뉴스’를 제공합니다. My뉴스탭은 언론사가 ‘주요뉴스’를 직접 배치한 언론사 편집판으로, ‘헤드라인 기사’ 5개와 ‘기획 기사’ 1개로 구성하며 해당 기사들은 모두 뉴스탭에도 유통합니다.
단, 언론사와 사전 협의를 통해 제외하는 ‘주요뉴스에 적합하지 않은 기사’ -예로, 아래 기사 유형- 가 노출되면, 머신러닝 자동 감지 및 24시간 모니터링팀이 검토를 진행해 즉시 해당 기사의 노출을 제한하고 언론사에 안내합니다.
- 기사로 위장한 광고/홍보 기사
- 다음뉴스 청소년 보호 정책을 위반하는 문구와 이미지를 포함한 기사
- 기사 제목과 섬네일 등에 저속하고 적나라한 표현을 사용한 기사
- 저널리즘 가치를 저해하는 단순 화제성, SNS 인용 기사
B. 언론사 ‘구독’ 및 ‘숨김’ 기능
이용자가 원하는 언론사의 기사를 볼 수 있도록 언론사 구독과 숨김 기능을 제공해 이용자 선택권을 강화했습니다.
언론사 구독은 각 언론사 영역 우상단 ‘구독’을
누르면 됩니다. 구독한 언론사는 ‘My뉴스탭’ 상단에 배치해 우선
노출합니다.
언론사 숨김은 각 언론사 영역 우상단 더 보기 버튼 내 ‘언론사
숨김’을 누르면 됩니다. 숨김 한 언론사는
My뉴스탭, 뉴스탭, 연예탭, 스포츠탭 주요뉴스 영역에서 노출하지
않습니다.
이어 더 보기 버튼 내 ‘설정’을 누르면 이용자가
구독한 언론사 목록과 숨김 한 목록을 확인할 수 있고, 구독 및 숨김
해제도 설정할 수 있습니다.
C. 이용자 ‘배열 선택권’ 제공
이용자에게 배열 선택권을 제공합니다.다음뉴스 기사 배열 방식은 공급받는 기사 다양성을 넘어 이용자 기사 소비 다양성에 초점을 맞춥니다. 다음뉴스는 이용자가 직접 기사 소비 방식을 선택할 수 있도록 ‘최신순, 개인화순, 탐독순’ 3가지 배열 선택권을 제공합니다.
3가지 배열 선택권은 다음과 같은 기준을 고려했습니다.
첫째, 배열 내에서 기사 간 맥락적 가치가
드러나는가? 둘째, 이용자에게 배열 간 차별화된
리스트를 제공할 수 있는가? 셋째, 이용자의 기존
배열 사용성을 고려하였는가? 입니다.
C-1. 최신순
언론사가 기사를 입력하면 다음뉴스 콘텐츠 운영 시스템에 최종
송고한 시점을 기준으로 ‘발행 시각’을
기록합니다.
시의성에 초점을 맞춘 ‘최신순’은 현시점에서
일어나는 이슈를 시간순으로 배열한 것이 아닌,
언론사가 다음뉴스에 송고한 발행 시각 순으로 배열한 것이며 이용자는 이렇게 배열한 순서대로 기사를 만날 수
있습니다.
단, 조간/석간 등 언론사가 자체적으로 정한 기사 송고 시간과 송고 패턴은 다음뉴스 기사 노출 시간과 비중에 영향을 줄 수 있으며, 언론사가 다량의 기사를 지속적으로 송고하면 특정 언론사 기사가 연속적으로 보일 수 있습니다.
- 참고
- 유사 기사 묶음
복수 언론사는 사안에 따라 사실상 동일한 내용의 기사를 비슷한 시간대에 송고합니다. 다음뉴스는 유사한 기사를 ‘유사 그룹’으로 묶고 이용자에게 그룹의 ‘대표 기사’를 노출해 효율적인 기사 소비를 돕고자 합니다.
유사 기사 기준은 기사 제목과, 본문에 쓰인 텍스트가 얼마나 유사한지를 주요하게 보는 것이며 이 외에도 기사 본문 내 이미지 간 유사도, 이미지 내 인물 인식, 기사 카테고리 등을 그룹화 기준으로 활용하고 있습니다.
이렇게 만들어진 유사 그룹 중 서비스 활용을 위한 대표 기사를 선정하는데, 대표 기사는 그룹 내 ‘최신 기사’를 기본으로 선정합니다. 다만, 유사 그룹 안에 언론사 단독 기사가 있다면 최우선으로 하고 그 다음으로 이용자가 구독한 언론사의 기사를 선정합니다.
유사 그룹은 최신순뿐만 아니라 3가지 배열 선택권에 ‘공통’으로 적용합니다.
C-2. 개인화순
‘개인화순’에서는 이용자 기사 소비 이력을
기반으로 이용자가 소비할 만한 기사를 제공해 만족도를 높이고자
합니다.
추천 알고리즘 과정 설명에 앞서 이해를 돕기 위해 기본적인
콘셉트를 먼저 설명드리겠습니다.
<개인화 추천이란? 콘셉트 이해하기>
개인화 추천이 되지 않는다는 것은, 곧 모든 이용자가 동일한 배열을
본다는 의미입니다.
예를 들어, 체류시간이 높은 기사 순으로 추천된다고 가정하면 모든
이용자에게는
기사 (나)→기사 (다)→기사 (가) 순서로
노출됩니다.
그렇다면 새 기사가 들어왔을 때 해당 기사의 체류시간은 어떻게
알아낼 수 있을까요?
신규 유입된 기사를 추천 결과에 낮은 확률로 포함시켜본 뒤, 이용자
반응이 좋으면 노출 빈도를 올리고 반응이 나쁘면 노출 빈도를
줄이는 전략을 쓰고 있습니다.
구체적으로는 ‘톰슨 샘플링(Thompson Sampling)’ 알고리즘을
사용하고 있습니다.
- 톰슨 샘플링(Thompson Sampling)이란? :
- 기댓값(보상)의 분포를 추정 후 샘플링한 값을 기준으로 보상을 계산하는 확률적 알고리즘으로, 피드백을 수용해 기댓값의 분포를 업데이트함.
개인화 추천을 위해 관심사에 따라 이용자를 2개 그룹으로 나눠 보겠습니다. 편의상 연예 기사를 좋아하는 그룹(그룹 A), 스포츠 기사를 좋아하는 그룹(그룹 B) 이렇게 2개 그룹으로 나누었다고 가정하면 다음과 같은 순서로 기사가 추천됩니다.
그룹 A : 기사 (가) → 기사 (다) → 기사 (나) 순.
(그룹 A 체류시간 순서로 추천)
그룹 B : 기사 (나) → 기사 (다) → 기사 (가) 순.
(그룹 B 체류시간 순서로 추천)
개인화를 하지 않았을 때와 관심사 기반 2개 그룹으로 나누어서
추천했을 때, 어떤 경우가 이용자 만족도가 더 높을까요? 후자가
훨씬 이용자 만족도가 높습니다.
구체적인 기술적 배경이 궁금하신 분들은 아래 글을 참고
바랍니다.
개인화순 기사 배열의 목적은 이용자의 서비스 만족도를 최대화하는 것입니다. 다음뉴스는 이용자의 체류시간이 높아지면 이용자의 서비스 만족도가 높아지는 것이라고 판단합니다.
다음뉴스는 이용자들을 많은 수의 그룹으로 나눈 뒤, 각 그룹별로 체류시간이 높을 것으로 예상되는 기사를 우선 추천합니다. 그리고, 추천 결과 중간중간에는 이용자 반응을 확인하기 위한 신규 기사도 함께 노출됩니다.
이용자별 그룹을 나눌 때는, 이용자별 기사 소비 행태 데이터 기반 클러스터링 기술을 사용합니다. 이 과정에서 기사의 주제 및 내용, 언론사에 대한 이용자의 호불호는 반영하지 않습니다.
실제 서비스에서는 이용자를 1개의 그룹에만 속하도록 모델링 하진 않고, 다수의 그룹에 각각 속할 확률을 모델링합니다. 또한, 이용자의 소비 행태에 따라 그 확률 값은 지속적으로 변화합니다. 클러스터링 기술로는 확률 잠재 의미 인덱싱(probabilistic latent semantic indexing, pLSI) 기술을 사용하고 있습니다.
각 항목을 좀 더 구체적으로 설명드리겠습니다.
1) 실시간 최적화
실시간 최적화는 실시간으로 업데이트되는 기사 중 어떤 기사를 이용자에게 추천하면 좋을지 측정하는 탐색(exploration)과 탐색 과정에서 측정된 기대 성과에 따라 기사를 실제로 추천하는 활용(exploitation) 과정으로 이루어집니다.
- 각 기사에 대해 ‘성과’가 측정됩니다. 성과는 기사의 기대 체류시간보다 실제 체류시간이 길어질수록 높은 값을 갖습니다. 기대 체류시간은 기사의 길이가 짧으면 작은 값으로 예측되고, 기사의 길이가 길거나 이미지를 포함한 경우는 큰 값으로 예측됩니다. 이렇게 예측된 기대 체류시간 대비, 이용자가 더 머무는 기사는 성과가 높게 평가되며 덜 머무는 기사는 성과가 낮게 평가됩니다. 성과가 높은 기사는 이용자에게 노출될 기회를 더 많이 얻게 되며, 성과가 낮은 기사는 이용자에게 노출될 기회를 점차 잃게 됩니다.
- 신규 유입 기사를 추천 결과에 일부 포함시켜 기사 소비 정도(기사를 노출했을 때 얼마나 클릭하는지, 기사에 얼마나 오래 머무르는지)를 측정하고 기사별 성과를 예상합니다. 이를 기사별 기대 성과(α)라 정의하며, 이 과정을 탐색(exploration) 한다고 합니다.
- 탐색(exploration)은 이용자 기사 소비 성향 클러스터 별로 이루어지며, 같은 기사더라도 클러스터 별로 각기 다른 기대 성과를 가지게 됩니다.
- 탐색(exploration) 과정에서 측정된 기사별 기대 성과에 기반해 기사가 제공되는 활용(exploitation) 과정이 이루어집니다. 하지만, 추천 결과의 모든 기사가 성과 기반으로만 나가게 되면 새로 유입되는 기사의 성과를 측정할 수 없습니다. 그렇기 때문에 추천 결과에는 신규 유입 기사가 일부 포함됩니다. 탐색(exploration)과 활용(exploitation)이 하나의 추천 결과 안에서 모두 이루어진다고 볼 수 있습니다.
2) 이용자 기사 소비 성향 클러스터링
이용자별로 개인화된 기사 제공을 위해서는 이용자 모델링이 필요합니다. 다음뉴스는 이용자를 기사 소비 행태에 기반해 모델링하며, 그 과정에서 클러스터링 기술을 사용합니다.
- 클러스터링은 이용자 피드백 정보를 기반으로 이용자의 기사 소비 성향을 (가) 클러스터, (나) 클러스터, (다) 클러스터 등 여러 개의 클러스터로 분류합니다.
- 또한 각 클러스터는 여러 개의 카테고리, 주제, 인물이 포함되며 이를 별도로 정의하지 않습니다. 이 역시 유동적으로 변화되며 이용자 개개인의 정치·사회적 성향이나 가치관 등을 반영하지 않습니다.
3) 이용자별 추천 결과 생성
앞서 설명한 실시간 최적화, 이용자 기사 소비 성향 클러스터링 기술을 바탕으로 각 이용자에게 개인화된 추천 결과를 만드는 과정입니다.
- 이용자가 어느 클러스터에 어느 정도 성향을 가지고 있는지 예측한 것을 ‘이용자 클러스터별 선호도 확률 값(β)’이라고 정의합니다. 이때 이용자는 어느 한 개의 클러스터에 속하는 것이 아닌 여러 클러스터에 대한 선호도를 확률 값(β)으로 가지게 됩니다. 가령, 이용자 A의 (가) 클러스터 선호도는 10%지만, (나) 클러스터 선호도는 70%이며 (다) 클러스터 1%, (라) 클러스터 7%, (마) 클러스터 12%를 선호할 것이라는 확률 값을 가집니다. 이 또한 이용자 A의 기사 소비에 따라 확률 값은 계속 변합니다.
- 실시간 최적화에서 구한 각 클러스터 별 기사 기대 성과(α)에 이용자 클러스터 별 선호도 확률 값(β)을 가중치로 두어 이용자 개인별로 높은 성과가 예상되는 순서대로 기사를 제공하게 됩니다.
기사는 새로운 주제를 가지고 끊임없이 변경되며 이용자의 성향 또한 계속해서 변화해 갑니다. 이렇게 실시간으로 바뀌는 환경에 맞춰 다음뉴스의 개인화순 또한 수학적인 알고리즘에 기반해 실시간으로 반영될 수 있도록 하고 있으며, 다음뉴스는 이용자의 성향을 고정하거나 특정 언론사나 특정 기사를 별도로 정의하지 않습니다.
- 덧붙이는 글 :
- 개인화순은 복잡한 추천 알고리즘의 내용을 텍스트로 전달하는데 한계가 있다는 언론학회의 의견에 따라, 이용자 눈높이에 맞춰 멀티미디어를 활용한 설명을 준비하고 있습니다.
C-3. 탐독순
다음뉴스는 이용자가 기사 본문에 체류한 시간을 기반으로 기사 내용이 얼마나 유용했는지 측정하는 방법을 고민했습니다. 이용자에게 제공하는 기사가 한정적일 수밖에 없을 때, 기사 제목과 섬네일 중심 정보는 언론사에게 클릭률이 높은 기사 제공을 부추기기 때문입니다.
다음뉴스에 언론사가 보내온 기사는 본문 길이, 이미지 개수, 영상 유무에 따라 담고 있는 정보량이 모두 다릅니다. 다음뉴스 ‘탐독 지수(DRI)’는 이러한 기사 정보량을 고려해 도출한 이용자의 예상 체류시간을 실제 체류시간과 비교해 이용자가 얼마간 기사 본문에 머물렀는지 측정합니다. 이때, 기사 본문에 머무른 시간이 다른 기사에 비해 상대적으로 높을수록 이용자의 기사에 대한 정보 유용성이 높을 것이라 가정합니다.
탐독 지수 측정 기준은, 일정 수 이상의 이용자가 소비한 기사를 대상으로 최근 4일 치까지만 계산하며 10분 단위로 업데이트합니다. 또한 이용자 체류시간이 극단적으로 짧거나 긴 이상치가 주는 영향력을 억제하기 위해 평균값이 아닌 중앙값을 사용합니다.
‘탐독순’은 이렇게 측정한 값을 기반으로 탐독 지수가 높은 기사를 우선해 배열합니다.
5 쉽고 빠른 이슈 탐색
‘언론사가 주목한 이슈’는 언론사가 많이 다루고 있는 이슈를 시간대별로 한눈에 파악할 수 있는 서비스입니다.수많은 기사 속에서 비슷한 주제를 찾아 하나의 기사 묶음으로 만들기 위해선 사전작업이 필요합니다. 먼저 기사 제목과 본문 내 첫 문장이 유사한 기사들을 하나로 묶습니다. 그리고 각 묶음의 밀도를 측정해 한 개의 기사 묶음으로 합칠지, 각각의 기사 묶음으로 분리할지 정합니다. 이 작업은 HDBSCAN이란 기술을 사용합니다.
- HDBSCAN이란? :
- 밀도가 높은 데이터 영역을 찾아 군집간 계층화하는 클러스터링 기법
기사 묶음이 생성되면 기사 제목에서 대명사, 일반명사, 고유명사 등 명사군을 분류하고, 많이 등장한 순으로 키워드를 자동 추출합니다.
이후 기사 묶음은 언론사가 주요뉴스로 선정한 기사가 많을수록, 다수의 언론사에서 많이 다룬 묶음일수록 주요한 이슈로 분류돼 우선 노출됩니다.
6 가치 있는 기사 재조명
앞서 기술한 우리의 노력에도, 여전히 언론사가 취재력을 투입해
심혈을 기울여 쓴 기사는 실시간 경쟁 속에서 화제성 있는 기사에 밀릴
수 있습니다. 이는 다음뉴스와 언론사가 상생하고 이용자에게 다양한
기사 배열 선택권을 제공하더라도 여전히
‘좋은 기사’를 정의하고 전달하는 방법을 계속
고민해야 하는 이유기도 합니다.
따라서 다음뉴스는 현장의 최전선에서 생생함을 전달한 기사, 시간이
들더라도 철저히 사실을 확인한 기사, 우수한 품질을 인정받은 기자상
수상 기사가 묻히지 않고 이용자를 더 많이 만날 수 있도록 가치 있는
기사를 꾸준히 발견해 전달하고자 합니다.
A. 탐사 뉴스
다음뉴스는 언론사가 직접 취재하고 공들여 쓴 기사를 우대하고자 ‘심층탐사보도’를 별도로 취합하고 있습니다. 기사 수집 대상은 ‘이달의 기자상’을 비롯한 국내 약 20여 개 언론상 수상작과 기획보도부문 출품작이며 언론사가 자체적으로 ‘심층탐사보도’라고 명시한 경우입니다.
B. 언론상 수상작 모음
다음뉴스는 국내 언론을 대상으로 시상하는 약 20여 개 언론상 수상작 중, 다음뉴스와 기사 제휴를 맺은 언론사 수상작만을 별도로 소개할 예정입니다. 기사 제휴를 맺지 않은 언론사 수상작도 소개할 수 있도록 점진적으로 대상 범위를 넓히겠습니다.
C. 팩트체크 뉴스
다음뉴스는 사실 왜곡 및 과장한 기사를 무분별하게 제공하지 않도록 사실관계를 검증한 기사를 모았습니다. 지속적으로 가짜 뉴스 생산과 유통, 확산을 막고자 노력하겠습니다.
- 관련
- 언론사별 팩트체크
7 질문과 답변
- Q. 다음뉴스에서 ‘추천 알고리즘’을 적용한 영역은 어디인가요?
-
A. 다음뉴스는 아래 영역에 추천
알고리즘을 적용합니다.
- 모바일 다음뉴스 > 뉴스탭 ‘주요뉴스’
- PC 다음뉴스 > 뉴스탭 ‘주요뉴스’
- 기사 본문 하단의 > ‘이 시각 추천 뉴스’
- Q. 다음뉴스 ‘개인화순’에 적용한 추천 알고리즘 원리를 상세히 알고 싶어요.
- A. 알고리즘 관련 상세 내용은 ‘카카오 정책산업 연구 브런치’에서 확인하실 수 있습니다.
- Q. 저는 평소 로그인을 하지 않고 기사를 보는데요, 그래도 개인화에 맞는 추천 알고리즘을 적용하나요?
- A. 다음뉴스 추천 알고리즘은 로그인/비로그인 여부와 상관없이 이용자 성별, 나이 등을 식별하지 않는 ‘비식별자’ 이용 기록을 활용합니다. 따라서 로그인을 하지 않고 기사를 보더라도 이용자 맞춤형 추천 알고리즘을 제공할 수 있습니다.
- Q. 유사 그룹의 대표 기사 선정 시 제가 구독한 언론사가 아니라 다른 언론사 기사가 선정될 수 있나요?
- A. 유사 그룹 중 대표 기사 선정 시 이용자의 구독 여부를 가장 우선합니다. 다만, 이용자가 구독한 언론사의 기사가 다음뉴스에 송고한 지 일정 시간 지났다면 기사 생명주기에 따라 구독하지 않은 언론사의 기사가 선정될 수 있습니다.
- Q. 다음뉴스 기사는 사람이 개입해 수동으로 기사를 삭제하거나 수정하나요? 있다면 어떤 이유와 절차를 거치나요?
- A. 다음뉴스 기사는 실시간으로 배열하고 있으나, 시스템 장애로 삭제된 기사 혹은 운영정책을 위반한 기사가 노출되면 삭제 이유를 명시하고 삭제 처리할 수 있습니다.
- Q. 특정 언론사 기사가 더 자주 노출되는 것 같아요. 실제로 그런가요?
- A. 다음뉴스 ‘주요뉴스’ 노출 빈도는 언론사의 기사 송고량과 송고 패턴에 비례합니다. 따라서 언론사가 특정 시점에 주요뉴스를 다량으로 보내온다면 일시적으로 노출 빈도가 높아질 수 있으며 다음뉴스는 특정 언론사의 기사를 더 자주 노출하지 않습니다.
- Q. 제가 쓴 댓글도 추천 알고리즘 요소로 활용하나요?
- A. 댓글은 기사 추천 알고리즘 요소로 활용하지 않습니다.
- Q. ‘언론사가 주목한 이슈’는 모두에게 동일한 키워드와 기사를 제공하나요?
- A. 모든 이용자에게 동일한 키워드와 기사를 노출합니다. 다만, 키워드 노출 순서는 랜덤이며 이용자별로 다르게 보일 수 있습니다.
- Q. ‘언론사가 주목한 이슈’는 시간대별로 키워드 개수가 다른데 이유는 뭔가요?
- A. 시간대별 언론사가 송고하는 기사량에 따라 생성되는 키워드의 수량도 비례합니다.
- Q. ‘언론사가 주목한 이슈’는 포털이 제공하던 ‘실시간 검색어’와 무엇이 다른가요?
- A. 이용자의 검색량을 기반으로 한 실시간 검색어 서비스와는 달리, 언론사가 송고하는 기사량을 기반으로 자동 추출하며 랭킹의 형태로 제공하지 않습니다.
- Q. ‘언론사가 주목한 이슈’는 키워드로 묶인 기사 그룹 중 어떤 기사가 노출되나요?
- A. 언론사가 다음뉴스에 송고한 발행 시각을 기준으로 최신 기사 순으로 노출됩니다.
- Q. ‘언론사가 주목한 이슈’의 키워드가 제외되는 경우도 있나요?
- A. 시간당 수백 개의 키워드가 생성되기 때문에, 서비스 취지에 맞지 않는 부적합한 키워드는 일부 제외될 수 있습니다.
마치며
전 세계가 코로나19로 인한 팬데믹이라는 특수한 상황과, 재난재해 등에 예방하는 기사가 중요해지는 시대를 겪으며 뉴스는 어느 콘텐츠보다도 가치 있는 존재로 여전히 자리매김하고 있습니다. 이에 발맞춰 포털에게 주어진 책무에 기반한 폭넓고 깊이 있는 기사의 투명한 전달은 더욱 중요해졌고, 다음뉴스는 전문가에게 효과적인 설명 방식을 감수받아 그 중요성에 응답하고자 했습니다.
다음뉴스는 지금도 세상에 일어나는 일을 기록하는 언론과, 다양한
견해를 지닌 이용자의 시선을 존중합니다.
이 시선을 서비스에도 꾸준히 반영할 수 있도록 여기에서 ‘배열
설명서’를 끝내지 않고, 다음뉴스와 상생하는 언론사 및 다음뉴스를
아껴주시는 이용자의 피드백을 거름 삼아 보완해 나가겠습니다.
한 발짝씩 정성을 다해 변화하고 나아갈 다음뉴스를 지켜봐 주세요.
감사합니다.