실시간 트렌드 서비스 설명서 2.0 본문
1 실시간 이슈 검색어(실검) 종료 이후
사례 1
2023년 5월 31일 새벽, 서울 시민들은 위급 재난 문자를 받았습니다.
경계경보 발령과 함께 대피할 준비를 안내하는 내용이었습니다.
다음으로의 시간당 유입량이 전날 동시간 대비 최대 298%까지
급증하였습니다. 당시 보도에 따르면, 정확한 상황을 확인하려는
시민들의 접속으로 인해 행정안전부 홈페이지는 물론 네이버 등 일부
서비스에서 접속 지연이나 장애가 발생한 것으로 전해졌습니다.
사례 2
2025년 9월 26일 저녁, 대전에 위치한 국가정보자원관리원(이하
국정자원) 전산실에서 화재가 발생하였습니다. 불이 빠르게 잡히지
않아 재난 위기경보가 발령되고 709개 정부 온라인 시스템이
마비되었다는 소식이 전해지면서 유입량이 급증하였습니다.(전날
동시간 대비 145% 상승.) 다음 날에도 정부24, 우체국 우편 및 금융,
모바일 신분증 등 국민 생활과 밀접한 서비스가 복구되지 않다 보니 이
소식을 확인하고자 하는 사용자의 유입이 주말 아침임에도 불구하고
줄어들지 않았고, 검색량은 저녁으로 갈수록 늘어나는 현상을
보였습니다.
‘불안사회(Anxiety Society)’
많은 학자와 연구자들은 현대 사회를 ‘불안(anxiety)’, ‘불안정(insecurity)’, '불확실성(uncertainty)',‘위험(risk society)’ ‘가속(acceleration)’ 같은 단어로 설명합니다. 그리고 그 원인은 개인의 성향이나 성격 문제로 보기보다, 위험·경쟁·불확실성이 구조적으로 만들어지는 시대적 조건에서 찾습니다.
‘극한 호우’라는 용어가 도입될 정도로 예측이 어려워진 날씨와 재해재난, 전대미문의 코로나19 팬데믹 이후 높아진 공중보건 이슈, 심상찮은 국제 정세와 함께 매일 달라지는 생활 물가까지, 우리가 빠르게 파악하고 관심을 둘 사안은 많아졌습니다. 이에 반해 정보는 더 빠르게 흩어지고, 여러 맥락이 복잡하게 얽히면서 “무엇이 사실인지” 확인하기도 어려워졌습니다.
앞서 소개한 사례 1 역시 비슷한 흐름 속에 있었습니다. 사건 자체는 20분 만에 정리되었지만, 시민들은 “나만 문자를 받은 것인지”, “다른 사람도 같은 상황인지”, “정확한 정보는 무엇인지”, “추가 안내를 기다려야 하는지, 당장 행동해야 하는지”, “최신 속보가 나왔는지” 등을 확인하기 위해 다음을 찾았습니다. 이를 종합하면, 많은 사람들이 ‘지금 무슨 일이 벌어졌는지’를 빠르게 파악할 수 있는 기능을 필요로 한다는 점을 알 수 있습니다.
실시간 이슈 검색어의 종료
실시간 이슈 검색어(이하 실검)는 약 20년간 운영되다가 2020년 2월
20일 종료되었습니다. 당시 카카오 대표는 실검이 본래 “현상의 결과를
보여주는 곳”이어야 하지만, “결과의 반영이 아닌 현상의 시작점이
돼버렸다”라고 말했습니다. 아울러 기업의 사회적 책임을 다하고 더
건강한 사회를 만들기 위한 조치였다고 종료 이유를 밝혔습니다.
그렇다면 재난이나 속보처럼 사람들이 빠르게 알아야 할 이슈를 공유하는 서비스가 왜 사회적 논란의 대상이 되었을까요? 2019년 당시, 특정 이슈를 둘러싸고 온라인 커뮤니티에서 실검 순위를 의도적으로 끌어올리는 ‘운동’이 추진되었습니다. 특정 문구를 정해 집단적으로 검색하도록 유도하거나, 띄어쓰기·로그인·클릭 방식까지 안내하는 등 참여 방식이 정교해지면서 실검이 더 이상 “자연스러운 관심의 결과”로만 보기 어렵게 된 것입니다. 그 결과 실검이 여론전의 도구이자, 집단행동의 목표처럼 사용되는 상황까지 이어졌습니다.
서비스 종료 이후에도 남아있는 필요
흥미로운 점은, 국내 대표 포털 두 곳에서 실검 서비스가 종료된
이후에도 사용자의 필요가 사라지지 않았다는 것입니다. 크고 작은
공적 사건이 발생할 때마다 사람들은 보다 정확한 정보를 찾고, 서로의
생각을 확인하거나 나눌 수 있는 공간을 찾아 이동해 왔습니다. 이는
여러 석학들이 말하는 현대 사회의 구조적 현상, 즉
불안을 개인이 감당하는 방식에서 벗어나 사회적 위험에 함께
대응하려는 흐름과도 맞닿아 있습니다.
다음은 실검 종료 이후 “본연의 취지를 살릴 새로운 방식의 서비스를
준비하겠다”는 약속 아래, 여러 형태의 서비스를 출시하며 축적해 온
시행착오의 과정을 가졌습니다. ‘실시간 트렌드’는 그 과정에서 쌓인
노하우를 바탕으로 만들어진 서비스입니다.
이제부터는 ‘대안의 시간’을 지나오며 확보한 노하우로 과거의 문제를
반복하지 않기 위해 어떤 부분을 다르게 설계했는지 설명드리고자
합니다.
2 대안을 만드는 시간들 : '트리거'가 아닌 '스냅샷'으로
실검 논란이 남긴 교훈은 어찌 보면 단순했습니다. 이슈의 ‘트리거’가 아닌 이슈의 ‘스냅샷’을 보여주는 것. 지금 어떤 일이 벌어지고 있는지를 거울처럼 담아내되, 앞으로 벌어질 일을 확성기처럼 키우지 않는 것입니다. 다시 말해 사람들의 관심과 사회 현상의 결과는 ‘반영’하되, 새로운 ‘발화점’을 만들 수 있는 구조는 피하는 것에서 출발했습니다.
그 과정에서 한 번에 모든 것을 대체할 “정답 같은 서비스”를 내놓기보다는, 여러 방향의 실험과 대안을 추진하였습니다. 어떤 서비스는 사람들이 작성한 글에서 무엇이 가장 언급되는지를 살펴보았고, 또 다른 서비스는 언론사들이 어떤 이슈를 중심으로 다루고 있는지를 분석했습니다. 또 어떤 시도는 사용자가 데이터를 직접 비교하고 확인하는 과정에서 어떤 형태의 정보 제공을 더 선호하는지를 확인하는 데 초점을 맞췄습니다.
A. 카카오 데이터 트렌드
이용자가 직접 빅데이터를 살펴볼 수 있는 서비스2020년 7월, 실검 서비스 종료 이후 가장 먼저 선보인 서비스입니다. 기존처럼 플랫폼이 ‘밥상 차리듯’ 트렌드 키워드를 제시하기보다는, 이용자가 직접 다양한 데이터를 비교하고 내려받아 연구와 리서치에 활용할 수 있도록 설계된 도구였습니다. 실검처럼 단번에 현재 이슈를 파악할 수 있는 목록은 제공하지 않았지만, 대신 기간·기기·성별·연령·지역 등 원하는 조건을 설정해 데이터를 확인할 수 있도록 했습니다.
다만 이러한 구조는 “지금 무슨 일이 벌어졌는지”를 빠르게 파악하기 어렵다는 한계가 있었고, 그 결과 이용자들의 관심을 충분히 끌어내지 못했습니다. 이 실험은 2025년 8월을 끝으로 마무리 되었습니다. 서비스는 종료됐지만, 운영 과정에서 얻은 경험은 ‘트렌드’ 서비스 설계에 많은 인사이트로 이어졌습니다. 예를 들어 이용자들이 단일 키워드보다 2~3개 어절의 검색어를 함께 비교·분석하는 패턴을 보였고, 이를 통해 기존처럼 한 단어 중심으로 구성된 실검 방식에 변화가 필요하다는 점을 확인할 수 있었습니다.
B. AI 이슈 브리핑
언론사가 자주 언급한 이슈를 묶어 한눈에 파악하도록AI 이슈 브리핑은 또 다른 방향에서 해답을 찾기 위한 시도였습니다. 사용자가 직접 검색하지 않더라도 “오늘 중요한 이슈가 무엇인지”를 쉽고 빠르게 훑어볼 수 있도록, 뉴스 기사에 주목했습니다. 다음뉴스의 기사 묶음(클러스터링) 기술을 활용해 주요 이슈를 정리해 보여주는 서비스이며, 2022년 8월부터 운영을 시작했습니다. 이후 생성형 AI 기술을 적용해 기사 묶음의 타이틀과 짧은 요약을 함께 제공하고 있습니다.
AI 이슈 브리핑은 ‘국민의 알 권리’와 ‘공론의 장으로서 여론 형성’이라는 언론의 역할과 맞닿아 있다는 점에서, 사회적 관심을 ‘반영’하는 서비스 목표와도 잘 맞았습니다. 또한 뉴스 기사는 공정성과 객관성을 기반으로 생산되는 콘텐츠이기 때문에, 순위 왜곡이나 여론전의 수단으로 활용되는 상황을 비교적 효과적으로 피할 수 있다는 점에서도 가치가 있었습니다. 다만 개인화 서비스가 보편화된 환경에서는, 기성언론 보도가 속도나 커버리지(다루는 주제의 폭) 측면에서 다소 한계를 보이기도 했습니다. 그 결과 사용자 활용도는 상대적으로 낮은 편이라고 평가할 수 있습니다.
C. 투데이 버블
웹문서를 기반한 사람들의 ‘급증 관심사’ 뽑기투데이 버블은 “실검의 빈자리를 채우되, 실검과는 다른 방식이어야 한다”라는 철학을 가장 직접적으로 구현해보고자 한 서비스로, 2023년 5월 시작했습니다. 공개된 웹페이지에서 주제의 ‘급증’을 포착하고, 특정 출처에 쏠리지 않도록 문서 다양성을 고려해 점수를 보정했습니다. 이를 통해 이용자의 생활과 안전에 도움이 되거나, 우리 사회의 공감대를 확장할 수 있는 이야기 주제를 발견하도록 돕는 것을 목표로 했습니다.
또한 2년 이상 운영하는 과정에서, 실검이 겪었던 동일한 형태의 문제가 같은 강도로 반복되지는 않는다는 점을 확인할 수 있었습니다.
다만 투데이 버블 역시 AI 이슈 브리핑과 비슷한 한계를 드러냈습니다. 과거 실검 수준으로 사용자의 기대를 충분히 충족시키지 못하는 지점이 분명히 존재했습니다. 많은 사용자들은 서비스 정체성에 의문을 제기하며, 이미 어느 정도 지나간 ‘대화의 주제’보다 “지금 당장의 중요한 이슈”를 즉시 파악하고 싶다는 요구를 보였습니다. 이는 일부 사용자의 불만으로만 치부하기 어려운 신호였고, 서비스가 사회적 가치를 갖기 위해서는 이러한 ‘긴급함’에 대한 요구를 일정 수준 이상 충족해야 한다는 점을 확인하는 계기가 되었습니다.
3 실시간 트렌드 : 더 빠르게, 더 단단하게, 더 안전하게
실시간 트렌드는 투데이 버블을 기반으로 한 업그레이드 버전으로, 투데이 버블이 충분히 채워주지 못했던 사용자 필요, 즉 “빠르게 알아야 할 이슈를 공유하는 기능”에 더 초점을 맞췄습니다. 주변 사람들이 무엇에 관심을 갖고 어떤 주제를 많이 이야기하는지, 대화의 ‘기류’를 발견해나간다는 기존 취지는 유지하되, 이를 더 빠르게 포착하고 더 직관적으로 전달하기 위해서는 다양한 데이터 소스와 새로운 기술 도입이 필요했습니다. 동시에 과거 실검이 겪었던 문제를 되풀이하지 않기 위한 안전장치도 함께 고려하였습니다.
이제 실시간 트렌드가 이용자에게 노출되기까지 어떤 과정을 거치는지, 그 흐름을 자세히 설명드리겠습니다.
전체 서비스 단계별 흐름도
실시간 트렌드는 총 4단계를 거쳐 생성됩니다. 이를 통해 대중의 관심사와 언론의 공적 어젠다를 두루 포괄하며 실시간으로 그 결과를 도출합니다.
1데이터 소스 확대- 다음 검색 로그와 뉴스 문서를 실시간(10분 이내)으로 수집, 검색 기반 키워드 및 문서 기반 키워드를 생성.
- 각 소스별 급상승, 신규 유입, 언급량, 어뷰징 등을 탐지하고 스코어링 한 후, 통합 랭킹 알고리즘으로 최종 순위를 결정.
- 부적절한 키워드를 자동 필터링하고, 운영자 검수를 통해 서비스 품질 보장.
- 최종 선정된 키워드를 홈탭에 준실시간 노출하며, 순위 변동과 신규 진입을 시각적으로 표시.
3-1. 데이터 소스 확대
검색 로그와 문서 데이터를 함께 활용하여 더 풍부하고 균형 잡힌 트렌드 정보를 제공합니다. 각 데이터 소스는 서로 다른 특성을 가지며, 이를 결합하여 단일 소스의 한계를 극복합니다.
A. 검색 로그
사용자들이 실시간으로 검색하는 키워드를 수집하여 “지금 대중이
궁금해하는 것”을 파악합니다. 현재 활용 중인 데이터 소스는 다음과
같습니다.
- 다음 통합검색
- 다음 뉴스검색
- 다음 카페검색
- 향후 다음 서비스 전체 검색 로그로 확대 예정 (커뮤니티, 소셜 등)
데이터 처리는, 검색 로그 수집 → 사용자 중복 제거 → 봇/자동화 필터링 → 정규화 → 스코어링 과정을 거칩니다.
- 실시간 수집 : 검색 이벤트 발생 즉시 로그 수집
- 동일 사용자 중복 제거 : 같은 사용자가 동일 키워드를 여러 번 검색해도 1회로 집계
- 비정상 패턴 필터링 : 봇, 자동화 프로그램에 의한 검색 제외
- 검색 환경 다양성 검증 : 다양한 기기/네트워크에서 검색되는지 확인
B. 문서 데이터
뉴스 문서를 실시간 수집하여 “지금 세상에서 일어나는 일”을
파악합니다. 현재는 시사성이 높은 뉴스 문서를 대상으로 하고, 향후
카페, 커뮤니티, 소셜 등 다음 서비스 내 다양한 문서 소스로 확대할
예정입니다.
데이터 처리는, 문서 수집 → 제목 전처리 → 토큰화 → 채널 통합 → 스코어링 과정을 거칩니다.
- 다양한 언론사 뉴스 수집 : 주요 언론사부터 전문지까지 폭넓게 수집
- 제목 전처리 : 불필요한 기호([속보], [단독] 등) 제거, 핵심 내용 추출
- 토큰화 : 형태소 분석을 통해 의미 있는 단어 단위로 분리
- 제휴 뉴스 채널 통합 : 동일 기사의 중복 집계 방지
- 채널 다양성 검증 : 여러 언론사가 함께 보도하는 이슈 우선 선정
이처럼 검색 로그와 문서 데이터를 같이 활용함으로써 한쪽에 편중되지 않고 균형 있는 정보를 제공할 수 있습니다. 과거 실검과 같이 검색 기반만 사용 시 사용자가 검색하지 않는 중요한 시사 이슈(정책 변화, 국제 정세 등)가 누락되거나 일부 이슈에 편중될 여지가 있고, 반대로 문서 기반만 사용 시 언론이 다루지 않는 대중의 실제 관심사(연예, 스포츠, 일상 트렌드 등)를 놓칠 수 있습니다.
3-2. 통합 랭킹 모델링
검색 기반과 문서 기반 키워드를 각각 분석한 후, 하나의 통합 랭킹으로 결합합니다. 데이터 소스별 특성과 장단점이 다르기 때문에 적용하는 기술 또한 상이하며, 이를 하나로 나열하기 위해서는 ‘통합 랭킹 시스템’이 별도로 존재해야 합니다.
A. 검색 기반 키워드 기술
검색 로그를 분석하여 평소 대비 급상승한 키워드를 탐지합니다.
단순히 검색량이 많은 키워드가 아니라, 통계적으로 유의미한 변화를
보이는 키워드를 선별합니다. 즉 “크다”가 아니라 “평소와 다르다”가
중요합니다. 예를 들어, “날씨”와 같이 매일 수십만 명이 검색하는
키워드는 급상승이 아니며, “OOO 산불” 같이 평소 100명 수준이었다가
갑자기 5만 명이 검색하면 이는 급상승으로 탐지한다는 의미입니다.
<급상승 탐지 기술> 상세 설명
급상승 키워드를 탐지하는 방법에는 아래와 같이 여러 가지 통계적
기법이 있습니다.
우리는 각 방법론의 특성과 장단점을 비교하여 서비스 환경에 가장
적합한 기술을 선택하고자 하였습니다.
이 중 우리는 아래와 같은 이유로 Z-Score를 선택했습니다. 선택한 이유로,
- 실시간 처리: Welford's algorithm을 적용하면 온라인으로 점진적 계산이 가능하여 실시간 스트리밍 환경에 적합
- 직관적 해석: “평균 대비 표준편차의 몇 배”라는 명확한 의미를 가져, 임계값 설정과 결과 해석이 용이
- 검증된 안정성: 검색 트렌드 탐지 분야에서 널리 사용되어 충분히 검증된 방법론
- 메모리 효율성: 전체 데이터를 저장할 필요 없이 평균과 분산만 유지하면 됨
해당 알고리즘은 “현재 값이 평균에서 표준편차의 몇 배만큼 떨어져
있는가”를 나타내는 통계 지표입니다.
계산 과정은 아래와 같습니다.
- 기준선 생성 : 과거 N일간 요일, 시간대의 검색량 평균과 표준편차 계산 N일을 사용하는 이유 : 패턴 사이클을 포함하여 요일별 편차를 흡수합니다. 예를 들어, “출근”은 월요일에 많이 검색되고 일요일에 적게 검색되는데, 이런 주기적 패턴을 반영하기 위함입니다.
- 현재값 비교 : 현재 검색량이 기준선에서 얼마나 벗어났는지 Z-Score로 측정
- 임계값 적용 : Z-Score가 특정 임계값을 넘으면 “급상승”으로 판정
- 관련
- 위키
그럼 처음 등장한 키워드는 어떻게 처리할까요? 이런 의문이 자연스럽게 들 수 있습니다. 신규 키워드는 과거 데이터가 없어 평균과 표준편차를 계산할 수 없습니다. 즉, 초기 데이터 부족으로 인해 예측·추정이 어려운 ‘콜드 스타트(Cold Start)’ 상황이 발생합니다. 이를 해결하기 위한 여러 방법론이 있습니다.
급상승 키워드 탐지 기술과 마찬가지로, 각 방법론의 특성과 장단점을 비교하여 서비스 환경에 가장 적합한 기술을 선택합니다. 이 중 우리는 베이지안 시안 분포를 활용하고 그 이유는 다음과 같습니다.
- Cold Start 해결 : 신규 키워드도 즉시 평가 가능하여 신규 이슈를 놓치지 않음
- 자동 수렴 : 데이터 축적에 따라 사전분포에서 실제 분포로 자연스럽게 전환
- 조작 방지 : 봇 공격에 의한 신규 키워드 순위 조작을 원천 차단
- 통계적 합리성 : 불확실성을 명시적으로 모델링하여 합리적인 추정 가능
또한 검색어 순위가 한쪽으로 치우치지 않도록 여러 단계의 방어 시스템을 운영합니다. 단순히 검색량이 많은 것만으로 순위가 올라가는 것이 아니라, 다양한 사용자가 서로 다른 환경에서 평소와 다른 방식으로 검색하는 흐름이 확인될 때에만 트렌딩에 반영됩니다.
B. 문서 기반 키워드 기술
뉴스 문서를 분석하여 언론에서 주목받는 이슈를 탐지합니다. 검색
기반과 달리 사용자 행동이 아닌 뉴스 보도량의 변화를 기준으로 하고,
단순히 기사 수가 많은 주제가 아니라, 평소 대비 보도량이 급증한
주제를 선별합니다. 또한 관련 뉴스들을 자동으로 그룹화하고,
사용자가 이해하기 쉬운 자연스러운 키워드를 생성합니다.
보도량 분석은 검색 기반과 동일하게 Z-Score 방법론을 사용하여
보도량(뉴스 기사수)을 측정하며, 특정 토큰(단어)이 포함된 기사 수의
변화를 추적합니다.
계산 방식은 아래 내용을 토대로 합니다.
- 기준선 : 과거 N시간 동안의 토큰별 평균 출현 빈도와 표준편차
- 현재값 : 최근 T시간 동안의 토큰 출현 빈도
- 임계값 : 상위 M% 이상 급상승한 토큰만 이슈로 인정
또한 단순 기사수가 아닌 “얼마나 다양한 언론사에서 보도하는지” 살펴볼 필요가 있습니다. 한 언론사가 같은 주제로 10개의 기사를 쓰는 것보다, 10개 언론사가 각각 1개씩 쓰는 것이 더 중요하다 볼 수 있는데, 이를 위해 ‘채널 다양성 보정’을 진행합니다.
이제 이렇게 탐지된 키워드(토큰) 중 서로 관련이 높은 것들을 하나의 이슈로 묶는 ‘키워드 동시 출현 분석’ 작업을 진행합니다. 예를 들어, “국민”, “연금”, “인상”이 같은 뉴스에서 자주 함께 등장한다면, 이 단어들은 하나의 이슈(“국민연금 인상”)를 가리킬 가능성이 매우 높기 때문입니다.
관련하여 다양한 알고리즘이 있지만 우리는 짧은 시간 안에서도 안정적으로 빠른 계산에 장점이 있는 Co-occurrence Graph(동시출현 그래프 : 단어들 간의 관계를 선으로 이어서 만든 관계도)를 채택하였습니다. LDA(토픽 모델링)나 K-means도 장점이 있지만 결과의 이유가 직관적이고, 키워드 간 관계 구조를 그대로 보여줄 수 있는 측면을 고려하게 되었습니다.
마지막으로 그룹화된 토큰들을 사람들이 이해하기 용이하도록 변환하는 ‘AI를 활용한 키워드 정제’ 작업, 즉 단어가 같을지라도 어떤 순서로 배열하냐에 따라 훨씬 쉽고 자연스럽게 받아들일 수 있는데 이 작업은 자체 개발 모델(LLM)에 전달하여 조정하는 과정을 거칩니다.
“국민연금 인상” 키워드가 도출되는 과정을 단계별로 도식화하면 다음과 같습니다.
C. 통합 랭킹 시스템
검색 기반 키워드(통합검색, 뉴스검색, 카페검색)와 문서 기반
키워드(뉴스)를 하나의 통합 랭킹으로 결합합니다. 각 소스는 데이터
규모와 특성이 다르기 때문에, 공정한 비교를 위한 정규화 과정이
필요합니다.
1) 정규화 기술
서로 다른 스케일의 스코어를 동일한 기준으로 변환하는 정규화 기술은
여러 가지가 있습니다만, 이번 서비스 특징과 환경을 고려하여 우리는
Min-Max 정규화를 선택하였습니다. Min-Max 정규화의 경우, 아래와
같은 장점이 있습니다.
- 범위 보장 : 모든 스코어가 0~1 사이로 변환되어 가중 합산 시 예측 가능
- 직관적 해석 : 1에 가까울수록 해당 소스에서 최상위 키워드임을 의미
- 공정한 비교 : 각 소스의 1위가 동일한 정규화 스코어(1.0)를 가짐
- 이상치 관리 : 급상승 탐지 단계에서 이미 이상치가 필터링되어 영향 최소화
2) 키워드 맥락 분석 및 가중 합산
키워드 역시 서로 다른 출처에서 동일한 이슈라고 판단되면 연결할
필요가 있습니다. 예를 들어, 통합검색에서 “국민연금”이 뜨고 뉴스
기반에서 “국민연금 인상”이 뜨면 같은 이슈로 판단하는 것과
같습니다. 여러 출처에서 동시 등장 시 통합 키워드로 선정하고, 이 중
더 높은 스코어를 가진 쪽의 표현을 대표 키워드로 채택하게 됩니다.
최종 스코어는 각 출처의 정규화된 스코어를 가중 합산하게 됩니다. 상황에 맞게 가중치를 조절하여 각 출처가 균형 있게 노출되도록 하는 게 중요합니다. 속보성 이슈에는 문서 가중치를 높이고, 상대적으로 대중 관심의 반영이 필요한 카테고리는 검색 가중치를 높이는 식입니다.
3-3. 데이터 검수
실시간 노출 영역이 갖는 영향력을 고려하고 서비스 품질과 사용자 보호를 위한 필수적인 조치로 부적절한 키워드가 노출되지 않도록 이중삼중의 데이터 검수 단계를 거칩니다. 이런 다층 검수 시스템을 구축한 이유는 실시간·대규모 서비스의 특성상 필수이며, 오보, 과장, 조직적 조작 등에서 이용자의 안전을 확보하고 플랫폼 신뢰도를 높이기 위해서입니다. 누구나 정보를 생산하고 공유할 수 있지만, 플랫폼이 이를 대표 이슈로 크게 노출하는 건 별개의 문제이며 그만큼 책임감을 갖고 조치하고자 합니다.
필터링 원칙 및 주요 항목
검수 과정은 노출 품질과 조작 · 혼선을 막는 안전장치를 두는 것으로, 사실 확인이 불가하여 공익성 · 신뢰성 · 조작가능성 · 유해성 원칙에 맞지 않을 시 비노출 되며, 이후 정보의 진전으로 이슈 파악 시 노출 진행.
- 1스테디 평소 유입 빈도가 일정수 이상되는 키워드, 특별한 이슈가 없는 키워드 (ex. 날씨, 주말날씨)
-
2인물
허위사실 유포이거나 개인정보 노출과 관련된 경우, 뉴스 등 검색결과 확인이 안 된 경우
- 유명인 사건사고 : 정확한 사건 결과가 나온 이슈가 아닌 추측성 키워드 (ex. OOO 별세, OOO 이혼)
- 직위 등이 현재와 맞지 않는 경우
-
3영화/TV
기간이 없는 콘텐츠인 경우
-
4상업
공인/장난성/단순 낚시성 순위 올리기, 키워드는 정상이나 검색결과에 스팸/상업성 결과가 대다수인 경우
-
5기업
일반적 기업명이나 주식 등을 찾는 키워드, 인사, 주총 등 기업 내부 소식 관련
-
6중복
동일한 이슈, 동일한 패턴의 키워드 (ex.택시 파업/파업, 수원 제주/제주 수원)
-
7장기 노출
장시간 노출했음에도 이슈변화가 없는 키워드
-
8의미 없음
단어 의미 파악이 되지 않는 경우, 방송/영상/인터넷 등에서 의미 없이 사용된 단어
-
9그 외
- 음란/선정 키워드 (음란성 콘텐츠, 유흥/성매매 업소, 사회이슈)
- 불법 : 불법 행위를 지칭하거나 유도하는 사이트, 커뮤니티, URL을 지칭하는 키워드 (ex. 아이스팝니다. 작대기팝니다)
- 오탈자 (공식 기관명/인명, 외래어 표기법에 맞지 않는 키워드)
3-4. 서비스 노출
최종 선정된 키워드는 홈탭에 실시간으로 노출됩니다. 사용자가 현재 트렌드를 직관적으로 파악할 수 있도록 순위 변동과 신규 진입을 시각적으로 표시합니다. 준실시간으로 데이터를 수집하며, 일정 주기로 순위가 갱신됩니다. 즉, 급상승 이슈에 빠르게 대응할 수 있도록 설계되어 있습니다. 아래 순위 표기 방식을 참고 바랍니다.
4 투명하고 명확한 가드레일
실시간 트렌드는 단순히 더 많은 키워드를 보여주기 위한 서비스가 아닙니다. 사용자들이 납득할 수 있도록 운영 기준을 가능한 범위에서 최대한 직관적이고 명확하게 설명하고, 필요한 부분에는 선제적으로 제한을 두었습니다. 과거의 불투명하다는 인식을 ‘운영’이 아닌 ‘설계’로 해소하고자 했습니다.
1. 선거개입 가능성 원천 차단
과거 실검은 특히 선거 국면에서 갈등을 증폭시키고 사회적 대립을
키운다는 비판을 반복적으로 받아왔습니다. 실시간 트렌드는 선거일
60일 전(지방자치단체장의 선거에 영향을 미치는 행위금지 기간)부터
등록한 후보자와 그에 연관한 인물 키워드를 제외하는 등, 확산의
발화점이 될 수 있는 경로를 사전에 차단하는 원칙을 적용합니다.
2. 특정 세력의 순위 조작 대응
실시간 트렌드는 단일한 데이터 통로에 의존하지 않습니다. 여러
출처에서 동시에 반응이 나타나는지를 확인하고, 특정 출처에 과도하게
쏠리지 않도록 보정합니다. 그럼에도 이상 징후가 감지되면 실시간
업데이트를 일시 중단하고, 안정화된 방식으로 전환합니다. 실시간성도
중요하지만, 무엇보다 서비스 신뢰를 우선하는 정책입니다.
3. 키워드 노출 기준 및 검수 프로세스 강화
투데이 버블 운영 과정에서 확인된 과제 - 팩트체크가 어려운 키워드로
인한 허위 정보 확산 우려, 상업적 남용 시도 등에 대응하기 위해 기존
가드레일을 더 강화했습니다. 키워드 추출과 관리에 AI 솔루션을
적용하고, 모니터링 리소스도 확대해 보다 안정적인 검수 체계를
운영합니다.
요약하면, 실시간 트렌드는 ‘실검의 부활’이 아니라 실검 이후 운영해 온 세 가지 서비스 - ‘카카오 데이터 트렌드’, ‘AI 이슈 브리핑’, ‘투데이 버블’ - 에서 축적한 경험을 결합한 결과입니다. 투데이 버블이 보여준 출처의 다양성 기반의 탐색 방식, AI 이슈 브리핑을 통해 쌓인 이슈 검수 경험, 카카오 데이터 트렌드에서 확인한 복수 키워드 비교·분석의 필요를 바탕으로, 더 빠르게 포착하면서도 흔들리지 않고 트렌드 서비스를 만들고자 합니다. 또한 더 넓은 주제를 다루되 악용 가능성은 선제적으로 차단하고, 사용자가 쉽고 직관적으로 이해할 수 있는 형태로 제공하는 것을 목표로 합니다.
5 다시 ‘지금을 스냅샷’, 그리고 지금을 다루는 책임
실시간 이슈 검색어 서비스가 종료된 지 만 6년이 흘렀습니다. 그럼에도 지금까지 이 서비스가 계속 회자되는 이유는 무엇일까요? 종료 당시에도 일부 전문가는 실검의 유용성을 언급하며, “재난이라든가 이런 것을 파악하는 데 있어서 (...) 이런 장점들을 아예 무시해버려선 안 될 것”이라는 취지의 의견을 제시하기도 했습니다.
사람들은 일상 속에서 갑작스러운 변화를 마주합니다. 출근길 2호선 열차가 멈추었을 때, 특정 지역에 국지성 호우가 발생했을 때, 빠르게 상황을 확인하고 위험을 피할 수 있어야 합니다. 국가적 재난·위기 상황에서는 사회 구성원 간 소통이 필요하고, 갈등을 줄이며 공동의 대응을 가능하게 하는 정보 창구도 중요합니다. 코로나19와 같은 공중보건 이슈가 확산될 때는 혼란 속에서도 정확한 정보가 빠르게 공유될 수 있어야 인적·물적 피해를 줄일 수 있습니다. 또한 사회적 의제나 각 분야의 관심사가 생겨날 때, 이를 놓치지 않고 쉽게 확인할 수 있는 수단 역시 필요합니다.
무엇보다 ‘불확실성이 일상이 된’ 시대에는 상황에 따라 빠르게 적응할 수 있도록, 지금 필요한 정보를 누구나 쉽게 확인할 수 있어야 합니다.
이번 실시간 트렌드 서비스가 실검 종료 당시 약속했던 “본연의 취지와 순기능을 살릴 새로운 서비스”가 될 수 있을지는 장담할 수 없습니다. 다만 그 약속을 지키기 위해 오랜 시간 동안 여러 서비스들을 만들고 운영하며 시행착오를 축적해 왔습니다. 실시간 트렌드는 그 경험 위에서 출발하며, ‘아는 길도 물어가듯, 얕은 물도 깊게 건너듯’ 단단하게 가고자 베타(Beta) 서비스로 오픈합니다. 데이터 수집 규모가 작고 이용률이 낮은 시간대(01시~06시)는 제한적으로 운영하여 실시간 서비스의 리스크와 퀄리티를 충분히 점검하고자 합니다.
“지금 무슨 일이 벌어졌는지”를 빠르게 파악할 수 있는 창이 되되, 과거의 논란을 반복하지 않는 방식으로 다시 열겠습니다. 앞으로도 많은 관심 부탁드리며 이용자의 목소리를 경청하며 지속적으로 개선해 나가겠습니다. 감사합니다.
- 관련
- MBC 라디오
6 질문과 답변
Q1. 실시간 트렌드는 과거 ‘실시간 이슈 검색어(실검)’의 부활인가요?아니요, 실시간 트렌드는 실검의 문제점을 해결하기 위해 설계 단계부터 다르게 구축된 서비스입니다. 단순히 검색량에 의존하던 과거 방식에서 벗어나 기사를 비롯한 다양한 문서와 여러 경로의 검색 로그를 결합하였으며, 조작·선거개입 같은 리스크를 줄이기 위한 가드레일(선제 제한, 이상 징후 대응, 다층 검수)을 설계에 포함했습니다.
Q2. 반복 검색하면 제가 원하는 키워드를 올릴 수 있나요? 순위 조작(어뷰징)은 어떻게 막나요?반복 검색이나 자동화 시도만으로 트렌드가 올라가기 어렵도록 다층 방어 시스템을 운영합니다. 예를 들어, 동일한 사용자가 같은 키워드를 여러 번 검색해도 1회로 집계하고, 봇·자동화 프로그램 같은 비정상 패턴은 제외합니다. 또한 다양한 환경(기기/네트워크 등)에서 자연스럽게 확산되는 흐름인지 검증합니다.
Q3. 뉴스 기사(문서) 데이터는 구체적으로 어떻게 활용되나요?언론사가 주목하는 주요 이슈를 파악하기 위해 활용됩니다. 특정 언론사가 반복 보도하는 것보다 여러 언론사가 공통으로 다루는 이슈에 높은 점수를 부여하는 ‘채널 다양성 보정’을 거치며, 이를 통해 검색 로그만으로는 놓칠 수 있는 중요한 시사 이슈를 보완합니다.
Q4. 검색 기반 키워드와 문서 기반 키워드의 비중은 동일한가요?이슈의 성격에 따라 다릅니다. 속보성이 중요한 이슈에는 문서(뉴스) 가중치를 높이고, 일상적인 트렌드나 대중적 관심사가 중요한 카테고리에는 검색 가중치를 높이는 가중 합산 방식을 통해 균형 있는 정보를 제공합니다.
Q5. ‘급상승’은 어떻게 판단하나요? 검색량이 많으면 무조건 뜨나요?단순히 ‘많이 검색된 것’이 아니라 ‘평소와 비교해 통계적으로 유의미하게 달라진 것(변화)’을 중요하게 봅니다. 예를 들어 평소에도 늘 많은 키워드(예: ‘날씨’)는 ‘급상승’으로 보지 않고, 평소 대비 갑자기 크게 증가한 키워드를 탐지합니다.
Q6. 검색은 많이 되는데 뉴스에 안 나온 키워드도 순위에 올라올 수 있나요?네. 순위에 올라올 수 있습니다. ‘실시간 트렌드’는 뉴스 기반 데이터 뿐만 아니라 검색 로그도 함께 반영합니다. 따라서 뉴스에는 잘 나오지 않는 연예, 스포츠, 일상 트렌드 등 사용자들이 궁금해하여 직접 검색한 내용도 순위에 반영될 수 있습니다.
Q7. 처음 등장한 키워드(신규 이슈)는 과거 데이터가 없는데, 어떻게 판단하나요?신규 키워드는 과거 평균/표준편차가 없어 ‘콜드 스타트’ 문제가 생길 수 있습니다. 실시간 트렌드는 이를 해결하기 위해 신규 키워드도 즉시 평가할 수 있는 방식을 적용하고, 동시에 봇 공격 등으로 신규 키워드를 ‘만들어’ 순위를 조작하려는 시도를 방어하도록 설계했습니다.
Q8. 실시간 트렌드의 업데이트 주기는 어떻게 되나요?기본적으로 10분 단위로 업데이트 됩니다. 데이터 갱신 배치 속도에 따라 몇분 정도 차이가 발생할 수는 있습니다. 다만, 데이터 수집 규모와 이용률이 낮은 01시 ~ 06시에는 제한적으로 서비스 됩니다.
Q9. 왜 특정 시간(01시~06시)에는 제한적으로 운영되나요? 이상 징후가 감지되면 어떻게 하나요?실시간 트렌드는 실시간성도 중요하지만 서비스 신뢰를 우선합니다. 이상 징후가 감지되면 실시간 업데이트를 일시 중단하고 안정화된 방식으로 전환하는 정책을 둡니다. 또한 베타 서비스 단계에서는 데이터 수집 규모와 이용률이 낮은 01시~06시 시간대를 제한 운영하여 리스크와 품질을 충분히 점검하는 방식으로 운영합니다.
Q10. 부적절한 키워드가 노출될 위험을 어떻게 관리하나요?AI 솔루션을 활용한 자동 필터링과 모니터링 리소스를 투입해 음란, 도박, 사행성 키워드나 특정인의 명예를 훼손할 우려가 있는 키워드는 이중삼중의 검수단계를 거쳐 노출되지 않도록 합니다.
Q11. 선거 기간에도 관련 키워드가 노출되나요?선거 국면에서 갈등을 증폭시키거나 선거 개입논란이 생길 수 있는 경로를 사전에 차단하기 위해, 공직선거법(제86조)과 중앙선거관리위원회 사무일정에 게시된 '지방자치단체장의 선거에 영향을 미치는 행위금지 기간(선거일 전 60일부터 선거일까지)동안 후보자 및 연관 인물 키워드를 제외하는 원칙을 적용합니다.
Q12. 어떤 키워드는 왜 노출되지 않나요?실시간 노출 영역의 영향력을 고려해, 사실 확인이 어렵거나 혼선을 키울 수 있는 키워드는 원칙적으로 제한합니다. 더 자세한 내용은 본문 <필터링 원칙 및 주요 항목>을 참고 바랍니다.
Q13. 과거 특정 시점의 실시간 트렌드 키워드도 확인할 수 있나요?실시간 트렌드 서비스는 현 시점의 실시간 트렌드만 확인할 수 있고, 과거 특정 시점의 실시간 트렌드 키워드는 제공하고 있지 않습니다.
Q14. 화면에 보이는 ▲▼—, ‘NEW’ 표시는 무엇을 의미하나요?이용자가 트렌드 변화를 직관적으로 이해할 수 있도록, 키워드 옆에 모델링 결과의 변화(상승/하락/변동 없음)와 신규 진입(NEW)을 표시합니다. 이때 ‘NEW’는 직전 시간대에 상위권에서 보이지 않던 키워드가 새로 진입한 경우를 의미합니다.
Q.15. 1위를 했는데 왜 파란색 하락(▼) 화살표가 뜨나요? 오류 아닌가요?순위는 트렌드 점수의 변화를 반영합니다. 1위로 노출되더라도 트렌드 점수가 하락하고 있는 중이라면 하락 화살표가 표기 됩니다.
Q16. 실시간 트렌드 키워드 클릭 후 검색결과를 삭제할 수 있나요?다음 고객센터 -> 검색결과 제외로 삭제 요청을 해주시면 검토하고 조치하겠습니다.