웹트렌드 활용예제

1. 개요

 오아시스 웹트렌드는 시간의 흐름에 따라 웹사이트에서 나타난 특정 단어들의 관심도(웹페이지에 나타난 특정 단어의 출현율) 변화 추이와 단어들간의 상관 관계를
알 수 있도록, 국립중앙도서관에서 수집한 2012년 이후의 웹 아카이브 자료에 대한 검색과 시각화 분석도구를 제공해 주는 서비스입니다.
본 페이지에서는 웹트렌드 서비스 활용 예시를 통해, 활용 흐름을 설명하겠습니다.

2. 키워드 검색

 먼저, 추이를 확인하고 싶은 키워드(단어)를 선정하여 검색창에 입력합니다. 최대 5개까지 입력하실 수 있으며, 본 예제에서는 "경제" 라는 단어를 선택하였습니다.
같이 검색하고 싶은 단어들을 쉼표(,) 구분하여 추가해 봅니다. 예제에서는 "취업", "창업" 이라는 단어를 추가한 후 검색버튼을 클릭합니다.

다음과 같이 웹아카이브 내 해당 연도 수집 자료 중 "경제","취업","창업" 이라는 단어들이 출현한 비율 을(출현횟수 / 자료수) 연도별로 표현한 그래프가 페이지에
표시됩니다.

3. 그래프 분석 및 활용

 전체 그래프는 맨 위의 "메인그래프", 하단의 "키워드비중", "수집년도 구분", "도메인 구분" 으로 나뉩니다. 각각 그래프는 마우스의 움직임에 대해 반응하도록 구현되어 있습니다.

메인그래프에서 확인할 수 있듯 "경제" 키워드는 다른 키워드에 비해 많은 출현률을 보이고, 시간이 지날수록 출현률이 낮아지는 경향을 보이고 있으며, 또한 "취업" 과
"창업" 키워드는 시대별로 서로 상반되는 출현률을 보이고 있습니다. 이렇게 키워드들이 지닌 각각의 의미와 특징을 토대로 이용자의 지식과 결합하여 다양한 사건들을
추론해 볼 수 있습니다.

"경제" 키워드의 기울기는 "취업" 키워드의 기울기와 비교적 유사한 성향을 보이고 있습니다. 여기에서 "경제" 키워드의 기울기가 낮아짐은 실제 경제 지수가 나빠지거나
좋아짐을 의미하는 것이 아니며
, 웹사이트에서 "경제" 라는 단어의 사용 빈도가 점차 낮아짐을 의미합니다.
(수많은 단어들이 섞여있는 웹아카이브 자료 중 "경제" 단어가 작년에 비해 사용되는 빈도가 줄어듦 → 사람들이 "경제" 단어에 대한 관심이 줄어듦을 유추)
2014년을 기점으로 사람들이 "경제","취업" 단어에 대한 관심이 점차 줄고 "창업" 이라는 단어에 관심이 소폭 증가함을 확인할 수 있습니다.

그래프는 "도표내려받기" 버튼을 클릭하여 이미지 형태로 내려 받으실 수 있습니다, 또한 "엑셀내려받기" 버튼을 클릭하여 수치데이터만 내려 받는 것도 가능합니다.

4. 외부자료 혼합

 검색된 자료를 그래프로 분석한 자료들에 개인의 지식, 또는 각종 리서치 자료, 공공데이터 등 다른 데이터들을 연계하면 더 풍부한 의미를 부여할 수 있습니다.
가령 위의 경우 단순하게 지난 몇 년간의 흐름을 파악할 수는 있었지만 그것의 원인이 무엇인가를 유추할 수는 없습니다. 이 경우 "경제지표", "직장인 급여통계",
"근로시간 통계" 등 원인이 될 수 있는 데이터들을 연계해 보고, 상관관계를 파악해 볼 수 있습니다. 예제에서는 "임금근로자 근로시간"을 연계해 보겠습니다.
(자료는 국가주요지표 사이트[http://www.index.go.kr]에서 발췌했습니다.)

방법은 메인그래프 상단의 "내자료올리기" 기능을 사용합니다. 연도별 입력창에 수치 데이터를 입력하고 "내자료올리기" 버튼을 클릭합니다.
(이 때 누락된 연도의 수치는 전년도 수치를 사용하며, 데이터가 있는 부분만 보고 싶으시면 메인 그래프에서 마우스를 드래깅 해 주시면 됩니다.)

근로시간 자료를 그래프에서 합성하면 "근로시간""의 그래프 기울기 성향이, "창업" 의 그래프 기울기 성향과 매우 유사하게 보이고 있습니다. 따라서, 근로자의
근로시간이 "취업", "창업" 과 어느 정도 영향 관계에 있는 것은 아닐지 추론해볼 수 있습니다.
이 외에도 다양한 공공데이터들을 연계하여 수많은 상황과 의견을 추론해 볼 수 있습니다.

5. 상세검색결과

 그래프 하단에는 입력된 키워드에 대한 웹페이지 검색 결과가 표시됩니다. 예제에서는 약 190만 여건의 검색결과가 표시됩니다. 여기서 "키워드비중", "수집년도구분",
"도메인구분" 그래프를 클릭하시면 각각 키워드, 수집년도, 도메인을 기준으로 검색결과를 줄여나갈 수 있습니다. 예제에서는 "취업" 키워드를 클릭하여 63만 건으로 ,
"2015년도"를 클릭하여 8만 건으로, ".go.kr" 도메인을 클릭하여 1만 건으로, 마지막으로 결과내 재검색에서 "고용" 키워드를 검색하여 최종 3천 건으로 줄어든 결과를
확인할 수 있습니다.

6. 기타

 앞으로 대한민국 웹사이트의 망라적 수집이 확대되고 누적되면, 웹트렌드 검색결과와 다양한 데이터들을 융합함으로써 과거에서 현재에 이르는 키워드 관심도 추이
변화를 통해 사회현상에 대한 근거자료나 미래 동향 분석을 하는데 더욱 도움이 될 수 있을 것으로 기대합니다.