본문 바로가기
잡동사니

빅데이터란?(개념 및 특성)

by 신박에듀 2021. 3. 15.
반응형

안녕하세요 에듀몬입니다. 4차 산업 혁명시대에서 데이터의 중요성은 아무리 강조해도 지나치지 않습니다. 사회, 정치, 문화, 교육 등 산업 전반에서 데이터의 축적과 활용은 계속해서 진행되고 있고, 그 활용 범위가 빅데이터화 되면서 점점 넓어지고 있습니다. 이번 시간에는 빅데이터의 개념과 특성에 대해 알아보도록 하겠습니다.

 

 

1. 빅데이터의 개념

 

  빅데이터는 4V의 개념으로 이해할 수 있습니다. 연산가능 여부에 따라 나누 어지는 데이터 형식이 다양성(Variety)과 데이터를 빠르게 분석하고 처리하는 능력인 속도(Velocity), 대규모의 데이터의 크기(Volume), 분석의 가치와 활용 효과(Value)의 특성을 갖는 것을 의미합니다.

 

 

 

  빅데이터의 ‘빅’ 은 상대적인 개념이며 , 여기서 ‘상대적’ 이라 함은 기존의 표본추출 방식과 비교할 때 전체 데이터 혹은 그에 견줄 수 있는 데이터 집합을 사용한다는 특징이 ‘빅’의 의미로 사용된다는 것을 의미합니다. 빅데이터는 기술의 발달로 인해 정보와 데이터의 생산 환경이 기존 아날로그 환경에서 디지털의 시대로 전환되며 단순 수치 데이터뿐 아니라, 문자와 이미지, 분석이 어려운 비정형 데이터의 생산과 축적을 이야기하는 것이 일반적입니다.

  한국IDC(Internet Data Center)의 자료에 의하면 국내 빅데이터의 규모는 연평균 10.9% 성장하여 2020년 2조 2천억 원의 규모에 육박하고, 향후 발전 가능성도 긍정적으로 전망 중입니다. 국내에서는 공공과 민간에서 빅데이터 서비스를 제공하고 있으며, 2013년 ‘공공데이터 제공 및 이용 활성화에 관한 법룰’을 제정한 이후 행정안전부의 공공데이터 포털(www.data.go.kr)이 운영 중에 있습니다. 공공데이터 포털에서는 파일 데이터, 오픈 API, 표준 데이터, 시각화 등의 다양한 유형으로 데이터를 제공하고 있으며, 포털에서 제공하지 않고 있는 공공데이터의 경우 공공데이터 제공 신청을 통해 제공 여부를 심의받은 후 이용할 수 있습니다.

  한국언론진흥재단의 빅 카인즈(bigkinds.or.kr)는 신문, 방송 등 54개의 언론사의 뉴스를 통해 뉴스 검색, 뉴스 속 발언 내용, 연관어 등을 분석하여 데이터와 자료의 분석과 시각화 정보를 제공하고 있으며, 네이버와 구글은 각각 자사의 검색엔진을 통해 분야별 인기 검색어, 검색어 트렌드 지역별 관심도 등을 활용할 수 있도록 자료를 제공 중입니다. 빅데이터 사업 분야에서는 위와 같은 데이터의 수집과 제공뿐 아니라 분석의 서비스도 함께 확장 중입니다. 국내 빅데이터 분석 설루션을 제공하는 TEXTOM(텍스 톰)은 빅데이터의 수집과 정제 과정부터 분석 데이터와 시각화 자료제공까지 자사의 웹페이지에서 처리가 가능하게 함으로 기존의 빅데이터의 자료수집과 분석의 시간을 대폭 단축시켜 이용자들의 긍정적인 평가를 받고 있습니다.

 

 

※ 참고문헌: 청소년 신체활동 및 시민성 발달을 위한 빅데이터 분석(김기홍, 2020)

반응형