- 데이터에 대한 이해를 돕기 위해 그림, 도형 등 그래픽 요소들을 이용해 데이터를 묘사하고 표현하는 과정으로 선, 막대, 원 등의 기하나 도형과 같은 양식을 이용해 데이터의 특징을 설명할 수 있는 모양으로 만들어 내거나, 색상, 레이블 등 특성을 활용하여 데이터를 표현한다.
- 시각화의 유형
- 시간 시각화 : 시간 흐름에 따른 변화를 통해 경향(트렌드)을 파악하는 방법
- 분포 시각화 : 분류에 따른 변화를 최대, 최소, 전체 분포 등으로 구분하는 방법
- 관계 시각화 : 집단 간의 상관관계를 확인하여 다른 수치의 변화 예측하는 방법
- 비교 시각화 : 각각의 데이터 간의 차이점과 유사성 관계도 확인하는 방법
- 공간 시각화 : 지도를 통해 시점에 따른 경향, 차이 등을 확인하는 방법
- 시각화 도구
- 태블로 : 차트, 그래프, 지도를 포함한 다양한 그래픽 기능을 제공하는 시각화 도구
- 인포그램 : 실시간으로 인포그래픽을 연동해주는 시각화 도구
- 차트 블록 : 코딩 없이 스프레드시트, 데이터베이스 형태 데이터를 쉽게 가시화하는 시각화 도구
- 데이터 래퍼 : 쉽게 데이터를 업로드하고 차트나 맵으로 변환하는 시각화 도구
- 시각화 절차
- 구조화 : 데이터 시각화 목표를 설정하고 분석 결과를 토대로 데이터의 표현 규칙과 패턴을 탐색하고, 시각화를 위한 요건을 정의한 후 사용자에 따른 시나리오를 작성하고 스토리를 구성하는 단계
- 시각화 : 단순하고 명료한 메시지 전달을 위해 시각화 과정을 반복적으로 수행하여 시각화 하고, 구조화 단계에서 정의된 시각화 요건, 스토리를 기반으로 적절한 시각화 도구와 기술을 선택하여 데이터 분석 정보의 시각화를 구현하는 단계
- 시각표현 : 시각화 단계에서 만들어진 결과물을 보정하고, 정보표현을 위한 그래픽 요소를 반영하여 그래픽 품질을 향상시키며, 최종 시각화 결과물이 구조화 단계에서 정한 목적과 의도에 맞게 구현되었는지를 확인하는 단계
- 시공간 시각화
- 시간 시각화
- 막대그래프 : 동일한 너비의 여러 막대를 사용하여 데이터를 표시하며, 각 막대는 특정 범주를 나타내는 그래프
- 누적 막대그래프 : 막대를 사용하여 전체 비율을 보여주면서 여러 가지 범주를 동시에 차트로 표현가능하다.
- 선 그래프 : 수량을 점으로 표시하고, 점들을 선분으로 이어 그린 그래프
- 영역 차트 : 선 그래프와 같이 시간에 값에 따라 크기 변화를 보여주고, 색을 채운 영역으로 보여준다는 것과 y축의 값은 0부터 시작해야 하는 것이 특징이다.
- 계단식 그래프 : 두 지점 사이를 연결하기보다는 변화가 생길 때까지 x축과 평행하게 일정한 선을 유지하고, 다음 값으로 변하는 지점에서 급격하게 뛰어오르는 계단형으로 그리는 그래프
- 추세선 : 데이터값의 즉각적인 변화보다는 변화하는 경향성을 보여주는 직선 또는 곡선
- 공간 시각화
- 등치지역도 : 지리적 단위로 데이터의 의미를 색상으로 구분하여 표시되고, 색상은 수치화된 값을 기반으로 채도, 밝기를 변화
- 등치선도 : 같은 값을 가지는 점을 선으로 이은 지도로 등치지역도의 데이터 왜곡을 줄 수 있는 결점을 극복한다.
- 도트맵 : 지도상의 위도와 경도에 해당하는 좌표점에 산점도와 같이 점을 찍어 표현한다.
- 버블맵 : 수치화된 데이터값의 크기를 나타내는 서로 다른 크기의 원형으로 표시
- 카토그램 : 지역의 값을 표현하기 위해 지리적 형상 크기를 조절하고, 재구성된 지도로 왜곡되고 삐둘어진 화면으로 표기한다.
- 시간 시각화
- 분포 시각화
- 분포 시각화
- 파이 차트 : 원형 모양을 데이터가 차지하는 비율에 따라 여러 조각으로 나누어서 나타내는 시각화 방법으로, 부분과 부분의 관계를 알아볼때 사용되는 그래프이고, 비율은 100%이다.
- 도넛 차트 : 파이 차트와 비슷하지만, 중심 부분이 비어 있는 도넛 모양의 시각화 방법으로, 막대그래프의 누적형태로서 면적이 아닌 길이로 수치의 정도를 표현한다.
- 트리맵 : 여러 계층 구조 데이터를 표현하는 시각화 방법으로, 서로 다른 크기를 이용해서 비율을 나타내며, 사각형을 겹쳐 놓음으로써 대분류와 하위분류를 나타낸다.
- 누적 영역 그래프 : 여러 개의 영역차트를 겹겹이 쌓아놓은 모양의 시각화 방법으로, 가로축은 시간을 나타내고 세로축은 데이터를 나타낸다.
- 관계 시각화
- 산점도 : x축과 y축 각각에 두 변숫값의 순서쌍을 한 점으로 표현하여 변수의 관계를 나타낸 그래프
- 산점도 행렬 : 다변량 변수를 갖는 데이터에서 가능한 모든 변수 쌍에 대한 산점도를 행렬 현태로 표현한 그래프
- 버블 차트 : 산점도에서 데이터값을 나타내는 점 또는 마크에 여러 가지 의미를 부여하여 확장된 차트
- 히스토그램 : 자료 분포의 형태를 직사각형 형태로 시각화하여 보여주는 그래프
- 네트워크 그래프 : 개체 간 논리적인 관계를 표현하는 시각화 도구
- 분포 시각화
- 비교 시각화
- 비교시각화
- 플로팅 바 차트 : 막대가 가장 낮은 수치부터 가장 높은 수치까지 걸쳐있게 표현한 차트
- 히트맵 : 여러 가지 변수를 비교할 수 있는 시각화 그래프
- 체르노프 페이스 : 데이터를 눈, 코, 귀, 입 등과 일대일 대응하여 얼굴 하나로 표현하는 방법
- 스타 차트 : 각 변수를 표시 지점을 연결선을 통해 그려 별 모양의 도형으로 나타낸 차트
- 평행 좌표 : 다년량 데이터 2차원 평면에 표현하는 효과적인 가시화 방법
- 비교시각화
- 인포그래픽
- 지도형 : 특정 국가나 지역의 지도 안에 정보를 담는 방식
- 도표형 : 다양한 표와 그래프를 사용해 정보를 담는 방식
- 스토리텔링형 : 하나의 사건이나 주제에 대해 이야기를 들려주는 구성방식
- 타임라인형 : 주제를 선정하여 관련된 히스토리를 타임라인 형태로 나타내는 방식
- 비교분석형 : 두 가지 이상의 제품, 개념을 비교하는 방식
- 만화형 : 캐릭터 등의 만화적 요소를 활용한 방식
반응형
'빅데이터 이론' 카테고리의 다른 글
[ADsP] 데이터와 데이터 베이스 (0) | 2022.09.03 |
---|---|
[빅분기] 분석 결과 활용 (0) | 2022.09.01 |
[빅분기] 분석 모형 개선 방안 (0) | 2022.08.31 |
[빅분기] 평가 지표 및 검증 (0) | 2022.08.31 |
[빅분기] 고급 분석 기법 (0) | 2022.08.31 |
댓글