시각화 방법
시각화 방법 개념
정보 구조화
- 정보 조직화
- 데이터를 수집, 정제하는 과정이 적절히 배분되지 않는다면 제대로 된 결과물을 도출하기 어려움
- 데이터 수집, 분류, 배열, 관계맺기의 과정을 거침
- 조직화해 배치할 때 정보의 가치와 유용성은 증가하고 전하는 이야기도 달라진다.
- 데이터 munging : 원 데이터의 구문을 분석, 정리하고 집단으로 묶거나 변환해 패턴을 식별
- 데이터 수집 및 탐색
- 원 데이터를 바탕으로 필요한 데이터를 추출하고 활용하는 절차를 거쳐야 함
- 데이터 editing : 유의미, 무의미한 데이터 선별
-
분류
- 구분 텍스트
- 줄 바꿈으로 행을 구분자로 열을 구분하는 텍스트 데이터임
- csv는 쉼표, tsv면 탭으로
- 구분자는 공백, 쉼표 등 어떤 것이든 가능
- json
- 자바스크립트로 표현된 데이터를 쉽게 전달할 수 있는 스트링으로 변형 가능함
- 자바스크립트에 의해 쉽게 인터프린팅됨, 복잡한 구조로 표현됨
- 배열과 복합 개체들을 나타낼 수 있다.
- xml
- 확장마크업 언어, 수많은 종류의 데이터 기술
- xml은 구조적 데이터를 설명함
- html의 한계를 극복할 목적
- 스프레이트시트, 구성파일 등 네트워크 프로토콜에 일반적으로 포함되는 정보가 구조 데이터의 예시임
-
배열
-
래치방법 : 위치,알파벳, 시간, 카테고리, 위계 이상 5가지가 정보를 정리, 조직화
- 위치 : 정보를 공간적 위치에 배열
- 다양한 출처나 장소에 기반을 둔 정보를 조사하고 비교할 때 좋음
- 지도 뿐만 아니라 안내도, 학문 영역의 범위를 포함하는 것도 해당
- 알파벳 : 사전, 전화번호부 등을 정렬
- 1차로 분류하고 하위 분류에서 가나다 순으로 조직화
- 데이터 속성이 다양하면 알파벳 순이 보편적
- 시간 : 연도별 시간 순서
- 일정 기간을 조직화하는 최적의 원리
- 정보의 변화를 발견하고 비교할 때 좋음
- 카테고리 : 정보의 속성에 따라 분류
- 중요도나 주제가 서로 유사한 정보에 적합, 수치보다 색상 등으로 표현을 달리함
- 상품 분류, 서적 분류 등
- 가중치(위계) : 정보의 변화에 따라 데이터 값이나 중요도 순서로 조직화
- 단위나 수치 표현 가능
- 관계 맺기(재배열)
- 데이터에 의미를 부여하는 기본적인 과정, 시각화와 밀접함
- 분류된 데이터를 정보 수용자가 인식하기 쉽게 패턴을 만듬
정보 시각화
시간 시각화 | 분포 시각화 | 관계 시각화 | 비교 시각화 | 공간 시각화 |
---|---|---|---|---|
막대그래프, 점그래프 | 파이차트, 트리맵, 누적 연속그래프 | 스캐터 플롯, 버블차트, 히스토그램 | 히트맵, mds, 스타차트,체르노프페이스,평행 좌표계 | 지도 매핑 |
- 시간 시각화
-
변화를 표현, 트랜드(경향성)으로 장기간에 걸쳐 트랜드 추적
-
분절형 : 데이터의 특정 시점, 시간 구간
-
연속형 : 기온 변환 같은 데이터
- 막대그래프
- 막대를 배치함으로써 상대적인 차이를 알 수 있음
- 색상 표시 : 값들의 차이가 미미하거나 막대의 수가 많은 때, 막대가 서로 다른 범위나 상태일 경우
- 색상 표시x : 모든 막대가 동일한 범위
- 누적 막대그래프
- 전체의 합이 의미가 있는 경우 사용
- 단어들의 바차트 : 단일 소프트웨어 봇이 모은 많은 단어와 이미지를 갖고 있는 편집 역사를 시각화한 것
- 점그래프
- 면적을 표시할 필요가 없어 더 적은 공간에 그려짐
- 점의 집중정도와 배치에 따라 흐름을 파악하기 용이함
- 두 변수의 연관관계를 볼 때 많이 씀
- 연속형 그래프
- 점그래프를 선으로 연결, 끊임없이 변화하는 현상의 추이를 볼 수 있음.
- 기울기가 급할 수록 변화가 큼
- 데이터의 포인트 수에 따라 점, 선을 결정해야함
- 분포 시각화
-
최대, 최소, 전체분포로 나뉨
-
최대와 최소는 순서 정렬에서 양 끝
-
분포정도라 전부 합치면 1또는 100%
- 원그래프
- 부분과 전체, 부분과 부분을 비율을 알아봄
- 조각의 합은 전체
- 인접하지 않은 조각을 비교하기 힘듬
- 텍스트와 퍼센티지를 포함시키는 게 좋음
- 면적으로 값을 보여주고, 수치를 각도로 표시
- 도넛차트
- 조각에 해당하는 수치는 면적이 아닌 길이로 표시
- 트리맵
- 영역 기반 시각화, 시각형이 수치임
- 사각형을 포함한 바깥의 영역은 대분류, 내부 사각형은 세부 분류를 의미
- 위계 구조가 있는 데이터나 트리 구조의 데이터를 표시할 때 활용
- 뉴스맵 : 구글 뉴스를 시각화, 내부 사각형을 선택하면 뉴스에 대한 내용을 이미지와 텍스트로 노출
- 누적 연속 그래프
- 시계열을 쌓아올린 형태
- 가로축은 시간, 세로축은 데이터 값
- 한 시점의 세로 단면을 가져오면 분포를 볼 수 있음
- 네임 보이저의 그래프를 통해 어느 시기에 얼마나 선택됐는지 알 수 있다.
-
관계 시각화
-
스캐터 플롯
- 시간적 변화를 볼 때 쓰지만 관계를 알아볼 때도 씀
- 포인트들의 관련성 여부를 시각적으로 알 수 있음
- 포인트가 많을 때 유용
-
버블 차트
- 세가지 요소의 상관관계를 표현
- 버블의 크기가 변수
- 면적이나 지름으로 판단
- 갭 마인더 : 유엔의 데이터를 바탕으로 인구 예측, 이동에 관한 정보를 공유
-
히스토그램
- 한쪽으로 치우친 것이 없다면 균일한 분포
- 가로와 세로축은 연속적
-
-
비교 시각화
-
시작점을 찾는 것이 중요, 모든 데이터를 한 번 훑고 흥미로운 것을 찾고 다른 점을 찾아가는 과정이 더 도움이 될 수 있음.
-
히트맵
- 여러가지 변수를 비교
- 한 칸의 색상으로 데이터를 표현
- 데이터가 많으면 적당한 색상과 약간의 정렬과정을 거쳐야 함
- 감정 히트맵 : 주식시장에 대한 전망을 sns의 사회적 주식 지수로 보여줌
-
체르노프 페이스
- 데이터를 사람 얼굴 이미지로 표현
- 보통 사람들에게는 혼란, 전문가의 흥미가 목적
-
스타차트
- 중앙에서 외부 링까지 이어지는 몇 개의 축을 그리고 전체 공간에서 하나의 변수마다 축위의 중앙으로부터의 거리를 수치로 나타냄
- 중심점은 축이 나타내는 값의 최솟값, 먼 끝 점은 최댓값
-
평행 좌표계
- 여러 축을 평행하게 배치
- y축에서 윗부분은 값 범위 최댓값, 아래는 최솟값
- 측정대상은 위아래로 이어지는 연결선으로 그려짐
-
다차원척도법
- 개별 데이터 간의 유사도를 바탕으로 시각화
- 거리행렬을 포함하는 데이터의 시각화에 유용
- 유사성이 작으면 멀리, 크면 가까이
-
- 공간 시각화
- 지도를 만들어 위치 비교
- 여러 장의 지도를 통해 시간의 여러 단면을 표현할 수 있음
- 구글 차트의 지오 차트 : 매핑 포인트를 모르고 지명만 알아도 시각화 작업할 수 있음
그래프 그리기
- 그래프 유형 선택
- 범주와 측도(차원)의 수에 좌우됨, 최소한의 것으로 최대한 것을 전달해야 함
- 그래프 단순화
- 배경을 지우기 : 배경은 데이터를 강조하는 데 방해가 됨
- 범례 지우기 : 보는 사람이 직접 매칭해야 되서 해석에 방해
- 테두리 지우기 : 답답한 느낌, 디자인에 방해
- 색깔 지우기 : 다양한 색은 핵심이 무엇인지 파악하기 어렵게 함
- 특수효과 : 디자인 통일성파괴, 핵심 전달 방해
- 굵은 글씨 : 시선을 분산
- 라벨을 흐릿하게 처리 : 처음 보는 사람이 데이터의 핵심에 집중하게 해줌
- 보조선을 흐릿하게, 지우기 : 데이터를 표현하는 부분이랑 겹쳐 처리
- 라벨을 직접 표시 : 보조선을 없애고 라벨을 데이터에 직접 표시하면 즉각적인 해석 가능
정보 시각 표현
- 그래픽 요소 : 뇌는 먼저 비슷한 물체와 조금 달라보이는 것을 구분한 다음에 나머지를 자세히 탐색함
자크베르탱의 그래픽 7요소
- 위치
- 위치의 변화로 하나의 요소를 강조할 수 있음
- 수치로 표현할 수 있음, 정보의 상하구조를 효과적으로 전달
- 크기
- 하나만 작게 만들면 작은 요소에 집중
- 주위 크기와 다른지가 중요
- 모양
- 하나만 다른 모양으로, 전혀 다른 형태로 바꾸기
- 형태만으로 큰 대비 효과는 힘듬
- 색
- 하나만 다른 색으로, 대개 보색을 씀
- 수치 표현이 힘들어 순서를 매기기엔 적합하지 않음
- 명도
- 하나만 명도를 다르게 함, 색상보다 더 명시성에 영향을 줌
- 기울기
- 시선은 반복에서 벗어나 변화를 감지해 강조한다고 느낌
- 질감
- 지나치게 쓰면 좋지않음
시각화를 위한 그래픽 디자인 기본 원리
- 타이포그래피
-
1~2가지의 서체의 크기나 스타일의 변화를 줌
-
한글과 영문을 비슷한 느낌으로 주는 게 좋음
서체
- 서체는 글의 형태를 총칭, 타이포그래피에서 가장 어려운 일
- 세리프는 가독성이 높아 본문용, 산세리프는 주목성이 높아 제목용
무게
- 두께를 의미,무게감으로 위계표현
크기
- 글자가 배치되는 금속 활자판의 높이 의미
- 서체에 따라 크기가 다를 수도 있음
스타일
- 가로 세로 비율, 각도에 따라 달라짐
- 글자 폭을 조정, 기울기
색채
- 정보의 중요도나 종속 관계 표현 가능
- 바탕색에 영향을 받고 청색은 후퇴돼 보여 자제
간격
- 가독성에 영향, 다음 글자가 다른 글자보다 밀접해야 함
- 글자 사이 < 낱말 사이 < 글줄 사이
- 색상
-
색채학 원칙을 알고 지킴, 균형을 깨서는 안됨
-
보색을 이용, 명도와 채도는 같게
-
컬러 스킴 : 적절한 보색 및 배색 색상 팔레트 추출
-
어도비 쿨러 : 공유된 단어와 관련된 배색 팔레트를 가져다 쓸 수 있음
-
스네이크 오일
구분 표현
- 정보를 구분하고 묶음, 색은 사용 숫자를 제한할 필요가 있음
- 보통 사람이 구분할 수 있는 색상은 8가지
순서 표현
- 명암 단계, 스펙트럼 단계 등을 이용해 구분
- 섬세한 순서를 표현할 때 무채색의 단계가 정보를 더 명확히 전달
- 명도와 채도를 복합 개념이라 할 수 있는 톤은 선형적 단계를 표현 -> 정보의 순서와 위계 표현
비율 표현
- 시각적 구별할 정도로 표현 가능
- 0을 중심으로 0을 중립적 명도로 표시하고 위, 아래 수치들은 상반되는 두 가지 색을 사용
색채 사용과 인지
- 색을 통해 이해할 때 인간의 지각와 인지 작용이 관여함
- 정보들이 충돌없이 인지될 때 정보의 해석이 빠름
- 그리드
-
디자인 안에 여러요소를 복합적으로 배치할 때 반드시 그리드를 계획하고 지켜야 함
-
모션 인포그래픽, 인터렉션 정보 디자인에서도 그리드는 중요한 요소
-
블록 레이아웃을 잡고 그 위에 요소를 효율적으로 놓아 전체적 조화 추구
하나의 화면 읽기
- 눈이 움직이는 방향을 생각
- 습관적으로 상단 왼쪽의 입구를 보고 오른쪽 하단으로 내려감
- 색의 농도는 가장 강하게 주목하는 초점이 어디인지를 보여줌
정보의 역피라미드
- 가장 중요한 정보가 위로, 밑으로 갈 수록 중요도 낮아짐
- 보는 사람이 모든 텍스트를 읽지 않아 맨위에 중요한 것을 배치
망 그리드
- 수평선과 수직선의 연속이 개체를 배치하는 지침
- 일관성이 생기고 실험의 여지도 남겨 놓아 역설적으로 디자인이 쉬워짐
3등분 법칙
- 3*3 그리드를 포개 교차하는 곳을 적극적 핫스팟으로 삼아 역동적 결과를 배치
- 비례 간격을 끌어들여 미학적으로 만족스러운 균형이 잡힘
- 핵심 요소를 핫스팟 가까이에 배치하면 구성에 역동성을 더함
- 아이소타이프
- 많은 양의 데이터를 쉽게 지각함
- 국제적 그림언어 체계로 갖가지 지식을 조직적으로 시각화
- 정보, 자료, 의미를 나타내기 위해 상징적 도형이나 정해진 기호를 조합해 나타냄
- 단순한 픽토그램은 아님, 하나의 기호가 일정한 수량을 대표
- 인류의 전통에 기대고 있어 아이소타이프 도표의 기호들은 시공간을 초월해 읽혀야 함
- 이미지 활용, 최근들어 아이콘으로 발전
인터렉션
- 인터렉션은 사용자 스스로 정보를 탐색, 필터링하는 과정에서 인사이트를 얻을 기회 제공
- 인터렉션 위 정보 디자인은 비선형적 구조, 사용자가 임의로 정보에 접근해 선택적 탐색 가능
- 시간 제약이 없어 능동적, 전달 효과 높음
- 메시지도 다양하게 조직화
- 비선형적 구조에서 인터렉션 개념 적용이 중요
- 요점을 제시해 사용자들이 스스로 정보를 탐구해 이해하도록 유도
- 정보와 정보 사용자간 관계를 확장하고 심화
강조하고 디테일을 보여주는 방식
- 웹의 진화라는 시각화 프로젝트는 사용자의 적극적 개입 유도
사용자가 콘텐츠를 선택
- 사용자는 데이터 변환 컨트롤을 통해 다른 데이터세트를 불러오는 템플릿 위에 자신이 필요한 데이터만을 취사선택해 볼 수 있음
- 통계 그래프보다 더 많은 데이터 세트를 관찰할 수 있도록 함
- 변경의 경우 즉각적으로 반영됨
- 위계적 원 모양의 드릴다운 내비게이션 버블로 구성
여러가지 방법으로 데이터 보여주기
- 지도는 위치와 시간 흐름의 타임라인 강조(축소/확대 기능)
- 시각화는 버블차트의 콘텐츠 조정을 위해 선그래프 사용
- 사용자는 애니메이션으로 시각화를 실행하고 직접 인터렉션 해볼 수 있음
사용자 지정으로 시각 맵핑 변화
- 멀티 조정 시각화는 작은 공간이라는 제약을 벗어나 시간대 데이터의 다양한 관점을 보여줌
- 시각 데이터 재매핑을 지원하고 시각화 크기를 극대화 하도록 함
- 데이터가 맵 위의 시각 레이어를 프로젝션하는 방식
사용자 관점과 의견이 반영
- 사용자 주관적 관점과 데이터 표현을 혼합하는 시각화는 주제를 표현하는 사용자 반응 프로세스의 가장 중요한 부분
- 주제 측정이 사용자가 생각하는 주관적 지표에 의해 결정됨
- 개인적으로 중요하게 생각하는 것은 결과치를 소셜 미디어를 통해 공유할 수 있음
시각 정보 디자인 7원칙
- 시각적 비교를 강화 : 연관된 변수와 트랜드를 비교할 수 있는 도구 제공
- 인과관계 제시 : 디자인할 때 원인과 결과를 제시
- 다중변수 표시 : 연관된 변수를 활용해 정보 표현
- 텍스트, 그래픽, 데이터를 조화롭게 배치 : 라벨, 범례가 도표에 녹은 다이어그램이 효과적
- 질과 연관성, 진실성 : 정보가 과연 사용자의 특정 목적을 달성하는데 도움이 되는지 고민
- 시간순이 아닌 공간순 나열 : 사용자의 이해가 쉬움
- 정량성을 제거하지 않기 : 정량적 정보를 한 눈에 파악하게 하기
빅데이터 시각화 디자인
- 기업에서 빅데이터 시각화를 통해 제공하는 것
- 내부적 : 인사이트로 도출하는 시각적 분석 도구, 정보 전달 및 상황 진단 프로세스 개발
- 외부적 : 정보를 고객에게 전달
- 빅데이터 시각화는 데이터 또는 정보를 탐험할 수 있는 기회를 사용자에게 주는 형태여야 함
- 이미지 형태보다 인터렉션 형태의 결과물로 제공
- ex) 페이스북 인기 지도
빅데이터 시각화 디자인 사례
- 2D 이미지
- 인쇄물이나 온라인 이미지
- 색상 및 그래픽 형태로 표현, 시각화 툴과 프로그래밍 기술 이용
- 모션 영상
- 시각화를 순차적으로 보이거나 자동 애니메이션 제공
- 모션 인포그래픽
- ex)윈드맵, think 뉴욕 설치 광경
- 인터렉티브 애플리케이션
- 결과물은 인터렉티브 형태가 주류임
- 많은 양의 정보를 다양한 레이어나 필터를 통해 사용자가 접근하도록 함 ex) 갭 마인더, GBCS, 트룰리아, 에코매지네이션 챌린지
빅데이터 시각화 디자인의 방향
- 개인의 능력을 통해 최신의 기술과 도구를 사용해 정보를 제시하고 분석하는 것
- 비주얼 인식의 심리적인 부분을 알고 특정 시각화 기술이 줄 수 있는 한계에도 이해해야 함
- 궁극적으로 정보 디자인의 의도와 방향이 목적과 어긋나지 않아야 함
- 범주 안에서 정보를 보고 사용자를 위한 시각화 목적을 설정하고 이를 끝까지 고수해야 함
- 적합한 데이터 수집, 가공, 그래프 처리 과정이 진행되어야 하고 전문성이 단절되어선 안된다.
- 시각화에서 정보성이 결여되면 효율성과 참신성이 떨어지는 문제가 발생