seaborn 3

seaborn 라이브러리를 이용하여 그래프 스타일 설정하기

seaborn 라이브러리로 만든 그래프의 스타일은 set_style 메서드를 사용하여 바꿀 수 있습니다. 스타일을 적용할 부분에서 한 번만 실행해주면 메서드를 실행한 이후의 그래프가 모두 지정한 스타일로 바뀝니다. seaborn 라이브러리 스타일은 darkgrid, whitegrid, dark, white, ticks 이렇게 5가지 입니다. tight_layout 메서드를 통해 그래프의 레이아웃을 조절하고, for 문을 활용하여 모든 스타일을 하나씩 적용해보았습니다. [참고자료] (Data) seaborn (https://seaborn.pydata.org/) seaborn: statistical data visualization — seaborn 0.10.1 documentation Seaborn is ..

AI Big Data/pandas 2020.07.10

seaborn 라이브러리 사용하기

load_dataset 메서드를 사용하여 데이터 집합을 불러올 수 있습니다. - seaborn 라이브러리로 히스토그램을 그리려면 subplots, displot 메서드를 사용하면 됩니다 - subplots 메서드로 기본 틀을 만들어줍니다. - distplot 메서드에 total_bill 열 데이터를 전달하면 히스토그램을 그릴 수 있습니다. # 히스토그램 그리기 - distplot 메서드는 히스토그램과 밀집도 그래프를 같이 그려줍니다. - 혹시라도 밀집도 그래프를 제외해서 그리고 싶다면 kde 인잣값을 False로 설정하면 됩니다. * 밀집도 그래프는 주어진 데이터를 정규화시켜 넓이가 1이 되도록 그린 그래프입니다. # 밀집도 그래프 그리기 - 밀집도 그래프만 나타내고 싶은 경우에는 hist 인자를 Fal..

AI Big Data/pandas 2020.07.09

앤스콤 4분할 그래프 살펴보기

# 앤스콤 4분할 그래프 (Anscombe's quartet) Frank Anscombe이 데이터를 시각화하지 않고 수치만 확인할 때 발생할 수 있는 함정을 보여주기 위해 만든 그래프 # 앤스콤이 지적한 함정 - 앤스콤 그래프를 구성하는 데이터 집합은 4개의 그룹으로 구성되어 있으며 모든 데이터 그룹은 x, y 열을 가지고 있다 - 이 4개의 데이터 그룹은 각각 평균, 분산과 같은 수칫값이나 상관과계, 회귀선이 모두 같다는 특징이 있다 - 이런 결과를 통해 '데이터 그룹 I, II, III, IV의 데이터는 모두 같을 것이다' 라고 착각할 수 있음 하지만 ! 각 데이터 그룹을 시각화하면 데이터 그룹들이 서로 다른 데이터 패턴을 가지고 있다는 점을 알 수 있다 이런 점에서 데이터 시각화는 데이터 분석 분야..

AI Big Data/pandas 2020.07.09