• R$ LEGO 시리즈별 색상 시각화

    저는 한국나이로 5살 3살 두 아이를 키우고 있는 아빠입니다. 몇일 전 아들과 함께 LEGO를 만들고 있는데 문득 LEGO에서 사용한 색들을 시각화 하고 싶다는 강한 마음이(덕력이) 생겼습니다. 다행히(?) Kaggle에 올라와 있는 LEGO Database에 RGB color code를 포함한 1950-2017 까지 각종 LEGO 관련 데이터가 제공되어 있었고, 이를 사용해 각 시리즈별로 사용된 색상에...


  • 베트남 축산통계 시각화

    Code Show All Code Hide All Code 최근 KOICA 전문가 파견으로 베트남에 사업 예비조사를 다녀왔습니다. 보고서 작성 중 베트남 축산의 통계자료를 찾는데 예쁘게 시각화된 최신 자료(~2018)를 찾기가 힘들어 직접 시각화를 하였습니다. 자료 출처는 General Statistics Office of Vietnam입니다. 분석에 사용한 data는 Github repository를 참고하시길 바랍니다. library(tidyverse) library(janitor) df <- readxl::read_excel("animal-head.xlsx")...


  • 인공지능시대에 인간성

    서울역에서 출발해 익산으로 가는 고속열차 안에서 이 글을 쓰고 있다. 시대마다 사람에게 요구하는 가치들이 변한다. 지금은 어린이도 노인도 몸이 불편한 사람도 기차를 타면 편하게 멀리 갈 수 있는 시대가 되었다. 수렵 채취 시대에 대중적으로 요구되었던 빠르고 강한 힘은 지금 시대에 와서는 각종 교통수단과 중장비로 대체되었다. 나는 아직 다리힘이 좋아서 계단을...


  • R$ dplyr::summarise_all() 사용하기

    dplyr 패키지를 이용해 데이터의 하위 그룹 분석을 하려면 다음과 같은 코드를 사용할 수 있습니다. library(dplyr) iris %>% group_by(Species) %>% summarise( Sepal.Length_mean = mean(Sepal.Length), Sepal.Width_mean = mean(Sepal.Width) ) ## # A tibble: 3 x 3 ## Species Sepal.Length_mean Sepal.Width_mean ## <fct> <dbl> <dbl> ## 1 setosa 5.01 3.43 ## 2 versicolor...


  • 농사와 데이터분석

    뭐 눈엔 뭐 만 보인다고, 데이터 분석과 농사는 참 닮았다. 데이터베이스 구축은 밭을 가는 일이다. 데이터를 쌓는 것은 씨를 뿌리고 밭을 가꾸는 일이다. 모인 데이터를 분석하는 것은 작물을 수확하는 것과 닮았다. 무엇보다 수확의 기쁨이 대단하다. 씨 뿌리기 전에 밭을 준비해야 한다 상농은 밭을 가꾸고 중농은 곡식을 가꾸고 하농은 풀을 가꾼다....