프로그래밍/python

[동아리/파이썬/20.06.26] 워드클라우드

pxatd 2020. 6. 28. 17:44
728x90

동아리에서 종강기념으로 평소 하던 "주어진 문제를 보고 파이썬으로 프로그래밍" 하는 시간대신 OB선배님들의 특강을 듣는 시간을 가졌습니다. 오늘의 주제는 워드클라우드.

기존 사용하던 파이썬 3.X.X 대신 구글에서 제공하는 google colab를 사용하는 점이 신기했습니다. colab의 확장자는 .ipynb입니다. 

 

워드클라우드(word cloud): 워드클라우드란 한마디로 '핵심단어를 시각화하는 기법'이다. 문서의 키워드, 개념 등을 직관적으로 파악할 수 있도록 핵심단어를 시작적으로 돋보이게 하는 기법이다. 예를 들면 많이 언급될수록 단어를 크게 표현해 한눈에 들어올 수 있게 하는 기법등이 있다. 주로 방대한 양의 정보를 다루는 빅데이터(big data)를 분석할 때 데이터의 특징을 도출하기 위해 사용된다. 

 

참고한 블로그는 : pinkwink.kr/1029 입니다. 

 

워드클라우드를 구현하는 코드는 블로그를 참고하였고, 아래는 저의 결과물 입니다. 

 

파이썬으로 구현한 워드클라우드는 사용자의 이미지를 입력받아 색을 구별하여 워드클라우드를 만들어냅니다. 저는 아이폰 유저이기때문에 애플 로고를 사용해보았는데, 아무래도 단어간 간격을 좁게할수록, 크기를 작게할 수록 모양이 더 잘 만들어지는 것 같습니다.

728x90