목록전체 글 (307)
On the journey of

* 이 글은 교내 프로그래밍 동아리 SOLUX의 세미나를 들으며 공부하는 포스팅입니다. * 강의의 저작권은 세미나를 준비해주신 부원분께 있음을 밝힙니다. 1. 넷플릭스 데이터 결측치 비율 확인 for i in netflix.columns : missingValueRate = netflix[i].isna().sum() / len(netflix) * 100 if missingValueRate >0 : #결측치 비율이 0보다 크면 출력 print ("{} null rate : {} %".format(i, round(missingValueRate,2))) #.format : 인자값을 중괄호{}가 지정된 위치에 순차적으로 #round() : 해당 소수점 자리까지 반올림 #.isna() : 결측 값은 True 반환..

* 이 글은 교내 프로그래밍 동아리 SOLUX의 세미나를 들으며 공부하는 포스팅입니다. * 강의의 저작권은 세미나를 준비해주신 부원분께 있음을 밝힙니다. 3. 데이터 불러오기 기본적으로 python 패키지 내에 내장된 데이터(iris dataset)도 있지만, 대부분의 데이터는 그렇지 않다. 이번 분석에서 활용할 넷플릭스 데이터는 kaggle에서 다운받을 수 있다. (하이퍼링크 걸어뒀음) 요런 화면이 떴다면 여기서 우측 상단 DOWNLOAD 클릭해주면 된다 : 데이터셋 다운받은 거 열면 됨(archive 압축파일). 대충 요렇게 생겼다. 4. 데이터 Colab에 업로드하기 나는 다운로드 폴더에 저장했지만 이건 상관없다 :) 바탕화면에 저장해도 되고 문서에 저장해도 되고. 여하간 코랩에서 dataset을 ..

* 이 글은 교내 프로그래밍 동아리 SOLUX의 세미나를 들으며 공부하는 포스팅입니다. * 강의의 저작권은 세미나를 준비해주신 부원분께 있음을 밝힙니다. 01. 파이썬 라이브러리 소개 - 기본적으로 라이브러리가 설치되어 있지 않다면, Google colab 기준 !pip install (라이브러리명) 하면 설치된다. - Numpy : 다차원 배열을 쉽게 처리하고 효율적으로 사용할 수 있도록 지원하는 라이브러리 ; import numpy as np - Pandas : 데이터 조작과 분석을 보다 용이하게 해주는 라이브러리; import pandas as pd - Matplotlib : 데이터를 차트/plot(플롯)으로 시각화하는 라이브러리; import matplotlib.pyplot as plt - Sea..

* 이 문항들은 '누구나 AI' 부트캠프 5기 커리큘럼의 코딩테스트 시간 중 나온 프로그래머스의 문항들임을 밝힙니다 * 1. 문자열 나누기 개인적으로는 해석부터 쉽지 않았던...문항 :( 설명하자면 이렇다 [Banana의 경우] 1. b로 시작하니까, b와 b가 아닌 문자로 구분한다. 2. 두 번째 글자는 a (b가 아니다) : b 1개, not b 1개로 개수가 같으니 여기서 1차전 종료 3. ba는 버리고, 'nana' 문자열만 주어졌다고 가정한다. n으로 시작하니까, n와 not n으로 구분. 4. 다음 글자는 a: not n이다. 즉, n과 a 개수가 1개로 같으니 여기서 2차전 종료. 5. na를 버리고, na만 주어졌다고 생각한다. 위와 마찬가지로 n으로 시작하니 n과 not n으로 구분. 6..