[KT AIVLE] Python 프로그래밍 & 라이브러리

KT에이블스쿨

qkrgusqls 2024. 3. 25. 19:47

0222 - 0223은 기초 파이썬을 복습하는 시간을 가졌다.

CRISP-DM, Numpy, Pandas

기본 데이터 구조와 자료형

데이터 마이닝 프로세스를 위한 업계 표준 프로세스

CRISP-DM 개요 및 각 단계의 의미

강사님께서 CRISP-DM 개념은 데이터 분석 관련 면접에서 강조하기 좋은 주제라고 하셨다.

고유값을 확인하기 : unique()

행조건 확인하기 : iloc()

열에서 지정된 값을 포함하는 값을 선택하기 : isin()

selected_cities = df[df['City'].isin(['New York', 'Los Angeles', 'Chicago'])]

'New York', 'Los Angeles', 'Chicago' 중 하나를 포함된 모든 행을 선택한다.

지정된 범위 내의 값을 선택하기 : between()

selected_rows = df[df['Age'].between(18, 30)]

'Age'가 18부터 30사이의 값을 가진 행을 선택한다.

그룹화하여 데이터를 분석하는 방법 : groupby()

grouped_df = df.groupby('Department')
average_salary = grouped_df['Salary'].mean()

부서별로 데이터를 그룹화하고 'Salary' 열의 평균을 계산하는 코드이다.

아직까진 파이썬 기초 문법 강의로 강사님께서 천천히 설명해주셨다. 복습하는 느낌으로 실습을 할 수 있어서 좋았다.

생각보다 모르는 메서드가 많아서 꼼꼼히 공부해보아야겠다.