Python 3

Week3) 데이터 전처리와 정제

학습 내용데이터 탐색 / 정제범주형 변수와 Group by Pandas DataFrame 속성속 성설 명index인덱스 레이블columns컬럼 이름dtypes컬럼별 데이터 타입shape(행, 열) 튜플 반환valuesNumPy 배열 형태로 데이터 반환axes인덱스 + 컬럼 정보 리스트T행/열 전치(transpose) DataFrame 주요 메서드매서드설명head(n) / tail(n)앞/뒤 n행 표시describe()기술 통계 요약dropna()결측치 제거sample()무작위 샘플 추출sort_values()값 기준 정렬rename()컬럼명 또는 인덱스명 변경 데이터 분석 프로세스📥 1. 데이터 수집원시 데이터(Primary): 직접 수집 (설문, 센서 등)2차 데이터(Secondary): 기존 자료에..

Week2-2) Google Colab 사용 (+Python 기본 활용)

1. Google Colab에서 파일 업로드 (p.30~31)좌측 파일 아이콘 클릭업로드 아이콘 클릭 → 원하는 파일 선택2. 데이터 확인 방법 (p.32~33)df.head() # 상위 5개 행df.tail() # 하위 5개 행df.shape # (행, 열)df.colums # 열 이름df.index # 인덱스 정보3. 열/행 선택 및 필터링 (p.34~37)df['Country'] # 단일 열 선택 df[['Country', 'GDP']] # 여러 열 선택 df[df['Population'] >= 10000] # 조건 필터링 복합 조건:df[(df['Population']>=10000) & (df['GDP']..

Week2-1) Python과 Pandas 기본 개념

1) 왜 Python인가?- 초보자에게 친숙한 언어- 다양한 분야에서 쉽게 활용 가능2) 주요 라이브러리- NumPy: 수치 연산용- Pandas: 데이터 분석용 a. 데이터 구조: Series(1차원), DataFrame(2차원) b. 탐색: head(), shape, columns, index c. 선택: 조건 필터링, iloc d. 통계 함수: min(), mean(), count()✅ 데이터 분석 프로세스 개요 (p.6)비즈니스 질문 정의하기데이터 수집(Data Acquisition)데이터 이해 및 전처리(Cleaning & Preprocessing)데이터 분석 (시각화 & 데이터 ㅜ,마이닝)모델링모델 평가 ✅ 데이터 분석 개념 (p.10)데이터 분석이란?원시 데이터를 분석하여 유..