본문 바로가기

UpstageAILab17

통계학(5) 대푯값 분산도 가설검정 회귀분석 통계학 - 대푯값 분산도 가설검정 회귀분석대푯값1. 평균의 종류산술평균: 데이터의 합을 데이터 개수로 나눈 값.$$\text{산술평균} = \frac{\sum x_i}{n}$$기하평균: 데이터의 곱의 n제곱근.$$\text{기하평균} = \sqrt[n]{x_1 \cdot x_2 \cdots x_n}$$조화평균: 데이터 역수의 평균의 역수.$$\text{조화평균} = \frac{n}{\sum \frac{1}{x_i}}$$2. 평균의 함정평균은 극단값의 영향을 받음 → 중앙값, 최빈값 병행 분석.3. 중앙값데이터를 정렬한 후 중앙에 위치한 값.4. 최빈값가장 자주 나타나는 값.분산도1. 분산(Variance)평균으로부터 데이터가 얼마나 떨어져 있는지를 측정.$$\sigma^2 = \frac{\sum (x_i.. 2024. 12. 2.
통계학(4) 변수와 척도(Variables & Scales) 강사님: 오영석강사님변수와 척도(Variables & Scales)1. 변수(Variables)정의관찰이나 측정에서 값이 달라질 수 있는 속성이나 특성.종류독립변수 (Independent Variable):다른 변수에 영향을 주는 변수.실험에서 조작되는 변수.예: 약물 실험에서 복용량.종속변수 (Dependent Variable):독립변수에 의해 영향을 받는 변수.측정되거나 관찰되는 값.예: 치료 효과, 반응 속도.통제변수 (Control Variable):실험에서 일정하게 유지되는 변수.예: 실험 환경(온도, 습도 등).질적 변수 (Qualitative Variable):수치가 아닌 범주나 특성을 나타내는 변수.명목 척도(순서 없음): 성별, 혈액형.서열 척도(순서 있음): 학위, 만족도.연속 변수 (.. 2024. 12. 2.
통계학(3) 통계적 확률 1. 통계적 확률정의통계적 확률은 실제 실험이나 관찰을 통해 얻은 데이터를 기반으로 계산됩니다.수학적 확률과 달리, 경험적 데이터를 바탕으로 사건 발생 가능성을 추정합니다.수식$$P(A) = \frac{\text{사건 A가 발생한 횟수}}{\text{전체 실험 횟수}}$$특징경험 기반: 실제 데이터를 기반으로 확률 계산.표본 크기: 실험 횟수가 많을수록 더 정확한 값을 얻음 (대수의 법칙).범위 제한: 모든 확률은 $$0 \leq P(A) \leq 1$$예시주사위를 60번 던졌을 때, 4가 15번 나왔다면:$$P(A) = \frac{15}{60} = 0.25$$2. 확률의 덧셈 법칙 (Addition Rule)정의두 사건 중 하나 이상이 발생할 확률을 계산할 때 사용.수식일반적인 경우 (두 사건이 겹칠 .. 2024. 12. 2.
통계학(2) 확률론(Probability Theory) 강사님: 오영석 강사님확률론(Probability Theory) 기초 정리확률론은 불확실한 상황에서 사건의 가능성을 수학적으로 분석하는 도구확률의 기본 용어1. 시행 (Experiment)결과를 예측할 수 없지만 동일 조건에서 반복 가능한 과정 또는 실험.예시: 주사위 던지기, 동전 던지기.2. 표본공간 (Sample Space)시행에서 나타날 수 있는 모든 가능한 결과의 집합.표기: $$S$$.예시: 주사위 1회의 표본공간 $$S = {1, 2, 3, 4, 5, 6}$$3. 근원사건표본공간 $S$의 구성원 중 단일한 결과.예시: 주사위 던지기의 1,2,3,4,5,64. 사건 (Event)표본공간 $S$의 부분집합으로, 하나 이상의 결과가 포함된 집합.예시:A = {1, 3, 5} (홀수),B = {2,.. 2024. 12. 2.
통계학(1) 순열과 조합 강의일자: 24.11.28강사님: 오영석 강사님순열과 조합: 개념, 공식, 코드 구현순열(Permutation)정의순열은 서로 다른 n개 원소 중 r개를 선택하고 순서를 고려해 나열하는 경우의 수를 말합니다.순열에서는 순서가 중요하므로, 순서가 다르면 다른 순열로 간주합니다.수학적 표현전체 순열: $$n!$$부분 순열: $$P(n,r) = \frac{n!}{(n−r)!}$$예시{A, B, C} 중 2개를 선택하는 경우:$$P(3,2) = \frac{3!}{(3-2)!} = \frac{3 \cdot 2 \cdot 1}{1} = 6$$결과: {AB, AC, BA, BC, CA, CB}코드 구현 (Python)itertools 모듈 사용Python의 표준 라이브러리인 itertools를 활용하면 반복 작업을 .. 2024. 12. 2.
유튜브 인기동영상 시각화 작성일: 24.11.24(일)개요유튜브 인기동영상 데이터 스크래핑데이터로 다양하게 시각화스크래핑모듈 importimport requestsfrom bs4 import BeautifulSoupfrom selenium import webdriverimport matplotlib.pyplot as pltimport matplotlib.font_manager as fmimport pandas as pdimport seaborn as snsimport numpy as np셀레니움 활용하여 스크래핑url = "https://www.youtube.com/feed/trending"driver = webdriver.Chrome()driver.implicitly_wait(3)html = driver.get(url)page.. 2024. 11. 24.