IT Professional Engineering/STATISTICS

확률과 통계의 기본 개념

GilliLab IT 2024. 11. 17. 18:26
728x90
반응형

확률과 통계의 기본 개념

정의

  • 모집단 (Population):

    • 정보를 얻고자 하는 관심 대상의 전체 집합
  • 모수 (Population Parameter):

    • 모집단 분포 특성을 규정 짓는 척도
    • 관심의 대상이 되는 모집단의 대표값
  • 표본 (Sample):

    • 모집단의 부분집합
  • 표본통계량 (Sample Statistic):

    • 표본의 몇몇 특징을 수치화한 값
  • 확률변수 (Random Variable):

    • 확률현상에 기인해 결과값이 확률적으로 정해지는 변수
  • 확률현상 (Random Phenomenon):

    • 어떤 결과들이 나올지는 알지만 가능한 결과들 중 어떤 결과가 나올지는 모르는 현상
  • 확률분포 (Probability Distribution):

    • 확률변수가 특정한 값을 가질 확률을 나타내는 함수
    • 예시: P(X=1) = 1/2 (50%)
  • 함수 (Function):

    • 매핑을 의미, 집합의 임의의 한 원소를 다른 집합의 한 원소에 대응시키는 관계

확률분포 분류

  • 이산확률분포 (Discrete Probability Distribution):

    • 이산확률변수(정수값, 셀 수 있음)의 확률분포
    • 확률질량함수 (Probability Mass Function, PMF):
      • 이산확률변수가 특정값을 가질 확률을 나타내는 함수
  • 연속확률분포 (Continuous Probability Distribution):

    • 연속확률변수(실수값, 셀 수 없음)의 확률분포
    • 확률밀도함수 (Probability Density Function, PDF):
      • 연속확률변수가 특정 구간에 포함될 확률을 나타내는 함수
  • 누적분포함수 (Cumulative Distribution Function, CDF):

    • 주어진 확률변수가 특정값보다 작거나 같은 확률을 나타내는 함수

독립항등분포 (IID, Independent and Identically Distributed)

  • 두 개 이상의 확률변수를 고려할 때, 각 변수들이 통계적으로 독립(independent)이고, 동일한 확률분포를 가지고 있을 때(identically distributed)

확률과 통계의 기본 개념은 모집단, 모수, 표본, 표본통계량, 확률변수, 확률현상, 확률분포, 함수 등으로 구성됩니다. 이산확률분포와 연속확률분포는 확률변수의 종류에 따라 분류되며, 확률질량함수(PMF)와 확률밀도함수(PDF)를 통해 각각의 확률을 나타냅니다. 누적분포함수(CDF)는 주어진 확률변수가 특정값보다 작거나 같은 확률을 나타내며, 독립항등분포(IID)는 두 개 이상의 확률변수가 독립적이고 동일한 확률분포를 가질 때를 의미합니다.

728x90
반응형