VAR.S(인수1, 인수2, … 인수254)
표본 분산(sample variance)은 VAR.S 함수로 구한다. 예전엔 VAR 함수를 썼다.
VAR.P(인수1, 인수2, … 인수254)
모 분산(population variance)을 구한다. 예전엔 VARP 함수를 썼다. VAR 함수와 VARP 함수는 아직은 지원되지만 이후 버전에서는 지원이 종료될 수 있다.
STDEV.S(인수1, 인수2, … 인수254)
표본 표준 편차(sample standard deviation)는 STDEV.S 함수로 구한다. 이전 버전까지는 STDEV 함수를 썼다.
STDEV.P(인수1, 인수2, … 인수254)
모 표준 편차(population standard deviation)는 STDEV.P 함수로 구한다. 예전엔 STDEVP 함수를 썼다. 아직까지는 STDEV 함수와 STDEVP 함수도 지원되지만 이후 버전에서는 지원이 중단될 수 있다.
NORM.DIST(x,mean,standard_dev,cumulative)
지정된 평균과 표준 편차를 갖는 정규 분포값을 반환합니다. 이 함수는 가설 검정 등 통계의 광범위한 영역에서 응용됩니다. x는 분포를 구하려는 값입니다. mean은 분포의 산술 평균입니다. standard_dev는 분포의 표준 편차입니다. Cumulative는 함수의 형태를 결정하는 논리값으로서, cumulative가 TRUE이면 NORM.DIST에서 누적 분포 함수가 반환되고 FALSE이면 확률 질량 함수가 반환됩니다.
CONFIDENCE.NORM(alpha,standard_dev,size)
정규 분포를 사용하여 모집단 평균의 신뢰 구간을 반환합니다. 신뢰 구간은 값의 범위입니다. 표본 평균 x는 이 범위의 중심에 있으며 범위는 x ± CONFIDENCE.NORM입니다. 예를 들어 x가 우편을 통해 주문한 제품 배달 시간의 표본 평균인 경우 모집단의 평균 범위는 x ± CONFIDENCE.NORM입니다. 이 범위에 속하는 임의의 모집단 평균 μ0에 대해 μ0를 기준으로 x보다 먼 표본 평균을 얻을 확률은 alpha보다 큽니다. 이 범위에서 벗어난 임의의 모집단 평균 μ0에 대해 μ0를 기준으로 x보다 먼 표본 평균을 얻을 확률은 alpha보다 작습니다. 즉, 모집단 평균이 μ0이라는 가설의 유의 수준 alpha를 적용하여 x, standard_dev, size를 사용하여 양측 검정을 만든다고 가정합니다. 그러면 μ0이 신뢰 구간에 포함된 경우 해당 가설이 기각되지 않으며, μ0이 신뢰 구간에 포함되지 않은 경우 해당 가설이 기각됩니다. 그러나 신뢰 기간을 바탕으로 다음 번 배달 시간이 신뢰 구간에 포함될 확률이 1 – alpha라고 추론할 수는 없습니다. alpha는 유의 수준, standard_dev는 모 표준 편차, size는 표본 크기이다.
STANDARDIZE(Number; Mean; StDev)
확률 변수를 정규화된 값으로 변환합니다. Number는 표준화되어야 하는 값입니다. Mean은 분포의 수를 의미합니다. StDev는 분포의 표준 편차입니다.
예) =STANDARDIZE(11;10;1)은 1을 반환합니다. 평균이 10이고 표준 편차가 1인 정규 분포에서 값 11은 10이 의미하는 것보다 높고, 표준 정규 분포에서 값 1이 높은 것과 같습니다.
NORM.S.DIST(z,cumulative)
표준 정규 분포(z-분포)를 반환합니다. 이 분포의 평균은 0이고 표준 편차는 1입니다. 표준 정규 곡선 면적 표 대신 이 함수를 사용합니다. z는 분포를 구하려는 값입니다. cumulative는 cumulative 함수의 형태를 결정하는 논리값으로서, cumulative가 TRUE이면 누적 분포 함수가 반환되고 FALSE이면 확률 질량 함수가 반환됩니다.
Z.TEST(array,x,sigma)
z-검정의 단측 검정 p-값을 반환합니다. 가설 모집단 평균 x가 주어진 경우 Z.TEST 함수는 표본 평균이 데이터 집합(배열)의 관측 평균, 즉 관측된 표본 평균보다 클 확률을 반환합니다. array는 필수 요소입니다. x를 검정할 데이터의 배열 또는 범위입니다. x도 필수 요소입니다. 검정할 값입니다. sigma는 선택 요소입니다. 모 표준 편차로서, 이를 생략하면 표본 표준 편차가 사용됩니다.
T.DIST(x,deg_freedom, cumulative)
단측(왼쪽) 스튜던트 t-분포값을 반환합니다. t-분포는 소표본의 데이터를 가설 검정할 때 사용됩니다. t-분포의 임계값 표 대신 이 함수를 사용합니다. x는 분포를 구하려는 숫자 값입니다. deg_freedom은 자유도를 나타내는 정수입니다. Cumulative는 함수의 형태를 결정하는 논리값으로서, cumulative가 TRUE이면 T.DIST에서는 누적 분포 함수가 반환되고 FALSE이면 확률 밀도 함수가 반환됩니다.
T.DIST.2T(x,deg_freedom)
양측 스튜던트 t-분포값을 반환합니다. x는 분포를 구하려는 숫자 값입니다. deg_freedom은 자유도를 나타내는 정수입니다.
T.DIST.RT(x,deg_freedom)
단측(오른쪽) 스튜던트 t-분포값을 반환합니다. x는 분포를 구하려는 숫자 값입니다. deg_freedom은 자유도를 나타내는 정수입니다.
T.TEST(array1,array2,tails,type)
스튜던트 t-검정에 근거한 확률을 반환합니다. T.TEST 함수를 사용하여 두 개의 표본이 같은 평균값을 갖는 두 개의 같은 모집단에서 추출한 것인지를 판단할 수 있습니다. array1은 첫 번째 데이터 집합입니다. array2는 두 번째 데이터 집합입니다. Tails는 분포가 단측인지 또는 양측인지 지정하는 숫자로서 tails = 1이면 T.TEST에서는 단측 분포를, tails = 2이면 양측 분포를 사용합니다. type은 실행할 t-검정의 종류입니다. 타입 1은 쌍을 이루는 것(paired t-test)을 의미합니다. 타입 2는 두 개의 집단이 동일한 분산을 가지고 있는 것을 의미합니다.(등분산 가정 두 집단) 타입 3은 두 개의 집단이 서로 다른 분산을 가진 것을 의미합니다.(이분산 가정 두 집단)
예) =T.TEST(A2:A51,B2:B51,2,3)
CONFIDENCE.T(alpha,standard_dev,size)
스튜던츠 t-분포를 사용하여 모집단 평균의 신뢰 구간을 반환합니다. alpha는 유의 수준, standard_dev는 모 표준 편차, size는 표본 크기이다.
CHISQ.DIST(x,deg_freedom,cumulative)
카이-제곱 분포를 반환합니다. 카이 제곱 분포는 하루 중 TV를 보는 시간을 백분율로 나타내는 것처럼 표본에서 특정 부분이 차지하는 백분율의 분포를 조사할 때 일반적으로 사용됩니다. x는 분포를 계산하려는 값입니다. deg_freedom은 자유도를 나타내는 숫자입니다. Cumulative는 함수의 형태를 결정하는 논리값으로서, cumulative가 TRUE이면 CHISQ.DIST에서는 누적 분포 함수가 반환되고 FALSE이면 확률 밀도 함수가 반환됩니다.
CHISQ.DIST.RT(x,deg_freedom)
카이 제곱 분포의 단측(오른쪽) 검정 확률을 반환합니다. χ2 분포는 χ2 검정과 연관됩니다. χ2 검정은 관측값과 기대값을 비교하는 데 사용됩니다. 예를 들어 유전 실험에서 다음 세대의 식물에서 나타날 색에 대한 가설을 세운 다음 관측 결과를 기대값과 비교하여 가설을 검증할 수 있습니다. x는 분포를 계산하려는 값입니다. deg_freedom은 자유도를 나타내는 숫자입니다.
CHISQ.TEST(actual_range,expected_range)
독립 검증 결과를 반환합니다. 즉, CHISQ.TEST에서는 해당 통계 및 적정 자유도에 대한 카이 제곱(χ2) 분포값이 반환됩니다. χ2 검정(카이-제곱 검정)을 사용하면 실험에 의해 가설이 검증되었는지 확인할 수 있습니다. actual_range는 기대값과 비교하여 검정할 관측값이 포함된 데이터 범위입니다. expected_range는 행 합계와 열 합계를 곱한 값의 총합계에 대한 비율이 들어 있는 데이터 범위입니다.
F.DIST(x,deg_freedom1,deg_freedom2,cumulative)
F-분포값을 반환합니다. 이 함수를 사용하면 두 데이터 집합의 분포도가 서로 다른지 확인할 수 있습니다. 예를 들어 고등학교에 입학하는 남녀 학생의 성적을 조사하여 남녀 학생의 분포도가 서로 다른지를 알아볼 수 있습니다. x는 함수를 계산할 값입니다. deg_freedom1은 분자의 자유도입니다. deg_freedom2은 분모의 자유도입니다. Cumulative는 함수의 형태를 결정하는 논리값으로서, cumulative가 TRUE이면 F.DIST에서는 누적 분포 함수가 반환되고 FALSE이면 확률 밀도 함수가 반환됩니다.
F.DIST.RT(x,deg_freedom1,deg_freedom2)
두 데이터 집합에 대한 단측(오른쪽) 검정 F 확률 분포값(분포도)을 반환합니다. x는 함수를 계산할 값입니다. deg_freedom1은 분자의 자유도입니다. deg_freedom2은 분모의 자유도입니다.
F.TEST(array1,array2)
array1과 array2의 분산이 크게 다르지 않은 양측 검증 확률인 F-검정의 결과를 반환합니다. 이 함수를 사용하여 두 표본이 다른 분산을 갖는지 확인할 수 있습니다. 예를 들어 공립 학교와 사립 학교의 시험 성적 분포도가 서로 다른지 확인할 수 있습니다. array1은 첫 번째 배열 또는 데이터 영역입니다. array2는 두 번째 배열 또는 데이터 영역입니다.
INTERCEPT(known_y's, known_x's)
기존 x 값과 y 값을 사용하여 한 개의 선이 y 축과 교차하는 지점을 계산합니다. 절편은 known_x's와 known_y's의 값으로 이루어진 가장 적합한 회귀선을 기반으로 합니다. 독립 변수가 0일 때 종속 변수의 값을 확인하려면 INTERCEPT 함수를 사용합니다. 예를 들면 데이터가 상온이나 그 이상의 온도에서 측정된 경우 INTERCEPT 함수를 사용하여 0°C에서의 금속의 전기 저항을 예측할 수 있습니다. known_y's는 관측값이나 데이터의 종속 변수 집합입니다. known_x's는 관측값이나 데이터의 독립 변수 집합입니다.
SLOPE(known_y's, known_x's)
known_y's와 known_x's 사이의 데이터 요소에 대한 선형 회귀선의 기울기를 반환합니다. 기울기는 선의 두 점 사이의 수직 거리를 수평 거리로 나눈 회귀선의 변화율입니다. known_y's는 종속 데이터 요소의 셀 배열 또는 범위입니다. known_x's는 독립 데이터 요소의 집합입니다.
Example) =SLOPE(A1:A50;B1:B50)
STEYX(known_y's, known_x's)
회귀 분석에서 각각의 x에 대하여 예측한 y 값의 표준 오차를 반환합니다. 표준 오차는 각각의 x 값에 대한 y 예측값의 오차량을 나타냅니다. known_y's는 종속 데이터 요소의 배열이나 범위입니다. known_x's는 독립 데이터 요소의 배열이나 범위입니다.
PERMUT(Count1; Count2)
주어진 숫자에 대한 순열(permutation)을 구한다. 참고로 순열은 뽑는 순서가 있고, 조합(combination)은 뽑는 순서가 없다. Count1은 대상의 전체 숫자이다. Count2는 뽑는 숫자이다.
E1) =PERMUT(6;3)은 120을 반환한다.
E2) =PERMUT(5;2)은 20을 반환한다. 5개의 카드 중 2개의 카드를 뽑는 순서는 20가지의 다른 가능성이 존재한다. 순열 공식은 nPr = n! / (n-r!)이다. 5P2 = 5! / (5-2)! = 5x4x3x2x1 / 3x2x1 = 5x4 = 20이다.
PERMUTATIONA(Count1; Count2)
주어진 숫자에 대한 순열을 구하지만 반복을 허용한다. 즉, 중복 순열을 구한다. Count1은 대상의 전체 숫자이다. Count2는 뽑는 숫자이다.
E1) =PERMUTATIONA(6;3)는 216을 반환한다. 6개의 카드 중 3개의 카드를 뽑는데 다음 카드를 뽑기 전에 이전의 카드를 다시 카드 통에 돌려놓으면 216가지의 다른 경우의 수가 존재한다.
E2) =PERMUTATIONA(11;2)은 121을 반환한다. 11개의 전체 대상 중 얼마나 자주 2개의 대상이 뽑히나?
COMBIN(Count1; Count2)
주어진 숫자에 대한 조합(combination)을 구한다. Count1은 대상의 전체 숫자이다. Count2는 뽑는 숫자이다.
COVARIANCE.P(array1,array2)
두 데이터 집합의 각 데이터 요소 쌍에 대한 편차의 곱의 평균(모집단 공분산)을 반환합니다. 공분산을 사용하면 두 데이터 집합 사이의 관계를 확인할 수 있습니다. 예를 들어 수입이 높을수록 교육 수준이 높은지 여부를 확인할 수 있습니다. array1은 첫 번째 정수 셀 범위입니다. array2는 두 번째 정수 셀 범위입니다.
예) =COVARIANCE.P(A1:A30;B1:B30)
COVARIANCE.S(array1,array2)
두 데이터 집합의 각 데이터 요소 쌍에 대한 편차의 곱의 평균(표본 공분산)을 반환합니다. array1은 첫 번째 정수 셀 범위입니다. array2는 두 번째 정수 셀 범위입니다.
CORREL(Data1; Data2)
두 데이터 세트의 상관 계수(correlation coefficient)를 반환한다. 상관 계수를 사용하면 두 속성 사이의 관계를 확인할 수 있습니다. 예를 들면 어떤 지역의 평균 기온과 에어콘 사용 사이의 상관 관계를 알아볼 수 있습니다. Data1 is the first data set. Data2 is the second data set.
Example) =CORREL(A1:A50;B1:B50) calculates the correlation coefficient as a measure of the linear correlation of the two data sets.
PROB(x_range, prob_range, [lower_limit], [upper_limit])
영역 내의 값이 두 한계값 사이에 있을 확률을 반환합니다. upper_limit가 정의되지 않으면 x_range의 값이 lower_limit와 같을 확률이 반환됩니다. x_range는 필수 요소입니다. 확률과 관련된 숫자 x 값의 범위입니다. prob_range도 필수 요소입니다. x_range의 값과 관련된 확률의 집합입니다. lower_limit는 선택 요소입니다. 확률을 계산할 범위의 하한값입니다. upper_limit도 선택 요소입니다. 확률을 계산할 범위의 상한값입니다.
KURT(Number1; Number2; ...Number30)
데이터 세트의 첨도(kurtosis)를 반환한다. 최소한 4개의 값이 필요하다. Number1,Number2,...Number30 are numeric arguments or ranges representing a random sample of distribution.
Example) =KURT(A1;A2;A3;A4;A5;A6)
SKEW(Number1; Number2; ...Number30)
표본(sample) 분포의 왜도(skewness, 왜곡도)를 구한다. 왜곡도란 평균에 대한 분포의 비대칭 정도를 나타냅니다. 왜곡도가 양수이면 분포의 비대칭 꼬리가 양의 값 쪽으로 치우치며, 왜곡도가 음수이면 음의 값 쪽으로 치우칩니다.
Example) =SKEW(A1:A50)
SKEW.P(number 1, [number 2],…)
모집단을 기준으로 분포의 왜도를 반환합니다. 왜곡도란 평균에 대한 분포의 비대칭 정도를 나타냅니다. number 1, number 2,…는 모집단 왜곡도를 구하려는 1~254개의 숫자이거나 숫자가 들어 있는 이름, 배열 또는 참조입니다. MS Excel에서는 skew.p 함수를 쓰고, LibreOffice Calc에서는 SKEWP 함수를 쓴다.
E1)SKEWP(2;3;1;6;8;5) returns 0.2828158928
E2) SKEWP(A1:A6) returns 0.2828158928, when the range A1:A6 contains {2;3;1;6;8;5}
E3) SKEWP(Number1;Number2) returns zero always, if Number1 and Number2 results in two numbers.
E4) SKEWP(Number1) returns Err:502 (Invalid argument) if Number1 results in one number, because SKEWP cannot be calculated with one value.