티스토리 뷰
반응형
안녕하세요. 인포믹스에는 과거 7.31 버전부터 분산을 계산하는 함수를 제공해왔습니다.
다른 DBMS에도 대부분 기본적으로 제공되는데 차이점을 비교해보고자 합니다.
인포믹스 7.31의 매뉴얼을 살펴보면 VARIANCE를 계산하는 공식이 설명되어 있습니다.
variance of the population이라고 설명하고 있는데요. 우리나라 수학 용어로는 '모분산'이라고 합니다. 모분산을 계산할 때는 데이터의 갯수(N)만큼을 나누게 되지만 여기서는 N-1로 나눈다고 나와있습니다.
이 내용은 현재 인포믹스의 최신 버전인 14.1에서도 동일하게 설명되어 있습니다. 내용이 잘못된 것인지 이런 계산식으로 써도 문제가 없는 것인지는 잘 모르겠습니다.
어쨌든 DBMS마다 분산을 계산하는 함수가 다른 것 같습니다. 제가 알고있는 DBMS 별로 비교를 해봤습니다.
모분산 | 표준분산 | |
ORACLE | VAR_POP | VARIANCE / VAR_SAMP |
SQL SERVER | VARP | VAR |
INFORMIX | VARIANCE | VARIANCE*COUNT(N)/(COUNT(N)-1) |
DB2 | VAR / VARIANCE / VAR_POP | VARIANCE_SAMP |
DBMS가 바뀌면 고려할 사항이겠네요.
반응형
댓글
링크
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday