본문 바로가기

프로그래밍 언어/R

r-ggagi-05-1 확률(Probability) 확률(Probability) 기술통계 : 시각화와 표본 확률 : 모집단 확률 실험 => 확률 변수 => 확률 분포 => 모수 추론 => 검증 => 의미파악 위 과정을 거처 모집단의 특징을 말하는 것 => 추론 통계학은 모두 조사할 수 없는 모집단을 알기 위해 표본을 설명하면서 발전 최근에는 IT 기술 발전으로 큰데이터를 다룰 수 있어 그 의미가 변해 가고 있음 정해진 확률 구하기 확률실험 실험으로 나올 수 있는 결과를 모두 알고 있지만 어떤 결과가 나올지 모르는 실험 동전 던지기 앞면 나올 확률 주사위 던지기 2 나올 확률 표본 공간 확률실험에서 나올수 있는 결과 집합 동전 : {앞면, 뒷면] 주사위 : {1,2,3,4,5,6} 사건 표본 공간에서 알고 싶은 결과 표본 공간의 부분집합 동전던지기 확률실험.. 더보기
r-ggagi-03-1 기술통계 통계로 개념 이해하기 기술통계 데이터를 수학으로 기술하는 것 수치로 특징을 말하는 이유는 정확하기 때문 어떤 사실을 말할 때 높은 설득력 평균(mean) 모든 데이터를 끌어안고 무게중심을 지키는 평균 기호( Summation) 의 정의는 다음과 같다. 모집답 vs 표본 모평균 vs 표본평균 모분산 vs 표본분산 모표준편차 vs 표본표준편차 기술통계에서 말하는 값들은 모두 표본에 해당하는 값 아웃라이어(outlier) 평균을 크게 변하게 만드는 값 아웃라이어를 찾기 위한 그래프 Box Plot 무조건 제거 대상이 아니라 1차적 분석대상 왜 발생했는지와 데이터에 어떤 영향을 미치는 지등 파악 중앙값(median) outlier에 의해 데이터 대표값(평균등)이 많이 변하는 점 보완 [52, 52, 60, 64.. 더보기
R-4.2.1 for Windows 다운로드 4.2.1 버전 다운로드 https://cran.yu.ac.kr/ 패키지 버전 확인 > package_version(R.version) [1] ‘4.2.1’ 더보기
R 기초 문법 벡터 : 동일한 자료형을 갖는 값들의 집합 하나의 속성을 저장하는 단위 파이썬, 자바스크립트 - LIST > 1:5 [1] 1 2 3 4 5 > 10:1 [1] 10 9 8 7 6 5 4 3 2 1 함수형 언어 c(), seq(), rep() > c(1,2,3) +c(4,5,6) [1] 5 7 9 > c(1,2,3,c(4,5,6)) [1] 1 2 3 4 5 6 x라는 변수에 담기, x 실행 > x x [1] 1 2 3 1부터 10까지 홀수만 출력하기(2씩 차이가 나도록) > seq(from=1, to=10, by=2) [1] 1 3 5 7 9 seq(1,10,2) # py range(), np arrange() > odd seq(1,10,2) [1] 1 3 5 7 9 1부터 10까지 3씩 차이가 나도록 .. 더보기