본문 바로가기
my_lesson/_R_컴퓨팅

R_컴퓨팀 - R 기본 명령어

by boolean 2019. 2. 4.
728x90

R_컴퓨팀 - R 기본 명령어

Package 설치

install.packages("package_name")
EX) R commander라는 package를 설치 한다면 R을 구동시킨후 console창에 다음을 입력한다.
install.packages("Rcmdr")   // 팝업창 뜨면 가까운 미러 사이트 선택
library(Rcmdr)                 // Rcmdr 실행

R commander는 SDI환경이 적절하므로 R 의 실행환경을 MDI(Multiple document interface가 아닌 SDI(Single document interface)로 바꾸어준다.

RStudio를 관리자 권한으로 실행한 후 R이 설치된 폴더 아래 etc라는 폴더로 이동하여 Rconsole이라는 파일을 열고 Style부분을 아래와 같이 수정한다.

## Style

# MDI = yes             // 이 부분 주석처리

   MDI = no


기본 함수들 

*파란색은 스크립트, 검정색은 결과값입니다


 print()

 변수에 있는 값을 확인 

 예) a <- 1      

     print(a)      

     [1] 1

 save()
 외부 .RData파일로 현재 생성한 R 객체를 저장함 
 예) a <- save(a, file="C:/adata.RData")

 rm()

 생성된 R 객체 삭제 

 예) rm(a)

 load()

 외부에 저장된 .RData파일에서 R 객체를 읽어와 메모리에  올림

 예)  load("C:/adata.RData")

       print(a)

       [1] 1

 write.csv()

 외부 csv파일로 현재 객체를 data frame형태로 변형하여  저장

 예) write.csv(a, file="c:/adata.csv")

 read.csv()
 외부 csv파일 데이터를 data frame형태로 읽어와 메모리에  올림
 예) a <- read.csv("c:/adata.csv")

 str()

 R 객체의 구조 표현함

 예) str(a)

      num 1

 summary()

 최소값, 최대값, 중간값, 평균값 등을 계산해줌 

 numeric vector만 가능

 예) a <- c(1:3)

       summary(a)

       Min. 1st Qu. Median Mean 3rd Qu. Max.

        1.0    1.5         2.0      2.0       2.5     3.0

 boxplot()

 변수의 범위와 쏠림을 다른 변수와 비교 표현

 예) a <- c(1,2,3)

       boxplot(a)

  



 hist() 

 numeric vector에 대해 히스토그램을 그려줌

 예) a<-c(1,2,3)

       hist(a)

  



 var()

 평균 주변으로 널리 퍼진 데이터를 의미함

 예) a <- c(1,2,3,4)

      var(a)

      [1] 1.666667

 sd()  

 값이 얼마나 다른가를 의미함

 예) a <- c(1,2,3,4)

      sd(a)

      [1] 1.290994

 table() 

 일원배치표 입력한 항목의 빈도수를 계산해줌

 예) names <- c("Yoon","Kim","Park")

       genders<- factor(c("Male","Female","Male"))

       subjectDF <- data.frame(names,genders)

       table(subjectDF$genders)

       Female  Male

                1        2

 prop.table()
 일원배치표, 입력한 항목의 빈도를 %로 계산해줌

 예) names <- c("Yoon","Kim","Park")

       genders<- factor(c("Male","Female","Male"))

       subjectDF <- data.frame(names,genders)

       model_table M <- table(subjectDF$genders)

       prop.table(model_table)

       Female   Male

       0.3333  0.6666

 plot()

 R 객체의 데이터를 x y 좌표상의 점으로 시각화

 예) eng <- c(80,90,100)

      math<-c(75,85,95)

      subjectDF1 <- data.frame(eng,math)

      plot(subjectDF1$eng, subjectDF1$math)



 head()

 벡터, 매트릭스, 테이블, 데이터 프레임 등의 첫번째 6 라인  

 보여줌

 예) head(iris)

Sepal.Length Sepal.Width Petal.Length Petal.Width Species

  1          5.1         3.5          1.4         0.2  setosa

  2          4.9         3.0          1.4         0.2  setosa

  3          4.7         3.2          1.3         0.2  setosa

  4          4.6         3.1          1.5         0.2  setosa

  5          5.0         3.6          1.4         0.2  setosa

  6          5.4         3.9          1.7         0.4  setosa


 tail()
 뒤에서부터 6개 데이터 보여줌

 install.package()

 4200여개의 다양한 패키지들을 선택하여 다운받는 함수

 예) install.package("gmodels")

 library()
 다운 받은 패키지를 사용하기 위해 쓰는 함수

 예) library(gmodels)

 typeof()

 데이터 형태 확인

 예) x<-3 

     typeof(x)

     "double"

 class()
 객체지향 관점에서 데이터 형태 확인

 예) x<-3

      class(x)

      "numeric"

 is.integer()

 데이터가 정수형인지 확인

 예) is.integer(x)

     FALSE

 as.integer()
 원하는 데이터형으로 형변환

 예) typeof(as.integer(x))

     "integer"

 ls()
현재 메모리에 올려져있는 변수 목록 확인

 예) ls()

     "x"

 sum()

전달인자의 합 계산

예) sum(c(1,2,3))

     6

 seq() , 1:5
 일정하게 증가하는 데이터 생성

 예) seq(from=1, to=10, by=2)

     1 3 5 7 9

     1:5

     1 2 3 4 5

 help() 또는 ?
 함수들의 정보를 표현해줌

 help.search() 또는 ??

 해당 키워드를 쓰는 함수들 찾아줌

 예) help(seq) 또는 ?seq 또는 help(package ="datasets")

      helphearch("mean") 또는 ??mean

 R 스튜디오의 Help 탭 본인 PC의 웹브라우저가 열리며 도움말

 example()

 해당 키워드를 사용하는 예제 찾아줌

 예) example("mean")

     mean> x <- c(0:10, 50) 

     mean> xm <- mean(x) 

     mean> c(xm, mean(x, trim = 0.10)) 

     [1] 8.75 5.50

 c()

 combine, 기존 벡터를 결합하여 새로운 벡터를 생성하는 함수

 예) c(1, 2, c(3, 4))

       1, 2, 3, 4

 rep()

 벡터를 반복시켜 새로운 벡터를 생성

 예) x <-c(1,2,3)

      rep(x, times=2)

      1 2 3 1 2 3

      rep(x, each=2)

      1 1 2 2 3 3

 names()

 벡터의 이름을 확인하거나 수정함

 예제) height <- c(80,90,100)

        names(height) <- c("A", "B", "C")

        height

        A B C

        80 90 100

        names(height)

        "A" "B" "C"

 sample()

 랜덤수

 예제) sample(45, 6)

         7 35 43 21 24 5

         sample(10, 3, prob=(1:10)/55)

         5 2 10

 sort()
 정렬해줌

 예제) sort(sample (45, 6)

          5 7 21 24 35 43 

 length()

 벡터의 원소 갯수

 예제) x<-c(1,2,3) 

         length(x)

         3

 which()

 조건에 맞는 벡터의 원소 인덱스를 알려줌

 예제) x<- c(1,2,3,4)

          which(x>2)

          3 4

* 위 명령어들을 테스트하기 위해서는 예)에 들어있는 변수 선언 및 데이터 할당을 순서대로 입력해야 합니다.



출처: https://pubdata.tistory.com/24 [Practical Understanding of Data & Dev.]

댓글