본문 바로가기

728x90

study/빅데이터 분석

(6)
[R프로그래밍] #6. 외부파일 읽어오기 외부파일 읽어오기 1. scan() 함수 외부파일을 읽어들임 scan('파일명',what) #what -> 문자열 인 경우 "", 또는 'char'이라고 입력해줘야 인식가능(what="char") #sep="," --> sep는 구분자 / 쉼표로 구분되어있다. #예시 setwd("C:\\Users\\이정민\\Desktop\\R\\자료") #작업 디렉토리 미리 설정 a
[R프로그래밍] #5. 조건제어문, 함수 조건문 1. if 조건에 따라 문장을 선택적으로 실행 if (조건식) { 참일 때 수행할 문장 } else { 거짓일때 수행할 문장 } if (조건식) { 참일 때 수행할 문장 } else if { 앞 문장이 거짓일때 수행할 문장 } else { 모두 거짓일때 수행할 문장 } 2. ifelse 다수의 데이터에 대한 조건을 한꺼번에 처리할 때 사용 벡터의 경우 if문을 그대로 사용한다면 첫번째 요소에만 적용하여 실행 ifelse (조건대상,참일때 실행문장,거짓일때 실행문장) ifelse(조건식,참,ifelse(조건식,참,거짓)) #으로도 사용 가능 반복문 1.for 한 개 이상의 문장을 특정횟수만큼 반복처리 형식 for (변수명 in 반복횟수){ 반복할 실행 문장 } 2. while 조건이“참”인 동안 블..
[R프로그래밍] #4. 자료형-2 (list, matrix), 데이터프레임 리스트(List) - 숫자형,문자형 데이터를 섞어서 저장이 가능 - 벡터와 같이 인덱스 번호로 내부 데이터 접근이 가능 - 리스트 안에 벡터형 데이터도 추가 가능 list(키1=값1, 키2=값2, ...) #해당 키에 값을 할당 #키 없이 값만 넣어도 가능 변수명$추가할key 행중심으로 기록하기를 원한다면 byrow=TRUE 추가 - 행렬의 이름 추가 --> dimnames(행렬) rbind(행렬, 행에 추가할 원소) 2. 열 추가 --> cbind(행렬, 열에 추가할 원소) matrix(행렬의 구성 원소, nrow=행의 개수, ncol=열의 개수, dimnames=행렬의 이름) #열중심(column-major order) #행중심으로 원소를 기록하고 싶을 때 --> matrix(행렬의 구성 원소, nr..
[R프로그래밍] #3. 산술연산자, 변수, 자료형-1 R의 산술연산자 - +(더하기), -(빼기), *(곱하기), /(나누기 - 실수, 정수) - %/% : 정수 나눗셈을 할 때 몫만 출력 - %%(나머지) : 나머지 값 계산 - ^ 또는 ** : 제곱 R의 변수 - 값을 저장하기 위한 메모리 공간을 확보하여 변수명(식별자)을 붙인 것 - 형식 : 변수명 벡터 , c함수 사용 R의 자료형(data type) 정수 : 1, 2, 3, 4, ... 실수 : 5.8, 7.7777, 123.45, ... 문자열 : "안녕", "반가워", ... 진릿값 : TRUE, FALSE 날짜/시간 : "2020-02-22", ... Sys.Date() : 시스템 날짜를 표시하기 위한 함수 as.Date(변수명) : 문자열 데이터 값을 날짜형으로 변환해준다. : Not Ava..
[R프로그래밍] #2. R 패키지 설치 패키지(Package) : 함수, 데이터, 컴파일된 코드 등을 모아놓은 프로그램을 의미 - base packages : 자동으로 설치가 되어 기본적인 통계분석과 그래프 작성, 데이터 처리 등에 즉시 사용 - Recommended packages : 자동으로 설치되지만, 사용시 R로 불러오기 명령 실행해야 함 - 그외 packages - 통계분석 목적/필요에 따라 설치하고 R로 불러오기 명령 실행하여 사용 ( C:\Program Files\R\R-4.1.0\library 에서 현재 설치되어있는 라이브러리들을 확인할 수 있다. ) The Comprehensive R Archive Network (r-project.org) 접속해서 왼쪽 하단의 Packages 클릭, Table of available pack..
[R프로그래밍] #1. R프로그래밍 정의 및 특징, R 설치, JDK 설치 R Program Language - 뉴질랜드의 로버트 젠틀맨(Robert Gentleman)과 로스 이하카(Ross Ihaka)에 의해 시작 - S 언어와 함수형 언어 Scheme의 영향을 받았다. - 통계 소프트웨어 개발과 자료분석에 널리 사용된다. - 인터프리터형 언어이므로 1라인씩 처리한다. 더보기 인터프리터(interpreter) : 고급언어로 작성된 소스프로그램 명령문들을 한번에 한 줄씩 읽어 들여서 실행하는 프로그램 한줄씩 곧바로 실행 시킨다 --> 대화식 언어 (원래 속도가 느렸으나 지금은 개선되어 빅데이터를 처리할 수 있는 속도라고 한다.) R 설치 과정 (window) (R Studio가 아닌 R을 설치해줬다. 동일한 프로그램인데 R studio가 좀 더 사용하기 편리하게 만들어진듯....

반응형