
주어진 문장에서 띄워쓰기에 의해 구분되는 단어의 개수를 알아보고자 한다. stringr 패키지 사용library(stringr) 단어의 수를 세기 위해 가장 간단하게 정규표현식을 사용하여 구할 수 있다.sentence 정규표현식 \\S+의 의미\\S+는 정규표현식(regular expression)에서 사용되는 패턴이다.의미:\\S : 공백이 아닌 문자(Non-whitespace character)를 의미+ : 바로 앞의 패턴이 1회 이상 반복됨을 의미즉, \\S+는 "공백이 아닌 문자가 1개 이상 연속된 부분", 즉 '단어'를 의미 정규표현식을 사용하지 않고 단어 수를 찾기sentence - strsplit(문장, " ")[[1]] [참고]- [1] 은 리스트의 첫 번째 요소를 '리스트'로 꺼내는 것..

2025년 6월 21일(토) - 빅데이터분석기사 실기(R) 10회차 시계열 데이터 처리하기 연월일시(2025.3.24 13:00, 2024.11.15. 10:20, ...등) 에 대하여A지점, B지점... 등 각 지점별 판매 메뉴에 대한 판매금이 기록되어 있다. (아래와 같은 예시)날짜매장메뉴판매금액2024.3.20. 10:24A매장아메리카노44002024.10.15. 14:23B매장라떼5500 위 데이터로부터1. 연월을 구분하여 가장 많이 팔린 달의 매출합계 구하시오.2. 위 문제에서 가장 많이 팔린 달의 2번째로 많이 팔린 메뉴의 매출 합계 구하시오. 먼저 데이터의 날짜가 문자형으로 구성되어 있을때, 날짜 형식으로 바꿔줘야 한다.str(df)str 문을 사용하여 각 변수들의 형식을 파악한다. 변수..

예시)A 고등학교에 1학년 1반부터 5반까지 있다. 각 반에서 국어, 수학, 영어, 사회, 과학 과목에 대한 각 반별 학생들의 점수가 있을때, 문1) 반별 평균점수가 2번째로 높은 반은 어느 반인가 ?문2) 3번째로 높은 반에서 평균점수가 제일 높은 과목의 평균점수는 ? df_raw % group_by(class) %>% summarise(m_class = mean(score))df_classdf_subj % group_by(class, subject) %>% summarise(m_subj = mean(score)) %>% left_join(df_class, by="class") %>% arrange(desc(m_class), desc(m_subj))df_subj 일단 라이브러리 함수로 l..
1. 우선 주어진 데이터의 결측치 등을 확인하기 summary(train)summary(test) 2. 기본적으로 사용하게 될 라이브러리 함수를 불러와 준다.library(dplyr) # 파이프 연산자(%>%)library(caret) # postResample >> RMSE, R2, MSE 를 확인할 수 있다.library(randomForest) # 예측모델 randomForest 사용 3. 환불금액이 없는 경우(결측치)를 0원으로 대체한다. 결측이라고 보기 어렵다.# 환불금액 없는 경우 >>> 0 으로 대체한다train$환불금액 test$환불금액 4. 범주형 자료에 대해 훈련용, 학습용 데이터의 라벨(level)을 맞춰 준다.# train 과 test 의 범주형 자료에 대한 라벨(level)을 맞..
- Total
- Today
- Yesterday
- 클라우드
- git
- OBSIDIAN
- 깃허브
- 빅분기
- markgit
- Raidrive
- Github
- 옵시디안
- Working copy
- 입시결과
- IOS
- 실기 r
- WebDAV
- R
- 옵시디언
- 깃
- tableau
- 실기
- SourceTree
- infinicloud
- 동기화
- 태블로
- Nplayer
- 리모틀리세이브
- 실기r
- 제1유형
- 파이차트
- 빅데이터분석기사
- 깃헙
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |