일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- R배열 #2차원 #3차원 #행렬추가 #행렬조회 #배열조회
- R데이터분석 #R스튜디오 # 코딩 #빅데이터 #AI #인공지능
- HTML
- 벡터 #숫자형벡터 #문자형벡터 #논리형벡터 #범주형자료
- 백엔드 #서버띄우기 #express #프레임워크 #http #node.js #javascript #server
- elice #엘리스코딩 #체셔의 퀴즈 #알고리즘 #기초 #초급 #조건문 #객체지향 #참거짓명제
- r스튜디오설치 #r스튜디오환경설정 #r데이터분석
- 백엔드 #개발자 #풀스택 #백엔드개발자 #풀스택개발자 #직무 #직무탐구 #방향성 #목표 #자격요건 #주요업무 #화이팅 #2023
- node.js #mvc #최적화
- 리스트 #데이터프레임
- RSTUDIO 단축키 #단축키
- R스튜디오 기초 #빅데이터 #데이터프레임 #R평균함수
- R행렬
Archives
- Today
- Total
7l log
[R데이터분석] 데이터 분석 단계 본문
R데이터분석
데이터 분석과정 : 데이터분석 설계, 데이터 준비, 가공(전처리), 분석, 결론 도출
1. 데이터 분석설계- 기획. (제일 중요) 일종의 시나리오
내가 정한 가설이 포함된 분석설계
주제에 대한 내용이 명확해야함. / 주제에 대한 가설검증, 설정부분 필요/ 분석가능 변수, 파생변수 함께 고려/ 분석항목 결정
2. 데이터 준비
시간이 많이 듬,,
필요한 데이터를 찾아 직접 입력하여 생성하거나 (data.frame 등)
기존데이터 사용,(제공되는 txt, csv파일, 엑셀, 제이슨데이터 등)
웹페이지에서 긁어옴(웹크롤링, 웹스크래핑) api를 통해서,, 서울시에 자료요청시 ‘테스트목적’으로 작성해야 허가가 남. 나중에 서비스 하고 싶을 때 서비스하겠다고 말하기.
ex) 지하철종결자
말뭉치 nlp
3. 데이터 가공
raw data(백업중요*) 가공 필요한 변수값만 뽑아내기
데이터 세트(테이블)
단계별로 파일이 있어야 함.
협업단계: 수집, 전처리/ 가공/ 분석/ 시각화
4.데이터분석
*이상치 파악
시각화
5. 결론도출
처음부터 메모해놓고 , 시각화 작업 만들어놓으면 편함
출처 작성
데이터수집과정은 말로 설명해도 됨(ex. 통계청API를 사용했습니다)
시각화자료는 최대 3개 이상이면 설득력이 없어짐
이런결론을 내렸다. 라는 것이 결론도출
간단요약 보고서는 간단하게.
'2022' 카테고리의 다른 글
[R데이터분석] 벡터 (0) | 2022.04.24 |
---|---|
[R데이터분석] 데이터 (0) | 2022.04.24 |
[R데이터분석] R Studio 단축키 (0) | 2022.04.24 |
[R데이터분석] R 커뮤니티, 데이터수집 사이트 (0) | 2022.04.24 |
[R데이터분석] RStudio 환경설정 (0) | 2022.04.24 |
Comments