데이터정제2 빅데이터분석기사-part 02빅데이터 탐색- chapter 01 데이터 전처리 section 01 데이터 정제 *평균 대치법-추정량 표준오차의 과소 추정을 보완하는 대치법으로 Hot-deck 방법이라고 한다 *단순확률 대치법 *이상치-비무작위성을 가지고 나타나게 되면 데이터의 정상성 감소를 초래하며 이는 데이터 자체의 신뢰성 저하로 연결될 가능성이 있다. 2022. 7. 18. 빅데이터분석기사-part 01 빅데이터 분석기획- chapter 02 section 02 분석 작업 계획 신뢰성 높은 데이터 분석모형 3가지 데이터셋,훈련데이터,검증데이터,테스트데이터,외부 데이터 모집 수집,비용을 고려,저장할 방법,내부 데이터와의 결합 가능성여부 검토,데이터 확보 계획 수립 시 분석변서 점검항목,데이터 가용성,데이터 적정성,기술적 타당성,생성분석 변수 전처리 방법,데이터 정제,데이터 통합,데이터 변환,데이터 축소,빅데이터 주요 품질 지표,정확성,완전성,적시성,일관성,일반적인 데이터 분석 절차 순서대로 나열,문제 인식,연구조사,모형화,데이터 수집,데이터 분석,분석 결과 제시,작업분할구조(WBS)수립 절차,프로젝트 소요비용 배분,프로젝트 작업분할구조 수립,프로젝트 업무 분장 계획 및 배분 2022. 7. 5. 이전 1 다음