신뢰성 높은 데이터 분석모형 3가지 데이터셋,훈련데이터,검증데이터,테스트데이터,외부 데이터 모집 수집,비용을 고려,저장할 방법,내부 데이터와의 결합 가능성여부 검토,데이터 확보 계획 수립 시 분석변서 점검항목,데이터 가용성,데이터 적정성,기술적 타당성,생성분석 변수 전처리 방법,데이터 정제,데이터 통합,데이터 변환,데이터 축소,빅데이터 주요 품질 지표,정확성,완전성,적시성,일관성,일반적인 데이터 분석 절차 순서대로 나열,문제 인식,연구조사,모형화,데이터 수집,데이터 분석,분석 결과 제시,작업분할구조(WBS)수립 절차,프로젝트 소요비용 배분,프로젝트 작업분할구조 수립,프로젝트 업무 분장 계획 및 배분
분석작업 계획 수립을 위한 작업분할구조도 작성절차,데이터 분석과제 정의,데이터 준비와 탐색,데이터 분석 모델링 및 검증,산출물 정리,분석목표정의서 구성요소,원천 데이터 조사,분석 방안 및 적용 가능성 판단,성과평가 기준,분석 프로젝트가 갖는 속성,데이터 크기,데이터와 분석 모형의 복잡도,속도,정확도,정밀도,내부 데이터를 수집하고자 할때 고려해야 할 내용,데이터 목록을 작성,관련 법률적인 요소들을 확인,개인정보일 경우 비식별 조치방안을 고려,분석 변수 생성 프로세스 정의,객관적 사실 기반의 문제 접근이 필요,데이터의 상관관계 분석이 필요,프로토타입을 통한 분석 변수 접근이 필요,생성된 분석 변수의 정제를 위한 점검항목 중 데이터 정합성 관련항목,데이터 중복,분석 변수별 범위,분석 변수별 연관성,생성된 분석 변수의 정제를 위한 점검항목 중 데이터 수집관련 항목,데이터 적정성,데이터 가용성,대체 분석 데이터 유무,생성 변수의 검증 방안 수립 과정에서 데이터 검증체계 수립과 관련된 내용,수집한 데이터의 출처가 명확한지 검증,데이터 관리 대상 선별을 검증,주요 품질 지표를 분석 및 검증분석목표정의서 성과평가 기준 중 정성적 평가와 관련된 내용,분석 기법이나 기술의 활용 가능성 평가,신규 데이터나 외부 데이터의 활용 가능성 평가,세분화나 군집를 통해 집단을 선정,분석목표정의서 성과평가 기준 중 정량적 평가 관련,기존 방법 대비 효과의 증감 비율을 평가,유효한 가설의 수나 목표 대비 증감 비율을 평가,데이터 모형의 정확도를 측정하여 평가,정확도 정밀도,정확도는 모형과 실제값 사이의 차이를 측정하는 지표,정확도 정밀도 높은 모델은 편향과 분산 모두 낮음,정밀도는 모형을 계속하여 반복했을때 결과의 일관성을 측정하는 지표,정확도와 정밀도는 Trade off인 경우가 많다,정확도는 낮지만 정밀도가 높은 모델의 특징,예측값들의 실제값과 멀리 떨어져 있지만 예측값끼리는 모여있다,분석 프로젝트의 영역별 관리 항목 중 조달 관리와 관련된 내용,상황에 따라 분석 프로젝트 목적에 적합한 범위 내에서 외부에 아웃소싱을 수행할 수 있다.