[빅분기] 빅데이터 분석 방법론
빅데이터를 분석하기 위해 문제를 정의하고 답을 도출하기 위한 체계적인 절차와 처리 방법 구성요소 : 절차, 방법, 도구와 기법, 템플릿과 산출물 계층 단계 : 프로세스 그룹을 통하여 완성된 단계별 산출물이 생성, 기준선으로 설정 관리하며, 버전 관리 등을 통한 통제 태스크 : 단계를 구성하는 단위 활동, 물리적 또는 논리적 단위로 품질 검토의 항목 스텝 : 입력 자료, 처리 및 도구, 출력 자료로 구성된 단위 프로세스 분석절차 분석 기획 비즈니스 이해 및 범위 설정 : 프로젝트 진행을 위해 비즈니스에 대한 충분한 이해와 도메인 문제점을 파악하고 업무 매뉴얼 및 업무 전문가 도움 필요하며, 구조화된 명세서를 작성한다. 프로젝트 정의 및 계획 수립 : 모델의 운영 이미지를 설계하고 모델 평가 기준을 설정, ..
2022. 8. 28.
[빅분기]데이터 분석 계획
데이터 분석 로드맵 분석 단계별로 추진하고자 하는 목표를 명확히 정의하고, 선 후행 단계를 고려해 단계별 추진내용을 정렬하는 종합적인 계획 분석 로드맵 단계 데이터 분석체계 도입 : 분석 기회 발굴, 분석 과제 정의, 로드맵 수립하여, 비즈니스 약점이 무엇인지 분석 과제를 정의하고 로드맵 수립 데이터 분석 유효성 검증 : 분석 알고리즘 설계, 아키텍처 설계, 분석 과제 파일럿 수행하여, 분석 과제에 대한 파일럿을 수행하거나 유효성, 타당성, 기술 실형 가능성을 검증하여 분석 알고리즘 및 아키텍처 설계를 한다. 데이터 분석 확산 및 고도화 : 변화관리, 시스템 구축, 유관 시스템 고도화를 하여, 검증된 분석 과제를 업무 프로세스에 내재화하기 위한 변화관리를 실시하여 빅데이터 분석, 활용 시스템 구축 및 유..
2022. 8. 28.
[빅분기] 빅데이터 기술
빅데이터 플랫폼 빅데이터에서 가치를 추출하기 위해 일련의 과정(수집 -> 저장 -> 분석 -> 활용)을 규격화한 기술 특화된 분석을 지원하는 빅데이터 플랫폼이 발전하는 추세 (예 : 의료, 환경, 범죄, 자동차 등) 빅데이터 플랫폼 구성요소 데이터 수집 : 원천 데이터의 정형, 반정형, 비정형 데이터 수집(ETL, 크롤러, EAI 등) 데이터 저장 : 정형 데이터, 반정형 데이터, 비정형 데이터 저장(RDBMS, NoSQL 등) 데이터 분석 : 텍스트 분석, 머신러닝, 통계, 데이터 마이닝(SNS분석, 예측 분석 등) 데이터 활용 : 데이터 가시화 및 BI, Open API 연계 하둡 에코 시스템(Hadoop Ecosystem) 하둡 프레임워크를 이루고 있는 다양한 서브 프로젝트들의 집합 수집, 저장, ..
2022. 8. 28.
[빅분기] 빅데이터 조직 및 구성
빅데이터 업무 프로세스 빅데이터 도입 단계 : 빅데이터 서비스를 제공하기 위해서는 빅데이터 시스템 구축을 위한 빅데이터 도입 기획, 기술 검토, 도입 조직 구성, 예산 확보 등을 수행 빅데이터 구축 단계 : 빅데이터 플랫폼을 구축하기 위해서는 요구사항 분석, 설계, 구현, 테스트 단계를 수행 빅데이터 운영 단계 : 빅데이터 시스템의 도입 및 구축이 끝나면, 이를 인수하여 운영 계획을 수립. 빅데이터 플랫폼 운영, 데이터 및 빅데이터 분석 모델 운영, 빅데이터 운영 조직, 빅데이터 운영 예산 고려 조직 구조 설계의 요소 업무 활동 : 조직의 미션과 목적을 달성하기 위하여 과업 수행을 위해 수직 업무 활동과 수평 업무 활동으로 구분 수직 업무 활동 : 경영 계획, 예산 할당 등 우선순위를 결정 수평 업무 활..
2022. 8. 28.