본문 바로가기

전체 글23

[빅분기] 데이터 유형 및 비식별화 데이터 유형 구조 관점 정형 데이터 : 정형화된 스키마 구조기반의 형태를 가지고 고정된 필드에 저장되며 값과 형식에서 일관성을 가지는 데이터로 컬럼과 로우 구조를 가지며, 설계된 구조 기반 목적에 맞는 정보들을 의미한다. 반정형 데이터 : 스키마 구조 형태를 가지고 메타데이터를 포함하며, 값과 형식에서 일관성을 가지지 않는 데이터로서 XML, HTML과 같은 웹 데이터가 Node 형태의 구조를 가짐 비정형 데이터 : 스키마 구조 형태를 가지지 않고 고정된 필드에 저장되지 않는 데이터로 텍스트, 이미지, 오디오, 비디오 등이 있다. 시간 관점 실시간 데이터 : 생성된 이후 수 초~수 분 이내에 처리되어야 의미가 있는 현재 데이터 비실시간 데이터 : 생성된 데이터가 수 시간 또는 수 주 이후에 처리되어야 의.. 2022. 8. 28.
[빅분기] 빅데이터 수집 데이터 수집 유형 내부 데이터 : 조직 내부에 데이터가 위치하며, 데이터 담당자와 수집 주기 및 방법 등을 협의하여 데이터를 수집, 내부 조직 간 협의를 통한 데이터 수집을 통해 주로 수집이 용이한 정형 데이터이며, 서비스의 수명 주기 관리가 용이하다. 외부 데이터 : 조직 외부에 데이터가 위치하며, 특정 기관의 담당자 협의 또는 데이터 전문 업체를 통해 데이터를 수집, 공공 데이터의 경우에는 공공 데이터 포털을 통해 API 또는 파일로 수집, 외부 조직과 협의를 통해 데이터를 구매하거나 웹상의 오픈 데이터를 통한 데이터 수집을 통해 주로 수집이 어려운 비정형 데이터이다. 원천 데이터 내부 데이터 : SCM, ERP, CRM, 포털, 원장정보 시스템, 인증 시스템, 거래 시스템, 백본, 방화벽, 스위치,.. 2022. 8. 28.
[빅분기] 빅데이터 분석 방법론 빅데이터를 분석하기 위해 문제를 정의하고 답을 도출하기 위한 체계적인 절차와 처리 방법 구성요소 : 절차, 방법, 도구와 기법, 템플릿과 산출물 계층 단계 : 프로세스 그룹을 통하여 완성된 단계별 산출물이 생성, 기준선으로 설정 관리하며, 버전 관리 등을 통한 통제 태스크 : 단계를 구성하는 단위 활동, 물리적 또는 논리적 단위로 품질 검토의 항목 스텝 : 입력 자료, 처리 및 도구, 출력 자료로 구성된 단위 프로세스 분석절차 분석 기획 비즈니스 이해 및 범위 설정 : 프로젝트 진행을 위해 비즈니스에 대한 충분한 이해와 도메인 문제점을 파악하고 업무 매뉴얼 및 업무 전문가 도움 필요하며, 구조화된 명세서를 작성한다. 프로젝트 정의 및 계획 수립 : 모델의 운영 이미지를 설계하고 모델 평가 기준을 설정, .. 2022. 8. 28.
[빅분기]데이터 분석 계획 데이터 분석 로드맵 분석 단계별로 추진하고자 하는 목표를 명확히 정의하고, 선 후행 단계를 고려해 단계별 추진내용을 정렬하는 종합적인 계획 분석 로드맵 단계 데이터 분석체계 도입 : 분석 기회 발굴, 분석 과제 정의, 로드맵 수립하여, 비즈니스 약점이 무엇인지 분석 과제를 정의하고 로드맵 수립 데이터 분석 유효성 검증 : 분석 알고리즘 설계, 아키텍처 설계, 분석 과제 파일럿 수행하여, 분석 과제에 대한 파일럿을 수행하거나 유효성, 타당성, 기술 실형 가능성을 검증하여 분석 알고리즘 및 아키텍처 설계를 한다. 데이터 분석 확산 및 고도화 : 변화관리, 시스템 구축, 유관 시스템 고도화를 하여, 검증된 분석 과제를 업무 프로세스에 내재화하기 위한 변화관리를 실시하여 빅데이터 분석, 활용 시스템 구축 및 유.. 2022. 8. 28.