보건 데이터 분석
빅데이터 순환과정
데이터 추출 -> 데이터 저장 -> 분석결과의 시각화 -> 미래행동의 예측 -> 결과의 적용 -> 데이터 추출
정보화시대 저장법 - 관계형/정형 데이터베이스, 데이터웨어하우스
스마트시대 저장법 - 비관계형/비정형 데이터베이스, 가상화, 클라우드 서비스
빅데이터 구성요소 - Volume(규모), Variety(다양성), Velocity(속도), Value(가치), Complexity(복잡성), Veracity(정확성)
빅데이터 기술요소 - 데이터 수집, 원자료 저장, 거래자료 저장, 실시간 분석 플랫폼, 할당분석 실행, 데이터 마이닝 통계툴, 군집관리와 모니터링, 자료의 연속성
빅데이터 활용 가치 - 비용 절감, 의사결정 고도화, 고객성향 신속 파악, 미래예측 정확도 제고, 의미있는 패턴 발견
가트너 제시 3V - Volume, Variety, Velocity
다양성에 초점을 맞추기 보다 적응성을 확보하는 것이 중요
대용량성이 커질수록 적응성도 같이 높아지는 상황에서 빅데이터의 부가가치의 효율성이 높아짐
질병예측 필요성
질병으로 인한 개인/사회적 비용 증가고연령화로 인해 질병으로 인한 기회비용 대응필요건강 및 의료관련 데이터 체계화에 따른 높은 가치창출 기회신산업 육성 및 활용시 세계적 경쟁령 가능성 높음
예측을 위한 활용가능 데이터
건강검진, 진료, 검사, 투약, 건강관리 IoT 및 App
건강보험 청구자료 - 명세서 일반내역, 진료내역, 수신자 상병내역, 처방전교부 상세내역
매출 추이, 평균 진료기간, 비용분석, 확산분석, 투약효과분석, 불법 처방분석
코호트 - 자격 및 보험료 자료, 진료상세 자료, 건강검진 자료
마이크로데이터 - 통계 조사 원자료(Rawdata)에서 조사, 입력 오류 등을 수정한 개별단위(개인, 가구, 사업체 등) 자료
행정데이터 - 객관적인 데이터이지만 변수의 폭이 넓지 않다는 단점
마이크로 데이터 저장자료 - 능동적으로 만들어지는 데이터이므로 보다 주관적인 자료, 경험에 대한 만족도, 장단점 등 행정데이터에서 수집될 수 없는 정보들을 데이터화 할 수 있으나 주관적일 수 있다는 단점
파일시스템
컴퓨터 파일에 이름을 붙이고, 저장 및 검색을 위해 그것들을 어디에 위치시켜야 하는지 등을 나타내는 방법(메타데이터 포함)
개별적 자료처리, 타부서 공유 불가, 자료의 중복 발생, 처리비용 증가, 구조적 결함
데이터베이스
한 조직의 응용 시스템들을 공용하기 위해 통합(integrated)&저장(stored)한 운영(operation) 데이터의 집합
타부서 공유 가능, 자료중복 배제, 분산형, 클라이언트/서버형 DB
데이터웨어하우스(DW), 데이터 마트 등
OLTP(On-Line Transaction Processing)
실시간 요청(생성, 갱신, 삭제)하는 작업을 DB서버가 처리, 그 결과값을 요청자에게 리턴
INSERT, UPDATE, DELETE가 빈번히 일어나 데이터베이스에 최신데이터를 유지, 데이터 무결성을 보장
OLAP(On-Line Analytical Processing)
DW, DB에 저장되어 있는 데이터 분석, 데이터 분석을 통해 사용자들이 의사결정을 할 수 있도록 유의미한 정보를 제공해주는 처리방법
데이터 분석 및 집계를 통해 사용자의 의사결정에 도움을 주는 것이 목적(데이터분석, 데이터 마이닝에 사용)
데이터웨어하우스(DW)
방대한 조직 내에서 분산 운영되는 각각의 DB관리시스템들을 효율적으로 통합하여 조정&관리
경영자의 의사결정을 지원하는 데이터의 집합체(OLAP 데이터의 집합체)
주제 지향적(subject oriented), 통합적(integrated), 시계열적(timevarient), 비휘발적(nonvolatile)
데이터마트
- DW의 한 부분, 특정 사용자의 관심 데이터를 담은 작은 규모의 DW(부서별, 업무 기능별로 구축)
판매 비즈니스 모델 유형
원시 판매 비즈니스 - 가공되기 전의 데이터 판매
가공 판매 비즈니스 - 원시 데이터를 분석&가공하여 필요한 부분만 추출한 데이터 판매
분석 판매 비즈니스 - 원시 데이터를 분석한 데이터 판매
서비스 비즈니스 모델
이상 현지 감지 시나리오 - 업무 발생 이벤트 기록 수집&분석하여 상태 패턴 파악, 새로운 현상 판단
가까운 미래 예측 시나리오 - 예측 시스템을 실현함으로써 현상에 대한 조치를 신속히 실시하기 위함
현 상황 분석 시나리오 - 살펴보지 못한 사업 측면의 분석이 가능해져 현황을 보다 명확히 이해