안드로이드는 전자양의 꿈을 꾸는가

빅 데이터(big data)

빅데이터 2016. 2. 23. 09:40

빅 데이터(영어: big data) : 기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합[1] 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다.

컴퓨터의 저장 용량 단위

이름	기호	2진 기준	값 (Byte)
킬로 바이트 (kilo byte)	KB	2¹⁰ Byte	1,024 Byte
메가 바이트 (mega byte)	MB	2²⁰ Byte	1,048,576 Byte
기가 바이트 (giga byte)	GB	2³⁰ Byte	1,073,741,824 Byte
테라 바이트 (tera byte)	TB	2⁴⁰ Byte	1,099,511,627,776 Byte
페타 바이트 (peta byte)	PB	2⁵⁰ Byte	1,125,899,906,842,624 Byte
엑사 바이트 (exa byte)	EB	2⁶⁰ Byte	1,152,921,504,606,846,976 Byte
제타 바이트 (zetta byte)	ZB	2⁷⁰ Byte	1,180,591,620,717,411,303,424 Byte
요타 바이트 (yotta byte)	YB	2⁸⁰ Byte	1,208,925,819,614,629,174,706,176 Byte

하둡(Hadoop) : (Big Data, NoSQL, MapReduce)

아파치 하둡(Apache Hadoop, High-Availability Distributed Object-Oriented Platfrm)은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크.

MongoDB

몽고DB(MongoDB←HUMONGOUS)는 크로스 플랫폼 도큐먼트 지향 데이터베이스 시스템이다. NoSQL 데이터베이스로 분류되는 몽고DB는 JSON과 같은 동적 스키마형 문서들(몽고DB는 이러한 포맷을 BSON이라 부름)을 선호함에 따라 전통적인 테이블 기반 관계형 데이터베이스 구조의 사용을 삼간다. 이로써 특정한 종류의 애플리케이션을 더 쉽고 더 빠르게 데이터 통합을 가능케 한다. 아페로 GPL과 아파치 라이선스를 결합하여 공개된 몽고DB는 자유-오픈 소스 소프트웨어이다.

CouchDB

CouchDB Apache 프로젝트로 MongoDB와 같은 Document DB의 형태를 띄며, NOSQL CAP이론중 AP 에 해당 한다. (장애에 매우 강하다.) 단 Consistency는 Eventual Consistency를 제공한다. (버전으로 하는 방식), Eventual Consistency 모델이기 때문에 Locking을 사용하지 않는다.

Cassandra

카산드라는 구글의 BigTable 컬럼 기반의 데이타 모델과 FaceBook에서 만든 Dynamo의 분산 모델을 기반으로 하여 제작되어 Facebook에 의해 2008년에 아파치 오픈소스로 공개된 분산 데이타 베이스. 기존의 관계형 데이타 베이스와 다르게 SQL을 사용하지 않는 NoSQL의 제품중의 하나이며, 대용량의 데이타 트렌젝션에 대해서 고성능 처리가 가능한 시스템이다.(High-Scale). 노드를 추가함으로써 성능을 낮추지 않고 횡적으로 용량을 확장할 수 있다.