(MySQL) NoSQL과 MySQL의 차이점


참고: http://joshuayoon705.tistory.com/28


데이터베이스 확장

하나의 데이터베이스로 다룰 수 없을 만큼 많은 데이터를 저장하고 조회하려면 당연히 여러 데이터베이스를 이용하는 방식을 모색해야 할 것이다. Cassandra나 Dynamo처럼 분산 환경을 고려하여 만들어진 데이터베이스도 있지만, 범위 검색에 취약하거나 JOIN 연산을 사용할 수 없는 등 기능에 제약이 많다. 따라서 상대적으로 풍부한 기능을 사용하면서 데이터 확장을 꾀할 수 있는 방법은 RDBMS를 샤딩(sharding)하여 사용하는 것이 유리하다.

****
지금까지의 RDB에서는 정규화라는 이름의 과정을 거친 정형화된 데이터를 보관해두고 SELECT라는 엄청난 부가적인 기능을 제공하는 쿼리문을 사용하여 자신이 원하는 다양한 형태로 데이터를 가져올 수 있었습니다. 하지만 카산드라는 조금 예시가 다릅니다. 카산드라는 항상 원하는 형태로 데이터를 이미 보관하고 있다가 있는 그대로를 꺼내주게 됩니다. 이러한 형태의 설계가 가능한점은 카산드라는 읽기보다 쓰기가 더 빠르기 때문입니다. 쓰기가 엄청나게 빠르게 때문에 읽기 쉬운 형태로 데이터를 가공하여 저장을 해둔후에 그대로 꺼내 쓰기 때문에 결과적으로 읽기에도 엄청나게 큰 이득을 얻게 됩니다.
결과적으로 카산드라는 인덱스 생성킷이 됩니다. 이것이 무슨말이냐 하면 쓰기가 유용하기 때문에 언제든지 읽고 싶은 형태로 저장을 해도 됩니다. 언제 어떻게 쓰일지 모르는 RDB의 인덱스들에 비해서는 설계를 어떻게 하느냐에 따라 엄청나게 큰 효과를 얻을 수 있습니다.

댓글

이 블로그의 인기 게시물

(18장) WebSocekt과 STOMP를 사용하여 메시징하기

(C++) new를 통한 객체 생성 vs 그냥 객체 생성

(네트워크)폴링방식 vs 롱 폴링방식