우아한 Redis - Redis 톺아보기

Computer Science/Seminar

우아한 Redis - Redis 톺아보기

TwinParadox 2021. 11. 28. 21:53

세미나 영상

우아한 Redis

내용 정리

Redis란 무엇인가?

In-Memory Data Structure Store이면서 오픈소스
String, Set, Sorted-Set, Hash, List 등의 타입을 지원한다.
캐시(Cache)로 자주 사용한다.
- Look Aside Cache, 캐시에 자료가 없으면 DB 접근 후 캐시에 갱신한다.
- Write Back, 캐시에 쓰고 이걸 모아서 DB에 저장한다.

Redis에서의 Collection

개발의 편의성을 끌어올리고 난이도를 대폭 낮춰준다.
모든 것들이 그렇듯, 적합한 컬렉션을 고르고 잘 이용하는 것이 무엇보다 중요하다.\
랭킹 서버의 예시
- DB에 넣고 Score를 처리하는 시스템은 유저가 많아진다면?
- Redis를 도입하고 Sorted Set을 사용해서 랭킹 시스템을 구현해낼 수 있다.

Redis의 친구 리스트를 Key-Value로 저장하는 경우
- 서로 다른 클라이언트에서 친구를 추가하는 상황이 있다고 하자.
- 현재 두 클라이언트의 친구 리스트에는 A만 있는데, 각각 B와 C를 추가하면, 최종적으로 A, B, C가 있어야 한다.
- 동시성 이슈가 발생하면, A, B, C가 모두 없을 수 있다.
- 하지만, Redis는 자료구조의 Atomic을 보장하여 Race Condition을 피할 수 있다.

Redis 사용처

원격 데이터 저장소, 그 외 인증 토큰 저장소, 랭킹 시스템, API Limit, Job Queue(Celery)...

Redis Collections

Strings

Key-Value
Key의 설계 방식이 상당히 중요해진다. 어떻게 Key를 설정하느냐에 따라 데이터의 분산 정도가 달라진다.

List

Lpush, Rpush를 통해 컬렉션의 시작과 끝에 데이터 추가 가능.
동일한 방식으로 LPOP, RPOP을 제공

Set

중복 X, 순서 X -> 탐색이 빠름
SADD, SMEMBERS, SISMEMBERS
특정 유저를 팔로우하는 목록을 저장할 때

Sorted Set

Score를 포함한 순서가 있는 Set
ZADD key score value
범위를 대상으로 데이터 조회 가능
- ZRANGE, ZREVERAGE, ZRANGEBYSCORE

Score는 Double 타입
- 실수형, 값의 정확성에 문제가 있을 수 있다.
- 자바스크립트에서 유저 ID를 보낸다고 할 때, Long 정수형을 보내면 문제가 발생할 수 있음.

Hash

Key-Value 안에 Sub Key-Value가 존재

Collection 주의사항

하나의 컬렉션에는 너무 많은 아이템을 넣지 않는 게 좋다.
많은 아이템을 집어넣어야 한다면, 여러 컬렉션에 분산 저장하는 걸 고려해보자.
Expire는 컬렉션 내 아이템 개별이 아닌, 컬렉션 자체에 해당한다.

Redis 운영 팁

메모리 관리를 잘하자.

메모리가 꽉 차서 뻗는다면?
또는 메모리가 부족해서 Memory Swap이 발생하면?
위 사례들이 발생하면 Redis를 사용하는 효과를 많이 잃는다.

Maxmemory 옵션

이건 건드리지 않는 게 좋다.
할당 대상의 메모리 사이즈를 완벽히 예측할 수 있을까?
더 사용하게 되면 실제 필요한 용량보다 더 큰 용량이 필요해진다.

모니터링

일단 Swap이 발생하는지 봐야 한다.

하드웨어 단계에서 고려할 부분

24GB 크기의 인스턴스 하나보다, 8GB 인스턴스 3대가 더 안정적이다.
Read에서는 문제없지만 Write의 경우 필연적으로 메모리가 2배 늘어나는 경우가 있을 수 있다.

여러 가지를 고려했음에도 메모리 부족이 발생하면?

일단 가장 쉬운 건 돈으로 해결하기 = 더 크고 더 강력한 장비
- 보통 60 ~ 70% 정도의 메모리를 사용하면 장비 이전을 고려해야 한다.

컬렉션에 대해 고민해보기
- Hash는 Hash Table을 사용
- Sorted Set은 Skip List와 HashTable을 사용
- Set 은 Hash Table
- Hash, Sorted Set, Set은 메모리들을 많이 사용해서 Ziplist를 고려해볼 수 있다.
  - 선형 저장, In-Memory라서 선형 탐색해도 적은 개수에서는 효과적

O(N)은 당연히 주의해야 한다.

싱글 스레드 환경에서 요청 처리 과정의 병목을 신경 써야 한다.
단순한 GET/SET이라면 10만 TPS까지 가능하다고 한다.

O(N) 명령어

KEYS, FLUSHALL, FLUSHDB, DELETE COLLECTIONS, GET ALL COLLECTIONS
KEYS는 SCAN을 쓰고, 조회 대상을 나누자.
GET ALL을 하는 것도, 일부만 가져오던지 컬렉션 자체를 쪼개자.

Redis Replication

Async Replication으로 Replication Lag이 발생할 수 있다.
DBMS에서의 Statement Replication과 유사하다. 쿼리가 직접!

Replication 과정

Secondary에 replicaof, slaveof 명령 전달
Secondary는 Primary에 sync 명령 전달
Primary는 현재 메모리 상태 저장을 위해서 Fork 수행
- 이 과정에서 Copy On Write 발생

Fork한 프로세서는 현재 메모리 정보를 디스크에 Dump, 이때 메모리에 바로 줄 수도 있다.
Fork 이후 데이터를 Secondary에 지속적으로 전달

주의사항

Fork 발생으로 메모리 부족이 발생할 수 있다.
- Fork하다가 메모리가 터지고, 데이터가 사라지면?
- 그 데이터는 영영 못 만난다.

Redis-cli의 --rdb는 현재 상태의 메모리 스냅샷을 가져오는데, 이것이 치명적인 문제를 발생시킬 수 있다.
AWS 등의 클라우드 서비스에서는 조금 다르게 구성되어 문제가 덜하다.
여러 Replica를 동시에 만들면 대역 초과로 네트워크 연결이 끊어질 수 있다.

redis.conf에서의 권장 설정

Maxclient 50000, 기본값보다 높이자
- Maxclient 숫자만큼 접속 가능
RDB/AOF 설정은 비활성화. 특히 Primary에서는 무조건.
특정 커맨드를 비활성화
- 전체 장애 중 90% 이상은 KEYS, SAVE를 사용하면서 발생한다.

Redis 데이터 분산 방법

Consistent Hashing

일반 모듈러 방식의 문제는 서버의 장애와 추가 시점에 여러 서버에 걸쳐 리밸런싱이 발생하면 취약하다는 것
- 50% 이상의 데이터가 움직이게 되면...

Consistent Hashing은 자기 해시보다 크고, 가장 근접한 해시를 가진 서버를 찾아간다.
- 서버 장애/추가 시점에 N분의 1 정도만 리밸런싱이 발생한다.
- 세미나 영상에서는 실제 참석자분들이 움직이며 예시를 보여준다.

Sharding

데이터를 어떻게 나누고 어떻게 찾을 것인가?

Range

특정 Range를 정의하고 그에 속하는 Range에 저장한다.
데이터가 일정 Range에 몰릴 수 있다.
확장 단계에는 편할지 몰라도, 결국 쏠림 현상이 특정 서버의 부하를 유발한다.

Modular

서버 한 대 추가하면 리밸런싱이 많아진다.
한 번 서버를 늘릴 때 *2로 늘린다거나.. 좀 줄일 순 있는데...

Indexed

Key가 어디에 저장될지 처리할 서버가 따로 존재
장애 포인트가 생기는 문제

Redis Cluster

Hash 기반, Slot 16384로 구분
- slot = crc16(key) % 16384
- key값 설정으로 보낼 서버를 선택할 수 있다.
- Redis 서버는 slot range를 가지고 있고 이 slot 단위의 데이터를 다른 서버로 전달하게 된다.
- 자기 slot 외의 데이터가 오면 -Moved {Server} 에러를 보내고, 이 에러를 받으면 해당 서버로 옮긴다.

장점
- 자체적인 Primary/Secondary Failover
- Slot 단위의 데이터 관리

단점
- 메모리 사용량이 늘어난다.
- Migration 자체는 관리자가 시점을 결정한다.
- 라이브러리 구현이 필요하다.

Redis Failover

Redis Cluster Failover

Coordinator 기반 Failover

Zookeper, etcd 등의 Coordinator 사용
이를 기반으로 설정을 관리하면 동일 방식으로 관리가 가능하다.
다만, 해당 기능을 이용하게끔 개발이 필요하다.

VIP, DNS 기반 Failover

서버가 죽으면 승격된 Redis에 죽은 서버의 VIP를 할당해준다.
Health Checker는 죽은 서버의 연결을 모두 끊어, 클라이언트 쪽의 재접속을 유도한다.
- 클라이언트 추가 구현은 필요 없다.

DNS 기반은 DNS Cache TTL 관리 필요
- 클라이언트가 DNS 캐싱하는 경우 접속 불가 상태가 있을 수 있다.

VIP 기반은 외부 서비스가 필요한 경우 유리하다.

모니터링 지표

Redis Info 제공 정보
RSS
- 피지컬 메모리를 얼마나 쓰고 있는지, OS가 보는 지표
Used Memory
- Redis에서 인지하는 현재 사용 중인 메모리
Connection 수
초당 처리 요청 숫자
CPU, Disk, Network RX/TX 등...

결론

Redis는 매우 좋은 툴이다.

Memory를 빡빡하게 사용하면 관리가 어려울 수 있다.
- 스펙 대비 75% 이상 사용하면 장비 증설을 고려하자.
- 쓰기 작업 용량이 크면 Migration도 주의하자.

Cache로써의 Redis

Redis에 이슈가 있는 경우, DB 등 다른 쪽의 부하를 확인해야 한다.
Consistent Hashing도 부하를 완벽하게 분산시키는 건 아니다.
- 여기도 이슈가 있다면, Adaptive Consistent Hashing에 대해 알아보자.

Persistent Sotre로써의 Redis

무조건 Primary/Secondary 구조를 가져가자.
메모리는 절대 빡빡하게 가져가면 안 된다.
- 정기적인 Migration을 수행해야 하고, 이를 위한 자동화 툴을 준비하자.

RDB나 AOF가 필요한 경우 Secondary에서만 구동한다.

영상 후기

기본적인 Redis에 대한 내용들은 공식 문서에서 파악을 해야겠지만, 이것을 어떻게 사용하고 어떤 이슈들을 고려해야 하는지에 대한 내용은 문서에서 딱딱한 문체로 보면 크게 와닿지 않는 경우가 있다. 이 강의에서 약 1시간 40분 정도의 영상에서 Redis가 무엇인지에 대한 내용에서부터 시작해서, 실무에서의 사용 방식, 운영 시 장애 관리 방법 등에 대해 한 번 맛볼 수 있어서 입문자에게도 좋은 영상이었던 것 같다.

728x90

저작자표시 비영리 변경금지

현재글우아한 Redis - Redis 톺아보기

티스토리툴바