infra
4 posts
📚 [Data Engineering] 카카오의 분산 스토리지 - KAGE(KAkao storaGE)

카카오의 분산 스토리지 : KAGE(KAkao storaGE) 동일한 데이터를 3개의 파일(원본 + 2개의 복제본)로 만들어 분산 저장함 - 물리적으로 서로 다른 서버에 있지만, 논리적으로 같은 데이터를 갖고 있는 3개의 청크(청크셋)에 저장 파일 읽기 트래픽 분산, 빠른 장애 파악 및 처리 KAGE의 구성 - Datanode와 Namenode Datanode(데이터 노드) 실제로 파일이 저장된 공간. 파일을 읽고 전송하는 역할. 데이터 노드의 파일 저장소는 청크(Chunk)라는 일정한 크기를 가진 저장 공간의 모임으로 구성됨 청크가 3개(마스터 노드 1개, 슬레이브 노드 2개) 모인 청크셋 단위로 데이터를 관리함 N…

March 12, 2023
data-engineering
infra
📚 [Data Engineering] 스토리지 시스템 (DAS, SAN, NAS)

스토리지 시스템 기초 DAS(Directed-attached Storage) DAS(직접 연결 스토리지) 서버와 스토리지를 분리하고 둘을 연결하여 사용하는 구조 초기에는 주 기억장치(RAM)와 보조 기억장치(하드 디스크)가 분리되지 않고 같이 쓰임 계산의 성능을 높이고 데이터 보관의 용량과 효율을 높이기 위해 스토리지 시스템인 보조 기억 장치가 탄생하였고, 서버에 이를 연결해 사용함 장단점 DAS 구조에서는 추가적인 디스크 용량이 필요하다면 디스크를 물리적으로 교체해야 하는 불편함이 있음 SAN(Storage Area Network) SAN(스토리지 전용 네트워크) 스토리지를 여러 대 준비한 뒤 스토리지들을 연결하는 …

March 11, 2023
data-engineering
infra
📟 [Infra] 3계층형 시스템

3계층형 시스템(3 Tier System) 단순히 기능을 개발하는 것을 넘어 데이터의 흐름과 시스템의 동작을 이해하고 싶어 인프라 공부를 시작합니다. 정리된 내용은 “그림으로 공부하는 IT 인프라 구조”를 기반으로 합니다. 3계층형 시스템 3계층 아키텍처는 , , 로 구성되어 있으며, 각 서버는 스위치를 경유하여 연결되어 있다. 모든 서버는 독립된 하나의 컴퓨터와 동일한 구조로 구성되어 있다. 각 서버 내부에 CPU, 메모리, 디스크, NIC/HBA와 같은 하드웨어 부품이 존재하고 이러한 장치를 사용하기 위한 인터페이스로 OS 커널이 존재하고, 그 위에서 여러 프로세스가 실행된다. 각 서버의 CPU와 디스크를 이용하…

July 24, 2022
infra
📟 [Infra] OS 커널

OS 커널 (OS Kernel) 단순히 기능을 개발하는 것을 넘어 데이터의 흐름과 시스템의 동작을 이해하고 싶어 인프라 공부를 시작합니다. 정리된 내용은 “그림으로 공부하는 IT 인프라 구조”를 기반으로 합니다. OS 커널의 역할 한마디로 정리하면 ‘뒤에서 무슨 일이 벌어지는지 은폐하면서 편리한 인터페이스를 제공하는 것’ 이라고 할 수 있음. 모든 작업을 접수받고(인터페이스 역할), 작업을 위한 순서나 저장 공간 등을 스스로 제어하여 관리한다. 1) 시스템 콜 인터페이스 프로세스/스레드 -> 커널 간 인터페이스 애플리케이션이 OS에 작업을 명령하는 것을 “시스템 콜”이라 한다. 즉, 애플리케이션이 명령을 내릴 수 있도…

July 24, 2022
infra