Hero Image of content
[책 읽고 정리] 파이썬으로 살펴보는 아키텍처 패턴 (Part1)

작은 서비스를 만들 때는 일단 잘 돌아가게 하는 것이 중요하다고 생각했다. (일단 대충 돌아가게 하는 것과는 다르다)
그래야 나와 함께 손발을 맞추는 동료들이 너무 오래 기다리지 않고, 다양한 시도를 해볼 수 있으니 말이다.
그렇게 서비스가 커지고 사용자도 늘어나면서 나중을 상상해보곤 한다.
‘이 설계가 그때는 맞았지만 나중에도 맞을까?’, ‘갑자기 많은 사용자가 들어오면 괜찮을까?’
물론 아무런 준비도 안 되어 있는 건 아니지만, 가끔 드는 불안감은 어쩔 수 없는 것 같다.
그럴 때는 뭐라도 하는 게 맞으니까…

이 책을 읽어봐야겠다고 생각한 계기는 어떤 카카오톡 오픈 채팅에서 느꼈던 분위기 때문이다.
DDD에 대한 이야기가 오고 가는데 알아들을 수 있는 말이 많지 않았다.
예전에 사내에서 DDD 스터디를 정주행했던 적은 있지만, 깊이가 얕고 실천 계획이 동반되지 않아서 금방 잊혀졌다.
아무튼 그때 나랑 비슷한 느낌을 받았을 것 같은 누군가의 질문에 이 책을 권했던 사람이 있었다.
그날 바로 서점에 가서 샀는데 예상보다 얇아서 기뻤다(?)

2주 정도 출퇴근하는 지하철 안에서 읽었는데 겨우 Part1까지 읽고, (너무 기억 나는 게 없어서) 주말에 다시 복습하며 이 정리를 작성했다.
얇아서 출퇴근할 때 읽기 좋겠다고 생각했던 건 큰 오산이었다.
절대 한 번에 이해할 수 있는 내용이 아니고, 아직 TDD, DDD에 대한 기본적인 이해가 없다면 절대 먼저 보면 안 된다.
나는 우선 Part1까지만 읽고, 다른 DDD 관련 책이나 인터넷 자료 조사를 통해 감을 더 끌어 올릴 계획이다.

어쨌든 책은 정말 좋다. 특히 파이썬을 좋아하는 사람으로서 이 책의 예제 코드를 읽고, 이해하는 과정이 즐거웠다.

Part1 - 도메인 모델링을 지원하는 아키텍처 구축

Chapter 1 - 도메인 모델링

  • 도메인 모델의 핵심 패턴은 엔티티(Entity), 값 객체(Value Object), 도메인 서비스(Domain Service)
  • 도메인이란? 해결하려는 문제일 뿐
  • 모델은? 유용한 특성을 포함하는 프로세스나 현상의 지도
  • 도메인 모델은? 비즈니스를 수행하는 사람이 자신의 비즈니스에 대해 가지고 있는 지도와 같다.
  • 값 객체 (Value Object)
    • 데이터는 있지만 유일한 식별자가 없는 비즈니스 개념을 표현하기 위해 값 객체(Value Object)를 사용한다.
    • 값 객체는 안에 있는 데이터에 따라 유일하게 식별될 수 있는 도메인 객체를 의미하며, 불변 객체(Immutable Object)로 만들곤 한다.
    • Python에서 불변 객체를 만들기 위해 데이터 클래스나 네임드 튜플을 이용해서 값 동등성(value equality)를 부여할 수 있다.
    • 책 예제 인용: 주문(Order)에는 그 주문을 식별할 수 있는 유일한 참조 번호(예: 주문 ID)가 있지만 라인(OrderLine)은 그렇지 않다. 주문 라인은 그 라인의 주문 ID, SKU, 수량을 변경하면 새로운 라인이 된다. 즉, 데이터에 의해 결정되며 오랫동안 유지되는 정체성이 존재하지 않는다.
  • 엔티티(Entity)
    • 오랫동안 유지되는 정체성이 존재하는 도메인 객체를 설명할 때 사용한다.
    • 이름을 Name이라는 클래스로 정의한다면 이름이 다른 Name객체는 서로 같지 않다. 하지만 Name객체를 갖는 사람(Person) 클래스는 영속적인 정체성(persistent identity)을 갖고 있다.
    • 따라서 값 객체와 달리 엔티티에는 정체성 동등성(identity equality)이 있다.
  • 모든 것을 객체로 만들 필요가 없다.
    • 코드에서 ‘동사(verb)‘에 해당하는 부분을 표현하려면 함수를 사용하는 것이 좋다.
    • FooManager, BarBuilder, BazFactory 대신 manage_foo(), build_bar(), get_baz()함수를 쓰는 편이 가독성이 더 좋고 표현력이 좋다.

Chapter 2 - 저장소 패턴 (Repository)

  • 데이터 저장소를 간단하게 추상화한 것으로 이 패턴을 사용하면 모델 계층과 데이터 계층을 분리할 수 있다.
  • 이 간단한 추상화는 데이터베이스의 복잡성을 감춰서 시스템을 테스트하기 더 좋게 만든다.
  • 도메인 모델에는 그 어떤 의존성도 없어야 한다.
    • 하부 구조와 관련된 문제가 도메인 모델에 지속적으로 영향을 끼쳐서 단위 테스트를 느리게 하고 도메인 모델을 변경할 능력이 감소된다.
    • 모델을 내부에 있는 것으로 간주하고, 의존성이 내부로 들어오도록 만들어야 한다.
  • 이 모델을 관계형 데이터베이스로 연결하려면 어떻게 해야할까?

    1. 일반적인 ORM(객체 관계 매핑) 방식: ORM에 의존하는 방식
    • ORM이 제공하는 가장 중요한 기능은 영속성 무지(persistent ignorance)다. 도메인 모델이 데이터를 어떻게 저장하는 지에 대해 알 필요가 없다는 의미다.
    • 영속성 무지가 성립하면 특정 데이터베이스 기술에 도메인이 직접 의존하지 않도록 유지할 수 있다.
    • 이 관점에서 ORM을 사용하는 것은 이미 DIP(의존성 역전)의 한 예다. 하드코딩한 SQL에 의존하는 대신 추상화인 ORM을 의존한다. 하지만 이것만으로 충분하지 않다.

    이 모델이 데이터베이스에 대해 무지하다고 말할 수 있을까? 모델 프로퍼티가 직접 데이터베이스 열과 연관되어 있는데 어떻게 저장소와 관련된 관심사를 모델로부터 분리할 수 있을까?

    from sqlalchemy import Column, ForeignKey, Integer, String
    from sqlalchemy.ext.declarative import declarative_base
    from sqlalchemy.orm import relationship
    
    Base = declarative_base()
    
    class Order(Base):
        id = Column(Integer, primary_key=True)
    
    class OrderLine(Base):
        id = Column(Integer, primary_key=True)
        sku = Column(String(250))
        qty = Integer(String(250))
        order_id = Column(Integer, ForeignKey('order.id'))
        order = relationship(Order)
    
    1. 의존성 역전 : 모델에 의존하는 ORM
    • 스키마를 별도로 정의하고 스키마와 도메인 모델을 상호 변환하는 매퍼(mapper)를 정의한다.

    start_mapper() 함수를 호출하지 않으면 도메인 모델 클래스는 데이터베이스를 인식하지 못한다.

    from sqlalchemy.orm import mapper, relationship
    
    import model  #(1)
    
    
    metadata = MetaData()
    
    order_lines = Table(  #(2)
        "order_lines",
        metadata,
        Column("id", Integer, primary_key=True, autoincrement=True),
        Column("sku", String(255)),
        Column("qty", Integer, nullable=False),
        Column("orderid", String(255)),
    )
    
    ...
    
    def start_mappers():
        lines_mapper = mapper(model.OrderLine, order_lines)
    
  • 저장소 패턴 소개

    • 저장소 패턴은 영속적 저장소를 추상화한 것이다. 모든 데이터가 메모리상에 존재하는 것처럼 데이터 접근과 관련된 세부 사항을 감춘다.
    • 가장 간단한 저장소에는 add(), get() 메서드 두 가지 밖에 없다. 이렇게 단순성을 강제로 유지하면 도메인 모델과 데이터베이스 사이의 결합을 끊을 수 있다.
    • 저장소 패턴과 ORM은 모두 Raw SQL문을 대신하는 추상화 역할을 한다. 저장소 뒤에 ORM을 쓰거나 ORM 뒤에 저장소를 쓸 필요가 없다. ORM 없이 직접 저장소를 구현하지 이유는 없다.
  • 정리하자면, 도메인 모델은 인프라에 대해 걱정할 필요가 없어야 한다. ORM은 모델을 임포트해야 하며 모델이 ORM을 임포트해서는 안된다.
  • 저장소 패턴은 영속적 저장소에 대한 단순한 추상화다. 저장소는 컬렉션이 메모리상에 있는 객체라는 환상을 제공한다. 저장소를 사용하면 핵심 애플리케이션에는 영향을 미치 앟으면서 인프라를 이루는 세부 구조를 변경하거나 FakeRepository를 쉽게 작성할 수 있다.

Chapter 3 - 결합과 추상화

  • 저장소 패턴은 영구 저장소에 대한 추상화다.
  • B 컴포넌트가 깨지는 게 두려워서 A 컴포넌트를 변경할 수 없는 경우 이 두 컴포넌트가 서로 결합되어 있다고 한다.
  • 지역적 결합은 좋은 것이다. 결합된 요소들 사이에 응집(cohesion)이 있다는 용어로 표현한다. 하지만 전역적 결합은 성가신 존재다. 코드를 변경하는 데 드는 비용을 증가시킨다.

Chapter 4 - 플라스크 API와 서비스 계층

  • 서비스 계층은 플라스크와 도메인 모델 사이에 유스 케이스를 담는 추상화 역할을 할 수 있게 한다.
  • 실제 API 엔드포인트(HTTP)와 실제 데이터베이스를 사용하는 테스트를 E2E(end to end) 테스트라고 부른다.

아래 코드는 플라스크 함수에서 몇 가지 오류 처리를 추가하고 있다. 이렇게 할수록 점점 E2E 테스트 개수가 늘어나서 역 피라미드형 테스트가 된다.

def is_valid_sku(sku, batches):
    return sku in {b.sku for b in batches}


@app.route("/allocate", methods=["POST"])
def allocate_endpoint():
    session = get_session()
    batches = repository.SqlAlchemyRepository(session).list()
    line = model.OrderLine(
        request.json["orderid"], request.json["sku"], request.json["qty"],
    )

    if not is_valid_sku(line.sku, batches):
        return {"message": f"Invalid sku {line.sku}"}, 400

    try:
        batchref = model.allocate(line, batches)
    except model.OutOfStock as e:
        return {"message": str(e)}, 400

    session.commit()
    return {"batchref": batchref}, 201
  • 플라스크 앱이 하는 일을 살펴보면 오케스트레이션이라고 부르는 요소가 상당 부분을 차지한다.
  • 저장소에서 여러 가지 가져오고, 데이터베이스 상태에 따라 입력을 검증하고 오류를 처리하며, 성공적인 경우 데이터를 커밋한다. 이런 작업 대부분은 웹 API 엔드포인트와 관련이 없다.
  • 오케스트레이션은 E2E 테스트에서 실제로 테스트해야 하는 대상이 아니다.
  • 서비스 2가지 요소로 불린다. 첫번째 애플리케이션 서비스는 다음과 같은 간단한 단계를 수행하여 애플리케이션을 제어한다.
    • 데이터베이스에서 데이터를 얻는다.
    • 도메인 모델을 업데이트한다.
    • 변경된 내용을 영속화한다.
  • 두 번째 도메인 서비스는 도메인 모델에 속하지만 근본적으로 상태가 있는 엔티티나 값 객체에 속하지 않는 로직을 부르는 이름이다.

Chapter 5 - 높은 기어비와 낮은 기어비의 TDD

  • 서비스 계층에 대해 테스트하면 더는 도메인 모델 테스트가 필요없다.
# domain-layer test:
def test_prefers_current_stock_batches_to_shipments():
    in_stock_batch = Batch("in-stock-batch", "RETRO-CLOCK", 100, eta=None)
    shipment_batch = Batch("shipment-batch", "RETRO-CLOCK", 100, eta=tomorrow)
    line = OrderLine("oref", "RETRO-CLOCK", 10)

    allocate(line, [in_stock_batch, shipment_batch])

    assert in_stock_batch.available_quantity == 90
    assert shipment_batch.available_quantity == 100


# service-layer test:
def test_prefers_warehouse_batches_to_shipments():
    in_stock_batch = Batch("in-stock-batch", "RETRO-CLOCK", 100, eta=None)
    shipment_batch = Batch("shipment-batch", "RETRO-CLOCK", 100, eta=tomorrow)
    repo = FakeRepository([in_stock_batch, shipment_batch])
    session = FakeSession()

    line = OrderLine('oref', "RETRO-CLOCK", 10)

    services.allocate(line, repo, session)

    assert in_stock_batch.available_quantity == 90
    assert shipment_batch.available_quantity == 100
  • 테스트가 있으면 시스템을 바꾸는데 두려움이 없다. 하지만 도메인 모델에 대한 테스트가 너무 많으면 코드 베이스를 바꿀 때마다 많은 테스트를 변경해야 하는 문제가 생긴다.
  • 변하면 안 되는 시스템의 특성을 강제로 유지하기 위해 테스트를 사용한다. 예를 들어 API가 계속 200OK를 반환하는지, 데이터베이스 세션이 커밋을 하는지, 주문이 여전히 할당되는지…
  • API에 대한 테스트를 작성하면 도메인 모델을 리팩터링할 때 변경해야 하는 코드의 양을 줄일 수 있다.
    • 서비스 계층에 대한 테스트만 수행하도록 우리 자신을 제한하자.
    • 직접 모델 객체의 ‘사적인’ 속성이나 메서드와 테스트가 직접 상호작용하지 못하게 막는다면 좀 더 자유롭게 모델을 리팩터링할 수 있다.
  • 온전히 서비스 계층의 기능만 사용하는 서비스 계층 테스트를 작성하면 도메인에 대한 의존 관계를 모두 제거할 수 있다.
    • 일반적으로 서비스 계층 테스트에서 도메인 계층에 있는 요소가 필요하다면 이는 서비스 계층이 완전하지 않다는 의미
# tests/unit/test_services.py
def test_add_batch():
    repo, session = FakeRepository([]), FakeSession()
    services.add_batch("b1", "CRUNCHY-ARMCHAIR", 100, None, repo, session)
    assert repo.get("b1") is not None
    assert session.committed

# service_layer/services.py
def add_batch(
    ref: str, sku: str, qty: int, eta: Optional[date],
    repo: AbstractRepository, session,
) -> None:
    repo.add(model.Batch(ref, sku, qty, eta))
    session.commit()


def allocate(
    orderid: str, sku: str, qty: int,
    repo: AbstractRepository, session
) -> str:
  • 서비스 계층을 도메인 객체가 아니라 원시 타입을 바탕으로 작성하라

# 이전: allocate는 도메인 객체를 받는다 (service_layer/services.py)
def allocate(line: OrderLine, repo: AbstractRepository, session) -> str:
  pass

# 이후: allocate는 문자열과 정수를 받는다 
def allocate(
    orderid: str, sku: str, qty: int,
    repo: AbstractRepository, session
) -> str:
  pass
  • 이상적인 경우 테스트해야 할 모든 서비스를 오직 서비스 계층을 기반으로 테스트할 수 있다.

Chapter 6 - 작업 단위 패턴 (UoW)

  • 저장소와 서비스 계층 패턴을 하나로 묶어 주는 마지막 퍼즐은 Unit of Work(UoW) 패턴이다.
  • 저장소 패턴이 영속적 저장소 개념에 대한 추상화라면 UoW는 원자적 연산(Atomic operation) 개념의 추상화다.
  • UoW 패턴을 사용하면 서비스 계층과 데이터 계층을 완전히 분리할 수 있다.

▼ UoW가 없는 경우: API는 서비스 계층, 저장소 계층, 데이터베이스와 직접 소통한다.

▼ UoW가 있는 경우 : UoW가 데이터베이스 상태를 관리한다.

  • 이 작업은 파이썬의 컨텍스트 매니저를 이용해서 만들 수 있다.
# src/allocation/service_layer/unit_of_work.py

DEFAULT_SESSION_FACTORY = sessionmaker(  #(1)
    bind=create_engine(
        config.get_postgres_uri(),
    )
)


class SqlAlchemyUnitOfWork(AbstractUnitOfWork):
    def __init__(self, session_factory=DEFAULT_SESSION_FACTORY):
        self.session_factory = session_factory  #(1)

    def __enter__(self):
        self.session = self.session_factory()  # type: Session  #(2)
        self.batches = repository.SqlAlchemyRepository(self.session)  #(2)
        return super().__enter__()

    def __exit__(self, *args):
        super().__exit__(*args)
        self.session.close()  #(3)

    def commit(self):  #(4)
        self.session.commit()

    def rollback(self):  #(4)
        self.session.rollback()
  • UoW를 사용해서 만든 서비스 계층
# src/allocation/service_layer/services.py)

def add_batch(
    ref: str, sku: str, qty: int, eta: Optional[date],
    uow: unit_of_work.AbstractUnitOfWork,  #(1)
):
    with uow:
        uow.batches.add(model.Batch(ref, sku, qty, eta))
        uow.commit()


def allocate(
    orderid: str, sku: str, qty: int,
    uow: unit_of_work.AbstractUnitOfWork,  #(1)
) -> str:
    line = OrderLine(orderid, sku, qty)
    with uow:
        batches = uow.batches.list()
        if not is_valid_sku(line.sku, batches):
            raise InvalidSku(f"Invalid sku {line.sku}")
        batchref = model.allocate(line, batches)
        uow.commit()
    return batchref
  • UoW 패턴은 데이터 무결성 중심의 추상화다.
  • 도메인 모델의 일관성을 강화하고 성능을 향상시킬 때 도움이 된다.
  • 파이썬의 콘텍스트 매니저는 원자적으로 한 그룹으로 묶어야 하는 코드 블록을 시각적으로 쉽게 볼 수 있게 해준다.
    • 트랜잭션 시작과 끝을 명시적으로 제어할 수 있다.
    • 트랜잭션 말고도 이벤트, 메시지 버스를 사용할 때도 원자성은 도움이 된다.
    • 하지만 ORM이 이미 원자성의 좋은 추상화를 제공할 수도 있다.

Chapter 7 - 애그리게이트와 일관성 경계

  • 도메인 객체가 개념적으로나 영속적 저장소 안에서 내부적으로 일관성을 유지하는 방법, 일관성 경계(Consistency boundary)
  • 애그리게이트(Aggregate)는 다른 도메인 객체들을 포함하며 이 객체 컬렉션 전체를 한꺼번에 다룰 수 있게 해주는 도메인 객체
    • 데이터 변경이라는 목적을 위해 한 단위로 취급할 수 있는 연관된 객체의 묶음 (에릭 에번스, 도메인 주도 설계)
  • 애그리게이트에 있는 객체를 변경하는 유일한 방법은 애그리게이트와 그 안의 객체 전체를 불러와서 애그리게이트 자체에 대해 메서드를 호출하는 것
  • 모델이 복잡해지고 엔티티와 값 객체가 늘어나면서 서로 참조가 얽히고설킨다. 그래서 누가 어떤 객체를 변경할 수 있는지 추적하기 어려워진다.
    • 모델 안에 컬렉션이 있으면 어떤 엔티티를 선정해서 그 엔티티와 관련된 모든 객체를 변경할 수 있는 단일 진입점으로 삼으면 좋다.
    • 예를 들면 쇼핑몰의 ‘장바구니’는 한 단위로 다뤄야 하는 상품들로 이루어진 컬렉션이다. 각 장바구니는 자신만의 불변조건을 유지할 책임을 담당하는 동시성 경계다.

마무리


참고 자료

comments powered by Disqus