Architecture Patterns with Python

Introduction

Le chaos dans l’architecture logicielle se caractérise par l’homogénéité : chaque partie du code a des responsabilités de toutes sortes.
- Le logiciel tend naturellement vers ce chaos, qu’on appelle big ball of mud.
Parmi les techniques pour éviter le chaos :
- L’encapsulation et l’abstraction permettent de simplifier la compréhension du code, et d’améliorer sa maintenabilité.
  - L’abstraction peut passer par une Abstract Base Class (ABC), mais en Python on va souvent utiliser un objet ou une fonction qui sert directement d’API publique.
- Le layering permet de créer des zones où le code est classé, et où il y a des règles de dépendances, pour limiter celles-ci.
  - Le layering le plus connu est celui en 3 couches : présentation, business et data.
- La dependency inversion (DIP) consiste à ce que :
  - Le code métier (haut niveau) ne dépende pas du code d’infrastructure (bas niveau), mais que les deux dépendent d’abstractions. La raison est qu’on veut changer les deux indépendamment, et avec un rythme différent.
  - Les abstractions ne dépendent pas des détails d’implémentation, mais plutôt l’inverse.
L’un des problèmes principaux qui émerge au cours du temps, c’est l’éparpillement du code du domaine au travers de la codebase. Il faut mettre en place des techniques pour l’empêcher.

Part I - Building an Architecture to Support Domain Modeling

La plupart des développeurs ne conçoivent que le data model, et jamais le domain model. C’est pourtant le domain model, c’est-à-dire le comportement de l’application, qui doit être central.

1 - Domain Modeling

Le domain model est une représentation simplifiée (model) du problème qu’on essaye de résoudre (domain).
- Il apparaît naturellement dès qu’on travaille sur un problème, et se traduit par exemple par un langage spécifique qui émerge petit à petit, et qui permet d’exprimer des processus complexes en peu de mots.
- Le concept de domain modeling n’est pas issu du blue book d’Eric Evans, mais remonte par exemple à :
  - Object Design de Rebecca WirfsBrock et Alan McKean, qui parle de responsibility-driven design.
  - Les livres d’Ivar Jacobson et Grady Booch, qui datent des années 80.
Les auteurs prennent l’exemple de leur propre entreprise, qui fait de l’achat-vente de biens.
- Il y a 4 bounded contexts :
  - Les clients utilisent l’app d’e-commerce (1) pour commander, et de l’autre côté l’équipe d’achat utilise l’app d’achat (2) pour acheter ce qui est nécessaire pour approvisionner les stocks.
  - Ces deux apps communiquent avec le module d’allocation (3) qui met à jour les besoins et disponibilités, et communique les instructions au module de warehouse (4) pour qu’il envoie les biens.
- Ils veulent mettre en place le fait d’indiquer des produits disponibles avec un plus long délai de livraison, dès qu’ils sont commandés par l’équipe d’achat. De cette manière, la plupart des produits seront marqués comme disponibles.
- Les auteurs parlent avec les domain experts, pour mettre au clair des règles business. Ils les écrivent accompagnés d’exemples pour enlever l’ambiguïté.
  - Exemple : “On ne peut pas allouer la même line deux fois”
    - Si on a un batch de 10 BLUEVASE, et qu’on alloue une_line de 2 BLUEVASE, si on réalloue la même_line, le batch ne changera pas, et restera à 8 BLUE_VASE.

L’étape après la discussion est la construction du domain model à l’aide de tests.

Exemple de test :

def test_allocating_to_a_batch_reduces_the_available_quantity():
  batch = Batch("batch-001", "SMALL-TABLE", qty=20, eta=date.today())
  line = OrderLine('order-ref', "SMALL-TABLE", 2)
 
  batch.allocate(line)
 
  assert batch.available_quantity == 18

Code associé :

@dataclass(frozen=True)
class OrderLine:
  orderid: str
  sku: str
  qty: int
 
class Batch:
  def init(
    self, ref: str, sku: str, qty: int, eta: Optional[date]
  ):
    self.reference = ref
    self.sku = sku
    self.eta = eta
    self.available_quantity = qty
 
  def allocate(self, line: OrderLine):
    self.available_quantity -= line.qty

Les type hints sont controversés en Python, mais les auteurs les conseillent.
- On peut typer les attributs avec des str, int etc. mais on pourrait aussi utiliser typing.NewType pour créer des value objects pour pas cher pour chaque attribut.
  - Ex :
```
from typing import NewType
 
Reference = NewType("Reference", str)
Sku = NewType("Sky", str)
 
class Batch:
  def __init__(self, ref: Reference, sku: Sku ...
```
  - Les auteurs sont plutôt réticents à cette idée.
dataclass avec l’attribut frozen=True permet d’obtenir des objets immutables, et donc représente bien un value object.
- On peut obtenir la même chose avec NamedTuple
```
class Money(NamedTuple):
  currency: str
  value: int
 
money = Money('gbp', 10)
```
- On veut en général que notre value object soit égal à tout autre value object avec les mêmes attributs.
  - On veut en général aussi implémenter le comportement du hash qui contrôle l’utilisation de l’objet en tant que clé de dictionnaire et membre d’un set.
    - A propos des hashs et de l’opérateur d’égalité, les auteurs conseillent de lire Python Hashes and Equality (opens in a new tab).
  - On pourrait aussi penser à des opérateurs comme le +, -, * entre *value objects*.

Les entities, contrairement aux value objects, ont une identité, leur attributs peuvent bien changer, ils restent singuliers.

On va souvent implémenter les opérateurs d’égalité et de hash comme basés sur la référence de l’objet.

class Batch:
  ...
  def __eq__(self, other):
    if not isinstance(other, Batch):
      return False
    return other.reference == self.reference
 
  def __hash__(self):
    return hash(self.reference)`

Les domain services représentent des concepts ou des process qui ne sont ni des value objects, ni des entities.

A ne pas confondre avec le service layer, qui représente des use-cases et utilise le domain layer.
Les auteurs conseillent d’utiliser des fonctions.

Exemple :

def allocate(line; OrderLine, batches: List[Batch]) -> str:
  batch = next(
    b for b in sorted(batches) if b.can_allocate(line)
  )
  batch.allocate(line)
  return batch.reference
 
class Batch:
  ...
  def __gt__(self, other):
    if(self.eta is None:
      return False
    if other.eta is None:
      return True
    return self.eta > other.eta

Les exceptions font aussi partie du domain model et sont test drivées.

2 - Repository Pattern

On veut avoir un domain model ne dépendant d’aucune considération d’infrastructure. Il peut dépendre de librairies utilitaires, mais pas de choses stateful comme un ORM ou un framework web.
D’une certaine manière, l’ORM est déjà une forme d’inversion de dépendance : le code dépend de l’abstraction de l’ORM et ne se préoccupe pas du détail des considérations d’infrastructure spécifiques à la DB.
- Malgré tout, l’ORM est une abstraction spécifique à la DB. On passe par lui dès qu’il faut personnaliser quelque chose sur une requête particulière. On veut que notre domain model soit couplé à une abstraction encore plus abstraite.
Les auteurs utilisent SQLAlchemy même dans les projets où il n’y a pas besoin d’ORM, ne serait-ce que pour créer des data models, gérer les migrations et les connexions.

SQLAlchemy permet de mapper automatiquement un domain model fait avec du pur code et un data model fait avec SQLAlchemy.

Ca se fait avec la fonction sqlalchemy.orm.mapper :

from sqlalchemy.orm import mapper
Import model
 
order_lines = Table(...)
 
def start_mapper():
  lines_mapper = mapper(model.OrderLine, order_lines)

Une fois le mapping fait, on peut facilement faire des insertions ou des recherches en donnant et recevant des objets de notre domain model.

# trouver tous les order lines à partir du domain model
session.query(model.OrderLine).all()
# insérer des order lines à partir d'objets du domain model
session.add(model.OrderLine("order1", ...))
session.commit()

Pour faire une classe abstraite en Python, on peut étendre abc.ABC, et marquer les méthodes à implémenter par les enfants avec @abc.abstractmethod. Exemple :

class AbstractRepository(abc.ABC):
  @abc.abstractmethod
  def add(self, batch: model.Batch):
    raise NotImplementedError

* L’autre possibilité est d’utiliser **typing.Protocol** : on crée un type qu’on peut utiliser comme outil de static type checking structurel.
    * Exemple :
      ```python
      class AbstractRepository(typing.Protocol):
        @abc.abstractmethod
        def add(self, batch: model.Batch):
          raise NotImplementedError
      ```
* Les auteurs comptent souvent sur le duck typing lui-même et n’hésitent pas à **se passer d’interfaces**.

Le repository pattern consiste essentiellement à avoir une interface qui permet d’ajouter et consulter des objets, en cachant la manière dont le stockage est fait.

On va écrire des tests pour notre repository.

Les auteurs conseillent de garder ces tests, en particulier pour les repositories non triviaux.

def test_repository_can_save_a_batch(session):
  batch = model.Batch("batch1", "RUSTY-SOAPDISH", 100, eta=None)
  repo = repository.SqlAlchemyRepository(session)
 
  repo.add(batch)
  session.commit()
 
  repo = list(session.execute(
    'SELECT reference, sku, _purchased_quantity, eta FROM "batches"'
  ))
  assert rows == [("batch1", "RUSTY-SOAPDISH", 100, None)]

def test_repository_can_retrieve_a_batch_with_allocations(session):
  orderline_id = insert_order_line(session)
  batch1_id = insert_batch(session, "batch1")
  insert_batch(session, "batch2")
  insert_allocation(session, orderline_id, batch1_id)
  repo = repository.SqlAlchemyRepository(session)
 
  retrieved = repo.get("batch1")
 
  expected = model.Batch("batch1", "GENERIC-SOFA", 100, eta=None)
  assert retrieved = expected
  assert retrieved.sku == expected.sku
  assert retrieved._purchased_quantity == expected._purchased_quantity
  assert retrieved._allocations == {
    model.orderLine("order1", "GENERIC-SOFA, 12")
  }

Et le code :

class SqlAlchemyRepository(AbstractRepository):
  def __init__(self, session):
    self.session = session
 
  def add(self, batch):
    self.session.add(batch)
 
  def get(self, reference):
    return self.session.query(model.Batch)
      .filter_by(reference=reference).one()
 
  def list(self):
    return self.session.query(model.Batch).all()

Le fake repository va être similaire au repository SQLAlchemy, mais il va tout contenir en mémoire.

class FakeRepository(AbstractRepository):
  def __init__(self, batches):
    self._batches = set(batches)
 
  def add(self, batch):
    self._batches.add(batch)
 
  def get(self, reference):
    return next(
      b for b in self._batches if b.reference == reference
    )
 
  def list(self):
    return list(self._batches)

Le stockage en mémoire peut être fait avec un set pour simuler ce que fait la DB

3 - A Brief Interlude: on Coupling and Abstractions

Le couplage consiste à devoir changer un composant quand un autre composant est changé. La cohésion c’est quand deux composants couplés sont proches.
La création d’abstractions est un des moyens de diminuer le couplage : en dépendant de l’abstraction, l’autre composant a moins de raisons de changer si le premier a des changements.
On peut isoler la logique métier des side effects en choisissant de lui donner des abstractions en entrée, et en faisant en sorte qu’elle retourne d’autres abstractions en sortie. Les side effects seront alors ajoutés derrière ces abstractions.
- La testabilité s’en retrouve grandement facilitée, parce qu’on peut abondamment tester la logique métier avec des tests unitaires.
- Le fait d’avoir du code métier pur, qui ne fait que retourner des valeurs, et les side effects qui sont en dehors s’appelle le Functional Code, Imperative Shell, formalisé par Gary Bernhardt.
- L’exemple classique est celui du programme qui copie des fichiers : on isole la logique de copie / déplacement / suppression derrière des abstractions comme ('MOVE', '/path/in', '/path/out') (functional core), et on utilise le résultat de cette logique pour l’appliquer sur un vrai filesystem, avec du code qui ne fait qu’appliquer les décisions de la logique métier (imperative shell).
En plus des tests unitaires et d’intégration (ou end to end), les auteurs proposent l’edge to edge testing : on va tester unitairement l’imperative shell et le functional core en même temps, en injectant juste des objets minimaux dans l’imperative shell, pour que les side effects n’en soient pas.
- Par exemple, on va injecter un FakeFileSystem in-memory, qui va avoir le comportement des os et shutil natifs de Python, avec un port qui permet de ne garder que ce dont on a besoin.
- Ce genre d’injection est appelée Spy par les auteurs.
  - Ils renvoient à un article de Martin Fowler (opens in a new tab) pour la terminologie.
DHH parle de test-induced design damage pour qualifier l’injection de dépendance nécessaire aux unit tests de manière générale. Les auteurs quant à eux préfèrent injecter explicitement, plutôt que monkey-patcher.
- 1 - Monkey-patcher n’améliore pas le design du code, contrairement à l'injection qui oblige à faire un meilleur design.
- 2 - En injectant explicitement des dépendances, on crée des interfaces publiques explicites, et on évite de se coupler aux détails d’implémentation, chose qu’on fait facilement si on peut patcher ce qu’on veut pour vérifier des appels.
- 3 - Les tests utilisant des mocks / patchs sont difficiles à lire.
Dans ce livre, les auteurs utilisent le domain layer comme un functional core (bien qu’il ne soit pas composé que de fonctions pures), et l'application service layer comme un imperative shell qu’ils vont pouvoir unit tester edge to edge.
Pour trouver les bonnes abstractions, les auteurs proposent les heuristiques suivantes :
- Peut-on trouver une structure native qui peut contenir l’état de ce qu’on calcule, pour le renvoyer dans une fonction ?
- Où est-ce qu’on peut tracer la ligne de séparation entre nos systèmes, et introduire un seam.
  - Seam fait référence à Working Effectively with Legacy Code de Michael Feathers. Il s’agit de trouver un moyen d’isoler du code de ses dépendances sans toucher aux dépendances, et sans enlever explicitement la dépendance. Par exemple en ajoutant du code qui va masquer l’utilisation de la dépendance.
- Comment expliciter les différentes responsabilités ?
- Quelle est la logique business et quelles sont les dépendances ?

4 - Our First Use Case: Flask API and Service Layer

L’objectif dans ce chapitre est :
- D’exposer le domain service allocate via un API endpoint Flask, en le testant end-to-end.
- Ajouter un (application) service layer entre le domain layer et l’API endpoint, en le testant unitairement (edge to edge).
- Améliorer les tests du service layer pour les rendre indépendants de la business logic.
On commence par un test d’intégration (ou end to end), qui crée les objets Order, OrderLine, Batch etc. en base via du SQL, puis envoie une requête POST sur notre endpoint REST /allocate, et vérifie la réponse.
- Les auteurs utilisent les données random pour créer leurs objets en DB, pour éviter que les tests ne se gênent entre eux.

L’implémentation de l’input adapter REST ressemble à ça :

@app.route("/allocate", methods=['POST'])
def allocate_endpoint():
  session = get_session()
  batches = repository.SqlAlchemyRepository(session).list()
  line = model.OrderLine(
    request.json['orderid'],
    request.json['sku'],
    request.json['quantity'],
  )
  batchref = model.allocate(line, batches)
  return jsonify({'batchref': batchref}), 201

Les auteurs sont réticents à vérifier le contenu de la base dans le test d’intégration, et donc préfèrent ajouter un deuxième test qui va consommer le contenu d’un batch, puis vérifier que c’est le batch suivant qui est alloué par une autre requête POST.

Les auteurs continuent avec des vérifications d’erreurs liées au SKU qui peut être invalide ou ne pas exister. Il ne s’agit pas de logique du domaine, mais plutôt de sanity checks.
- On va donc créer des tests d’intégration supplémentaires pour ça, en vérifiant le statut 400 et les messages d’erreurs, et implémenter la logique dans l’endpoint Flask.

Pour éviter de multiplier les tests d’intégration et la logique dans l’input adapter, on va introduire un application service layer, qui va récupérer la logique d’orchestration : récupérer des objets du domaine à partir de repositories, appeler des méthodes dessus, valider les données et gérer les erreurs.

Les tests vont être unitaires, et utiliser un fake repository.

Exemple :

def test_returns_allocation():
  line = model.OrderLine("o1", "COMPLICATED-LAMP", 10)
  batch = model.Batch("b1", "COMPLICATED-LAMP", 100, eta=None)
  repo = FakeRepository([batch])
  result = services.allocate(line, repo, FakeSession())
  assert result == "b1"

L’implémentation de l'application service :

def allocate(line: OrderLine, repo: AbstractRepository, session) -> str:
  batches = repo.list()
  if not is_valid_sku(line.sku, batches):
    raise InvalidSku(f'Invalid sku {line.sku}')
  batchref = model.allocate(line, batches)
  session.commit()
  return batchref

Et l’API endpoint Flask :

@app.route("/allocate", methods=['POST'])
def allocate_endpoint():
  session = get_session()
  repo = repository.SqlAlchemyRepository(session)
  line = model.OrderLine(
    request.json['orderid'],
    request.json['sku'],
    request.json['qty'],
  )
  try:
    batchref = services.allocate(line, repo, session)
  except (model.OutOfStock, services.InvalidSku) as e:
    return jsonify({'message': str(e)}), 400
  return jsonify({'batchref': batchref}), 201

Et ils proposent de ne garder que deux tests d’intégration : un pour le happy path et un pour un des unhappy paths (par exemple erreur 400).

Côté organisation des fichiers, on peut avoir :
- Un dossier pour le code du domain layer
- Un dossier pour le code de l’application service layer
- Un dossier pour les entrypoints (input adapters, aussi appelés primary, driving ou encore inward-facing adapters)
- Un dossier pour les output adapters (aussi appelés secondary, driven ou encore outward-facing adapters)
- Les tests séparés en :
  - Unit : tests partant de l’application service layer
  - Integration : tests d’intégration pour un output adapter par exemple
  - e2e : tests d’intégration partant d’un input adapter
L’introduction de l’application service layer :
- A les avantages suivants :
  - On sépare clairement ce qui concerne la techno (ici HTTP) de la logique métier.
  - On peut écrire des tests unitaires pour la logique métier.
- A les désavantages suivants :
  - Plus de boilerplate avec un layer en plus.
  - Si on cède sur la testabilité, on peut très bien mettre la logique d’orchestration du domaine dans l’input adapter.
Il y a encore deux problèmes qu’il va s’agir de résoudre dans la suite:
- Le service layer est couplé au domain layer au travers de la notion d’OrderLine.
- Le service layer est couplé à l’objet session.

5 - TDD in High Gear and Low Gear

Si on analyse le nombre de tests de chaque type qu’on a :
- 12 tests unitaires du domain layer
- 3 unit tests du service layer
- 6 integration tests des output adapters
- 2 integration tests d’input adapter (e2e tests)
On va s’intéresser maintenant à ce qui se passe si on traduit les tests du domain layer vers le service layer.
- C’est assez facile à faire : puisque le service layer utilise le domain layer, il suffit de l’instancier avec le fake repository, et de le run, puis de vérifier le contenu du fake repository.
```
def test_prefers_current_stock_batches_to_shipments():
  in_stock_batch = Batch("in-stock-batch", "RETRO-CLOCK", 100, eta=None)
  shipment_batch = Batch("shipment-batch", "RETRO-CLOCK", 100, eta=tomorrow)
  line = OrderLine("oref", "RETRO-CLOCK", 10)
 
  allocate(line, [in_stock_batch, shipment_batch])
 
  assert in_stock_batch.available_quantity == 90
  assert shipment_batch.available_quantity == 100
```
- L’avantage qu’on va avoir c’est qu’on peut refactorer notre domain layer beaucoup plus facilement vu qu’il n’y a pas de tests qui le figent.
- Le désavantage c’est qu’écrire des tests de service layer nous donne un feedback moins rapide que des tests de domain layer. Avec moins de feedback on profite moins de l’avantage du TDD où les tests nous permettent de réfléchir au design de notre code.
  - Un autre désavantage est que dans certains cas, on peut avoir une explosion combinatoire du nombre de tests nécessaires pour tester tous les cas à travers plusieurs use-cases, plutôt qu’une seule fois la fonctionnalité directement dans le domain layer.
Les auteurs utilisent souvent les tests du domain layer au départ pour aider à l'écrire au départ, ou dès qu’ils font face à un problème métier compliqué, puis les bougent au niveau du service layer et effacent les tests de domain layer pour avoir une meilleure maintenabilité.
- Ils prennent la métaphore du changement de vitesse sur un vélo : au départ on a une vitesse faible pour commencer à rouler, puis on augmente la vitesse pour aller plus vite, et en cas de pente on réduit la vitesse.
Pour permettre de refactorer plus facilement le code du domain layer, on peut découpler le service layer du domain layer.
- On peut ne plus prendre des objets du domain layer en entrée des fonctions du service layer, en prenant des types primitifs à la place.
  - On passe de :
```
def allocate(line: OrderLine, repo: AbstractRepository, session) -> str:
```
  - à :
```
def allocate(
  orderid: str, sku: str, qty: int, repo: AbstractRepository, session
) -> str:
```
- Pour aller un cran plus loin encore, on peut créer des fonctions factory sur notre fake repository pour ne plus utiliser les objets du domain layer directement dans les tests du service layer.
  - Fonction factory :
```
class FakeRepository(set):
  @staticmethod
  def for_batch(ref, sku, qty, eta=None):
    return FakeRepository([
      model.Batch(ref, sku, qty, eta),
    ])
```
  - Exemple de test :
```
def test_allocation_returns_allocation():
  repo = FakeRepository.for_batch("batch1", "COMPLICATED-LAMP", 100, eta=None)
  result = services.allocate("o1", "COMPLICATED-LAMP", 10, repo, FakeSession())
  assert result == "batch1"
```
- Et enfin, pour un découplage ultime, on peut remplacer les fonctions factory par des use-cases, déjà existants ou supplémentaires, du service layer.
  - Attention cependant à ne pas écrire du code qui ne servira qu’au test, il vaut mieux ne les écrire que si ils vont être nécessaires au code aussi.
```
def test_allocate_returns_allocation():
  repo, session = FakeRepository([]), FakeSession()
  services.add_batch("batch1", "COMPLICATED-LAMP", 100, None, repo, session)
  result = services.allocate("o1", "COMPLICATED-LAMP", 10, repo, session)
  assert result == "batch1"
```
  - Le même raisonnement peut s’appliquer pour les tests d’intégration e2e : au lieu de setup la DB avec du code SQL couplé à la structure des tables, on peut faire appel à un API endpoint qui fait déjà ce qu’on veut pour le setup.

6 - Unit of Work Pattern

Le unit of work permet de prendre en charge la notion d’opérations atomiques.
Pour les auteurs, il fait partie de l’application service layer, et est le point d’entrée pour accéder aux repositories.

En python, on va implémenter le unit of work comme un context manager (il crée un bloc avec le mot clé with dans l'application service).

def allocate(
  orderid: str, sku: str, qty: int,
  uow: unit_of_work.AbstractUnitOfWork
) -> str:
  line = OrderLine(orderid, sku, qty)
  with uow:
    batches = uow.batches.list()
    # ...
    batchref = model.allocate(line, batches)
    uow.commit()

Une classe abstraite servant d’interface pourrait être celle-là :
```
class AbstractUnitOfWork(abc.ABC):
  batches: repository.AbstractRepository
 
  def __exit__(self, *args):
    self.rollback
 
  @abc.abstractmethod
  def commit(self):
    raise NotImplementedError
 
  @abc.abstractmethod
  def rollback(self):
    raise NotImplementedError
```
- Le unit of work contient les repositories en tant que variables membres.
- Il fournit deux méthodes commit() et rollback() explicites.
  - Le rollback() n’a aucun effet si commit() a déjà été appelé.
  - Le rollback() sera appelé dans tous les cas à la sortie du context manager pour éviter que la transaction reste ouverte en cas d’erreur.

L’implémentation concrète utilise la session SQLAlchemy.

DEFAULT_SESSION_FACTORY = sessionmaker(bind=create_engine(
  config.get_postgres_uri(),
))
 
class SqlAlchemyUnitOfWork(AbstractUnitOfWork):
  def __init__(self, session_factory=DEFAULT_SESSION_FACTORY):
    self.session_factory = session_factory
 
  def __enter__(self, *args):
    self.session = self.session_factory()
    self.batches = repository.SqlAlchemyRepository(self.session)
    return super().__enter__()
 
  def __exit__(self, *args):
    super().__exit__(*args)
    self.session.close()
 
  def commit(self):
    self.session.commit()
 
  def rollback(self):
    self.session.commit()

On peut maintenant écrire des tests unitaires pour le service layer, en instanciant seulement un fake unit of work au lieu d’instancier directement des fake repositories et fake session.
```
class FakeUnitOfWork(AbstractUnitOfWork):
 
  def __exit__(self, *args):
    self.batches = FakeRepository([])
    self.committed = False
 
  def commit(self):
    self.committed = True
 
  def rollback(self):
    pass
 
def test_add_batch():
  uow = FakeUnitOfWork()
  services.add_batch("b1", "CRUNCHY-ARMCHAIR", 100, None, uow)
  assert uow.batches.get(b1) is not None
  assert uow.committed
```
- En remplaçant le fake session qui était un objet externe par un fake unit of work qui mock un concept qu’on maintient nous-mêmes, on adhère à la pratique “Don’t mock what you don’t own”.
  - La raison est que si on mock quelque chose qu’on ne maintient pas, on se retrouve avec un objet complexe dont l’interface entière n’est pas bien connue et délimitée, et qui peut évoluer sans qu’on le sache.

L’application service se retrouve à ne prendre que le unit of work comme output adapter.

def add_batch(
  ref: str, sku, str, qty: int, eta: Optional[date],
  uow: AbstractUnitOfWork
):
  with uow:
    uow.batches.add(model.Batch(ref, sku, qty, eta))
    uow.commit()

Quelques tests d’intégration supplémentaires pour vérifier le comportement de rollback de notre unit of work :

def test_rolls_back_uncommitted_work_by_default(session_factory):
  uow = unit_of_work.SqlAlchemyUnitOfWork(session_factory)
  with uow:
    insert_batch(
      uow.session, 'batch1', 'MEDIUM-PLINTH', 100, None
    )
  new_session = session_factory()
  rows = list(new_session.execute('SELECT * FROM "batches"'))
  assert rows == []
 
def test_rolls_back_on_error(session_factory):
  class MyException(Exception):
    pass
  uow = unit_of_work.SqlAlchemyUnitOfWork(session_factory)
  with pytest.raises(MyException):
    with uow:
      insert_batch(
        uow.session, 'batch1', 'LARGE-FORK', 100, None
      )
      raise MyException()
  new_session = session_factory()
  rows = list(new_session.execute('SELECT * FROM "batches"'))
  assert rows == []

Une alternative au comportement de commit explicite et rollback implicite pourrait être le commit et le rollback implicites.
- Il s’agirait de faire un commit() dans la méthode __exit__() dans le cas normal, et un rollback() dans le cas où on a eu une erreur.
```
def __exit__(self, exn_type, exn_value, traceback):
  if exn_type is None:
    self.commit()
  else:
    self.rollback()
```
- Les auteurs conseillent de garder le commit explicite pour n’avoir qu’un chemin happy path clair, et le rollback implicite pour éviter de persister tout résultat non voulu.
On peut se poser la question des tests d’intégration d’output adapter à garder ou non : il faut les garder si on pense qu’ils apportent une valeur sur le long terme.
- Pour les auteurs, les tests des objets d’ORM peuvent être supprimés, et ceux des repositories et du unit of work gardés.

7 - Aggregates and Consistency Boundaries

On veut regrouper la logique métier dans des aggregates pour obtenir une délimitation au sein de laquelle des contraintes et invariants métier vont être garantis.
- Un exemple d’invariant ici peut être qu’un order line ne doit être alloué qu’au plus à un batch à la fois.
- Autre exemple : on ne peut allouer un order line à un batch si la quantité de l’order line est plus grande que la quantité restante dans le batch.
L’aggregate permet d’apporter de la clarté en regroupant les règles de manière cohérente.
- Mais il apporte aussi d’autres avantages, par exemple sur la question d’unité transactionnelle pour les problématiques de concurrence : comment garantir que nos règles métier sont respectées entre les différents objets ?
  - Si on exécute les requêtes en parallèle, elles ne seront pas respectées. Par exemple, un order line pourrait être alloué à plusieurs batchs.
  - On pourrait lock les différentes tables concernées à chaque requête pour s’en assurer, mais d’un point de vue performance ça ne peut pas tenir.
  - La solution que propose l’aggregate, c’est de lock seulement certains rows des tables concernées, choisis de manière à ce que leur blocage suffise à garantir les règles métier qui les concernent.
  - On peut prendre l’exemple du panier dans le cadre des sites d’e-commerce : le panier d’un même client est une unité transactionnelle, et on n’aura à priori pas de règles métier à faire respecter entre les paniers des différents clients. Donc le panier est un bon candidat pour un aggregate.
  - Citation du blue book : An AGGREGATE is a cluster of associated objects that we treat as a unit for the purpose of data changes.
- Un aggregate va cacher la complexité qu’il représente derrière une interface représentée par l’entity principale : l’aggregate root. Les autres entities sont inaccessibles à l’extérieur de l’aggregate.
Pour le choix de notre aggregate, on aimerait qu’il contienne plusieurs batches pour garantir des invariants autour de l’allocation. Mais lesquels ?
- Idéalement on aimerait qu’il soit le plus petit possible pour des raisons de performance, tout en nous permettant de faire respecter tous nos invariants en son sein.
- On pourrait par exemple choisir de prendre tous les batchs d’un Shipment, ou encore tous les batchs d’un Warehouse. Mais en réalité nos règles métier portent surtout sur les objets d’un même sku : par exemple l’allocation des DEADLY-SPOON peut se faire en parallèle de l’allocation des FLIMSY-DESK sans que ça ne casse de règle métier.
- On pourrait alors choisir par exemple GlobalSkuStock, SkuStock, Stock, ProductStock. Mais on va se rabattre sur Product.
  - On est ici dans le bounded context Allocations. Il ne s’agit pas du tout du même Product que celui du bounded context ECommerce. Il n’y aura ici aucun prix, description etc.

On va ajouter un nouvel objet Product dans le domain layer, pour encapsuler notre domain service allocate().

class Product:
  def __init__(self, sku: str, batches: List[Batch]):
    self.sku = sku
    self.batches = batches
 
  def allocate(self, line: OrderLine) -> str:
    try:
      batch = next(
        b for b in sorted(self.batches) if b.can_allocate(line)
      )
      batch.allocate(line)
      return batch.reference
    except StopIteration:
      raise OutOfStock(f'Out of stock for sku {line.sku}')

Notre aggregate est aussi un entity avec l’identifiant sku.
Il a à tout moment la liste complète des batches qui le concernent.

Un aggregate ne peut avoir qu’un seul repository qui permet de le manipuler depuis son aggregate root.

On va transformer notre BatchRepository en ProductRepository.

Dans un premier temps, on peut ne transformer que le repository in memory pour faire marcher notre application service avec ses tests unitaires.

class AbstractUnitOfWork(abc.ABC):
  products: repository.AbstractProductRepository
  # ...
 
class AbstractProductRepository(abc.ABC):
  @abc.abstractmethod
  def add(self, product):
    # ...
 
  @abc.abstractmethod
  def get(self, sku) -> model.Product:
    # …

On écrit adapte les application services :

def add_batch(
  ref: str, sku: str, qty: int, eta: Optional[date],
  uow: unit_of_work.AbstractUnitOfWork
):
  with uow:
    product = uow.products.get(sku=sku)
    if product is None:
      product = model.Product(sku, batches=[])
      uow.products.add(product)
    product.batches.append(model.Batch(ref, sku, qty, eta))
    uow.commit()
 
def allocate(
  orderid: str, sku: str, qty: int,
  uow: unit_of_work.AbstractUnitOfWork
) -> str:
  line = OrderLine(orderid, sku, qty)
  with uow:
    product = uow.products.get(sku=line.sku)
    if product is None:
      raise InvalidSku(f'Invalid sku {line.sku}')
    batchref = product.allocate(line)
    uow.commit()
  return batchref

Le fait que notre aggregate manipule de nombreux objets à chaque fois peut poser la question de la performance.
- On a fait en sorte que notre aggregate nous permette de charger en une seule transaction l’ensemble des objets dont on peut avoir besoin, et écrire en une seule transaction l’ensemble des objets qui peuvent changer. On évite les nombreux allers retours habituels avec la base.
- On sait que l’ordre de grandeur de nos batchs pour un même sku est de quelques dizaines. Ça reste très raisonnable.
- Si l’ordre de grandeur était de plusieurs milliers ou plus et que la perte de performance était inacceptable, on aurait pu :
  - Faire du lazy loading pour les batchs d’un même aggregate. SQLAlchemy peut nous aider à faire ça.
  - Choisir une autre délimitation pour notre aggregate. Après tout, le choix de la délimitation est un trade off entre performance et capacité à faire respecter des invariants.
Maintenant qu’on a notre aggregate, on va réfléchir à la manière de répondre aux problèmes de concurrence.
- On a le choix entre l’optimistic concurrency où on exécute toutes les transactions et laisse échouer celles qui ont un conflit et se terminent en dernier, et la pessimistic concurrency où une transaction va bloquer tous les objets dont elle a besoin jusqu’à ce qu’elle ait fini.
  - L’avantage de l’optimistic concurrency est la performance, et le désavantage c’est que si’il y a des conflits, il faudra un mécanisme de retry pour les requêtes qui finissent en erreur à cause des problèmes de concurrence.
- Une première manière de faire l’optimistic concurrency est d’utiliser un compteur au sein de notre aggregate : de cette manière on s’assure que deux transactions qui touchent quoi que ce soit dans un même aggregate toucheront forcément un champ commun et seront donc en concurrence pour de l’écriture.
  - On doit d’abord se poser la question de l'endroit où se trouvera le compteur.
    - Le plus logique serait qu’il soit dans le unit of work puisqu’il s’agit d’un sujet lié à la notion d’atomicité des transactions. Ceci dit, dans notre cas on se retrouve avec un souci technique qui est qu’on ne sait pas comment savoir quel product a changé, et donc lequel doit voir son compteur incrémenté. Il faudrait que le unit of work ou le repository se souvienne de l’état du product avant et puisse comparer avec après le passage dans l’application service.
    - Une autre solution est que ce soit fait dans l’application service. C’est vrai que le compteur n’est pas vraiment un sujet lié au domaine, mais d’un autre côté avoir l’application service faire des modifications est étrange aussi.
    - La troisième solution est de le faire dans le domain layer, au sein même de l’aggregate. Bien que ce soit plutôt un sujet d’infrastructure, on décide de faire le trade off de ce choix là.
  - On implémente :
```
class Product:
 
  def __init__(self, sku: str, batches: List[Batch], version_number: int = 0):
    self.sku = sku
    self.batches = batches
    self.version_number = version_number
 
  def allocate(self, line: OrderLine) -> str:
    try:
      # ...
      self.version_number += 1
      return batch.reference
    except StopIteration:
      # …
```
  - On va faire un petit test pour vérifier que notre mécanisme fonctionne vraiment.
    - On va d’abord rendre notre service lent :
      def try_to_allocate(orderid, sku, exceptions): line = model.OrderLine(orderid, sku, 10) try: with unit_of_work.SqlAlchemyUnitOfWork() as uow: product = uow.products.get(sku=sku) product.allocate(line) time.sleep(0.2) uow.commit() except Exception as e: # ...
    - Puis on écrit un test pour vérifier qu’une seule des deux requêtes concurrentes pourra faire son commit : on crée deux threads qui vont exécuter immédiatement le use case d’allocation, et on vérifie à la fin qu’une seule allocation a été créée en base.
- Une autre manière d’implémenter l’optimistic concurrency serait d’utiliser un isolation level plus fort que celui par défaut read commited.
  - Par exemple serializable qui garantit que les transactions exécutées en parallèle seront équivalentes aux mêmes transactions exécutées l’une après l’autre.
  - Le défaut c’est que la transaction peut être significativement plus lente.
```
DEFAULT_SESSION_FACTORY = sessionmaker(bind=create_engine(
  config.get_postgres_uri(),
  isolation_level="REPEATABLE READ",
))
```
- Une autre option est d’implémenter une pessimistic concurrency, en utilisant select for update.
```
def get(self, sku):
  return self.session.query(model.Product)
    .filter_by(sku=sku)
    .with_for_update()
    .first()
```
Les auteurs recommandent les articles de Vaughn Vernon sur les aggregates (opens in a new tab).

Accelerate Continuous Discovery Habits