Accelerate

Preface

Les auteurs ont collecté des données de plus de 2000 organisations différentes, de toutes tailles (de la startup à la grande entreprise) et de tous les domaines.
Nicole a un background plus académique, alors que Jez et Gene ont un background plus ancré dans le développement logiciel.
Entre 2014 et 2017, les 3 auteurs ont mené une recherche sur l'efficacité des organisations qui font du logiciel, en publiant chaque année le State of DevOps Report. Ce livre résume leurs découvertes.
Ils ont principalement utilisé des sondages pour collecter leur donnée, et renvoient à la partie II de ce livre pour montrer en quoi leur méthode permet une recherche scientifique.
Ce qu'ils ont fait chaque année :
- 2014 :
  - Ils ont eu une approche plutôt exploratoire, en essayant de savoir quelles étaient les caractéristiques de la delivery logicielle dans les organisations, et ce qui l'impactait.
  - Ils ont découvert que :
    - Le throughput et la stabilité allaient ensemble.
    - La capacité à faire de la bonne delivery avait un impact sur la profitabilité de l'entreprise.
    - La culture et les pratiques techniques avaient un impact.
  - Ils ont fait évoluer la méthode de collecte de résultats pour avoir des éléments plus précis.
- 2015 : Ils ont confirmé les résultats de 2014, et les ont poussés plus loin.
- 2016 : Ils ont plus particulièrement exploré les pratiques techniques et leur impact, et la partie project management (l'impact des pratiques lean notamment).
- 2017 : Ils ont creusé le rôle de l'architecture, du leadership de transformation, et ont inclus les organisations à but non lucratif.

Part I: What We Found

1 - Accelerate

Le logiciel représente un des leviers majeurs de croissance pour tous types d'entreprises.
Les pratiques décrites dans ce livre peuvent être considérées comme issues du mouvement DevOps.
Il y a un écart important entre les diverses entreprises qui existent en termes de maturité sur les pratiques logicielles, et l'écart entre les meilleures et les moins bonnes organisations se creuse.
Les leaders ont tendance à surestimer la maturité de leur organisation par rapport aux subordonnés.
Pour la transformation de l'organisation, les auteurs conseillent d'utiliser un capability model plutôt qu'un maturity model : il s'agit d'être dans une amélioration continue et de se baser sur des outcomes pour suivre l'évolution.
Il y a souvent un désaccord sur quels aspects se concentrer dans une transformation. Les auteurs ont trouvé 24 éléments qui peuvent être suivis facilement, et dont ils ont montré qu'ils permettent la performance de la delivery et de l'organisation.
Vu que l'étude inclut tout type d'organisations (toute tailles, greenfield comme brownfield, tous types de stacks techniques etc.), le contenu du livre s'appliquera aussi à notre organisation.

2 - Measuring Performance

La performance de la production logicielle est compliquée à mesurer. Les méthodes qui le font se concentrent en général sur les outputs plutôt que les outcomes, et sur le local plutôt que le global.
- Par exemple, certaines entreprises mesurent le nombre de lignes de code, ce qui donne du logiciel difficile à maintenir..
- Les entreprises utilisant les méthodes agiles utilisent parfois la notion de vélocité pour mesurer la productivité. Ça conduit les équipes à surestimer les tâches et moins collaborer avec les autres équipes.
- Certaines entreprises tentent de maximiser l'utilisation des développeurs, mais ça mène à des équipes incapables de réaliser les tâches à cause du travail non planifié qui n'a pas de place.
Pour mesurer efficacement, il faut :
- Se concentrer sur le global plutôt que le local, pour éviter par exemple un conflit entre objectifs des devs et des ops.
- Considérer les outcomes plutôt que les outputs, pour éviter de favoriser le travail inutile.
Les auteurs ont considéré 4 critères de mesure efficace de la performance :
- 1 - Le delivery lead time.
  - Dans le lean il s'agit du temps entre une demande du client, et la livraison.
  - Dans le développement logiciel, il s'agit du temps pour réaliser un changement et l'amener en production. On compte ici seulement la partie delivery parce qu'elle est plus stable que la partie discovery.
  - Les auteurs le mesurent comme étant le temps entre le code commité et le code qui tourne en production.
  - Avoir un lead time court permet d'avoir un cycle de feedback plus rapide.
- 2 - La fréquence de déploiement.
  - C'est un proxy pour le batch size dans le lean. L'idée c'est de réduire le batch size pour baisser la variabilité et le risque de défaut.
  - Les auteurs le mesurent comme étant le nombre de déploiements en production faits par unité de temps.
- 3 - Le temps moyen pour restaurer le système.
  - Il s'agit d'une métrique de stabilité.
  - Les auteurs le mesurent comme étant la durée pour rétablir le service dans le cas où il a été interrompu ou dégradé.
- 4 - Le pourcentage d'échec suite à un changement.
  - Il s'agit d'une métrique de qualité.
  - Les auteurs le mesurent comme étant le pourcentage de changements qui ont mené à une interruption ou une dégradation du système.
Les auteurs ont utilisé la technique statistique du cluster analysis pour regrouper les organisations par paquets.
- Ils ont constaté que les organisations performaient en général à peu près de la même manière sur les 4 critères. Ca veut dire qu'il n'y a pas de compromis entre la vitesse et la stabilité ou la qualité, puisque certains critères mesurent la vitesse, et d'autres la stabilité ou la qualité.
Pour démontrer que les critères choisis sont pertinents vis-à-vis de l'organisation, les auteurs ont aussi demandé aux sondés comment leur organisation performait d'un point de vue profitabilité et parts de marché.
- Les données montrent que les organisations qui performant bien sur les 4 critères sont deux fois plus performantes en termes de profitabilité que les mauvais performers sur les 4 critères.
- Le même résultat a été trouvé en utilisant des critères de performance organisationnelle non commerciaux : quantité et qualité de services et de biens, satisfaction des clients etc.
Etant donné que la delivery logicielle a un impact sur l'organisation, les auteurs conseillent de garder les logiciels stratégiques dans l'entreprise, et de sous-traiter ou utiliser des logiciels-as-a-service pour les logiciels non stratégiques.
- Il s'agit du cœur du Wardley Mapping.
Attention par contre à s'assurer d'abord d'avoir une culture d'amélioration continue et d'apprentissage avant d'essayer d'avancer sur ces métriques dans notre organisation. Si l'organisation est pathologique, les employés cacheront des choses et falsifieront les chiffres.

3 - Measuring and Changing Culture

La culture d'une organisation est en général divisée dans le milieu académique en 3 niveaux :
- 1 - Les basic asumptions qui représentent les comportements ancrés et difficiles à conceptualiser par les acteurs eux-mêmes.
- 2 - Les values qui peuvent être discutées par les acteurs, et qui sont ce qu'on appelle habituellement “culture” pour une organisation ou une équipe.
- 3 - Les artifacts qui sont les plus visibles, et sont constitués par des documents écrits, des procédures, des rituels etc.
Les auteurs de ce livre ont choisi de se concentrer sur le 2ème niveau, et ont en particulier choisi le modèle de Westrum.
- Ils s‘agit de classifier les organisations en 3 catégories :
  - Pathological : le management se fait par la peur et la menace. Les employés font souvent de la rétention ou de la distorsion de l'information pour des raisons politiques.
  - Bureaucratic : chaque département établit ses règles et procédures, et insiste sur leur strict respect. Suivre les règles est plus important que la mission.
  - Generative : ce qui est mis en avant c'est la performance et l'accomplissement de l'objectif de l'organisation. Tout découle de ça.
- Pour Westrum, le type d'organisation influence grandement la manière dont l'information circule à l'intérieur de celle-ci.
- Le modèle de Westrum indique que les organisations génératives ont 3 avantages :
  - Les employés collaborent mieux et ont un plus grand niveau de confiance.
  - La mission étant mise en avant, les querelles personnelles ou de département passent au second plan.
  - La hiérarchie joue un rôle mineur comparé aux autres types.
- Les auteurs ont pu démontrer que le type génératif d'organisation mène à une meilleure performance de delivery et organisationnelle.
- Ils ont aussi pu montrer que les pratiques comme la continuous delivery et les pratiques de lean management permettent d'aller vers le type génératif.
Pour mesurer le type de culture d'organisation, les auteurs utilisent des questions de type Likert, c'est-à-dire la possibilité de mettre entre “Strongly disagree” et “Strongly agree” avec 7 niveaux de granularité.
- Une fois les mesures obtenues, les auteurs font une analyse de cohérence des données avant de les utiliser pour des interprétations : il s'agit d'analyser un construct.
  - Est-ce que les choses qui doivent aller ensemble ont été effectivement répondues ensemble, est-ce que les éléments qui ne sont pas liés ne le sont effectivement pas etc.
  - Leur analyse démontre que le construct basé sur le modèle de Westrum est fiable.
Un autre construct a été fait avec les 4 métriques de la delivery performance, mais seules 3 des métriques ont passé l'analyse pour former un construct cohérent : le delivery lead time, la fréquence de déploiement et le temps pour restaurer le système.
- Le pourcentage d'échec après changement ne fait pas partie du construct, bien qu'il soit aussi corrélé aux autres.

4 - Technical Practices

La continuous delivery consiste à pouvoir livrer en continu. Elle a les caractéristiques suivantes :
- La qualité est intégrée au processus de développement.
- Les changements sont de petite taille.
- Les tests sont automatisés.
- L'équipe est dans une démarche d'amélioration permanente.
- Chacun est responsable d'atteindre les objectifs organisationnels.
- Côté technique :
  - La configuration est versionnée, et appliquée automatiquement dans les étapes de build, test et déploiement.
  - Les changements sont intégrés en continu.
  - Les tests sont écrits en même temps que le code.
Les auteurs ont mesuré, et montré que les caractéristiques suivantes participaient à améliorer la performance de la delivery (en réalisant des constructs pour la plupart):
- L'utilisation d'un système de versionning, non seulement pour le code, mais aussi pour la configuration système et la configuration de l'application.
  - Le fait que la configuration système et la configuration de l'application soit versionnée a une corrélation particulièrement forte avec la performance de la delivery.
- L'utilisation d'une suite de tests automatisés joués régulièrement.
  - Le fait que ces tests soient fiables (pas de faux positifs ou négatifs) joue aussi dans la corrélation avec la performance de la delivery.
  - Les tests écrits par les développeurs, plutôt que par des QA ou des sous-traitants, est aussi corrélé à la performance.
- Le déploiement automatisé.
- L'intégration continue, aussi appelé trunk-based development, où une branche ne dure pas plus d'un jour avant d'être intégrée à la branche principale.
- Le shift left sur la sécurité, c'est-à-dire qu'elle soit intégrée au processus de développement.
- La disponibilité de données pour réaliser des tests : les équipes de développement peuvent disposer de telles données pour jouer les tests au besoin.
Les auteurs ont trouvé que les pratiques associées à la continuous delivery avaient :
- Un impact positif sur la performance de delivery :
  - Un meilleur résultat sur les 4 métriques de performance de delivery.
- Un impact positif sur la performance organisationnelle :
  - Une tendance vers la culture générative au sens de Westrum.
  - Le fait que les employés s'identifient fortement à l'organisation.
- Un impact positif sur le bien-être des employés :
  - Un taux de burnout plus faible chez les employés.
  - Un plus faible ressenti de “douleur” lié au déploiement de la part des employés.
- Un impact positif sur la qualité :
  - Un plus faible pourcentage d'échec suite à un changement, qui est une métrique de qualité en plus de faire partie des 4 métriques de performance de la delivery.
  - Une meilleure qualité du produit perçue par les employés.
  - Un plus faible pourcentage de temps passé sur du travail non prévu, et à résoudre les bugs remontés par les clients.

5 - Architecture

La continuous delivery permet d'améliorer la performance sous plusieurs aspects, mais elle est parfois difficile à mettre en place quand l'architecture des systèmes existants n'est pas adaptée.
Les auteurs ont récupéré des données de différents types de systèmes, mais ont trouvé que seuls les cas où le logiciel est sous-traité, et le cas où c'est un système mainframe avaient une performance de delivery moindre.
- Le fait que les systèmes soient greenfield, anciens, auto-hébergés ou non, service oriented ou non, incluant du logiciel embarqué ou non etc. n'a pas de corrélation avec la performance.
Les auteurs ont trouvé que la caractéristique importante était que les systèmes soient faiblement couplés.
- Ceux qui performent le mieux répondent à ces caractéristiques :
  - Ils n'ont pas besoin d'un environnement intégré type staging / pré-production pour la plupart de leurs tests.
  - Ils déploient leur application/service indépendamment des autres équipes.
  - Ils peuvent faire des changements majeurs dans leur application sans l'accord d'une personne extérieure à l'équipe, et sans coordination avec d'autres équipes.
- Ca implique que les équipes soient pluridisciplinaires pour pouvoir réaliser leurs tâches sans avoir à communiquer des détails de ces tâches avec d'autres équipes.
Ils ont trouvé que pour les high-performers, plus l'organisation est grande et plus le nombre de déploiements par développeur est grand.
- A l'inverse, pour les low performers, la fréquence de déploiement par développeur baisse quand l'organisation est plus grande.
Les auteurs ont trouvé que globalement, bien que la standardisation amène certains bénéfices, laisser les équipes choisir leurs outils et frameworks augmentait la performance de delivery et de l'organisation.
- Ça n'empêche que la standardisation dans des domaines particuliers est plus efficace, comme par exemple l'architecture et la configuration de l'infrastructure, ou encore les librairies liées à la sécurité.
- Il s'agit en fait de laisser les équipes choisir leurs outils, y compris des outils standards dans le cas où ils le trouvent pertinent et où ça leur facilite la vie.
- Ils ont aussi trouvé que le plus efficace pour les architectes était qu'ils se concentrent sur le fait d'aider les développeurs à atteindre leurs outcomes, en aidant à une architecture découplée par exemple, et non pas qu'ils se concentrent sur le choix des outils.

6 - Integrating InfoSec into the Delivery Lifecycle

Les auteurs ont montré qu'intégrer la sécurité dans la phase de développement (shift left) est corrélé avec une meilleure performance de la delivery.
- Les high performers passent aussi 50% de temps passé en moins à régler les dommages liés au manque de sécurité, par rapport aux low performers.
Intégrer la sécurité au développement passe par :
- Former les développeurs aux pratiques de sécurité.
- Que les experts en sécurité fournissent des outils et librairies de sécurité pour les développeurs.
- Que les experts en sécurité interviennent auprès des développeurs pendant le développement des features, plutôt qu'à une phase séparée et ultérieure.

7 - Management Practices for Software

Historiquement les logiciels étaient principalement gérés par un management de projet. Après les années 2000, la méthodologie agile et le lean se sont peu à peu imposés. Le lean a initialement été adapté pour le logiciel par les livres de Mary et Tom Poppendieck.
La recherche menée par les auteurs s'intéresse en particulier à l'impact des pratiques issues du lean sur la performance de la delivery. Ils ont spécifiquement étudié 4 pratiques :
- 1 - Le fait de limiter le nombre de tâches en parallèle, et d'utiliser cette limitation pour améliorer le process et l'efficacité.
  - Les auteurs posent spécifiquement la question de savoir si la limitation permet aux sondés l'amélioration du process et du throughput.
- 2 - Le fait d'afficher graphiquement les métriques de productivité et l'état actuel du travail, y compris les défauts, à la fois pour les leaders et les employés.
  - Les auteurs demandent à quel point ces visuels sont disponibles facilement pour tout le monde.
- 3 - Le fait d'utiliser les données de monitoring et de performance pour prendre des décisions business au quotidien.
- 4 - Le fait d'avoir un process review du code “light”.
  - Les auteurs ont mesuré l'impact d'un organisme externe à l'équipe qui doit valider les changements de code, le peer reviewing à l'intérieur de l'équipe (pair programming ou asynchrone), et le fait de n'avoir aucun mécanisme de review.
  - Le résultat est que les équipes qui utilisent le peer review et celles qui n'ont pas de mécanisme de review du tout ont une meilleure performance de la delivery que les autres.
  - Les reviews par un organisme externe à l'équipe ralentissent la delivery, mais n'apportent pas plus de stabilité.
Les auteurs ont trouvé que les pratiques de lean management mesurées menaient à :
- Une culture de type générative.
- Une meilleure performance de la delivery.
- Moins de burnout chez les employés.

8 - Product Development

Ce qu'on appelle agile n'en est souvent pas vraiment : on passe de longs mois à attribuer le budget, faire de l'analyse, créer des requirements, qui donnent lieu à de gros projets de delivery, avec le feedback client laissé pour la fin.
- Le lean et le mouvement lean startup prônent au contraire la product discovery auprès des clients, depuis le début et tout au long du développement des fonctionnalités.
- Les auteurs citent The Lean Startup d'Eric Ries, qui s'est inspiré du lean, du design thinking, et du travail de Steve Blank.
Les auteurs ont mesuré les pratiques produit suivantes issues du lean :
- Le fait de découper les fonctionnalités en use-cases réalisables en moins d'une semaine.
- Le fait que l'équipe ait la visibilité et la compréhension de l'ensemble de la chaîne du business à la delivery.
- Le fait que les organisations fassent de la discovery régulière, et utilisent le résultat de cette discovery comme feedback pour concevoir leurs produits.
- Le fait que les équipes aient l'autorité pour modifier les spécifications pendant le développement, sans demander la permission.
Les auteurs ont trouvé que ces pratiques prédisaient :
- La performance de la delivery.
- La performance organisationnelle.
- Une culture générative.
- Un taux de burnout plus faible des employés.

9 - Making Work Sustainable

Les auteurs ont mesuré deux éléments qui sont le signe que le travail n'est pas soutenable par les employés.
La “douleur” liée au déploiement.
- Il s'agit d'un bon indicateur pour mesurer le degré d'anxiété des employés, à quel point le déploiement est un sujet de stress pour eux.
- Les auteurs ont trouvé que la faible douleur liée du déploiement était corrélée avec :
  - Les pratiques liées à la continuous delivery.
  - L'architecture découplée.
  - La performance organisationnelle.
  - Le type de culture générative au sens de Westrum.
- Les raisons pour lesquelles il y a de la douleur liée au déploiement peuvent être quand :
  - Le logiciel est déployé selon une procédure complexe parce qu'il n'a pas été pensé pour la déployabilité. Les échecs sont nombreux et difficiles à investiguer.
  - Il faut faire des changements manuels au moment du déploiement.
  - Dans des organisations silotées techniquement, le déploiement implique plusieurs équipes.
Le burnout.
- Le burnout est une maladie qui fait que le malade se sent insignifiant, désespéré, épuisé, inefficace et cynique. Il peut mener à des dépressions et même au suicide.
- Christina Maslach a fait une étude en 2008, et a retenu les 6 facteurs suivants prédisant le burnout :
  - 1 - Trop de travail.
  - 2 - Impossibilité pour l'employé d'influer sur ce qui le concerne au quotidien.
  - 3 - Récompenses insuffisantes.
  - 4 - Environnement où les personnes ne s'entraident pas.
  - 5 - Manque d'équité dans le processus de prise de décision.
  - 6 - Différence entre les valeurs de l'employé et celles de l'entreprise.
- Pour mesurer le burnout, les auteurs ont mesuré :
  - Si les répondants se sentaient épuisés.
  - S'ils se sentaient indifférents ou cyniques, ou encore inefficaces.
  - Si leur travail avait un impact négatif sur leur vie.
- Globalement, les auteurs ont montré que les pratiques de continuous delivery et de lean management réduisaient le burnout.
- Parmi les facteurs contribuant au burnout, les auteurs ont trouvé :
  - La culture organisationnelle pathologique. Au lieu de ça, il faut traiter les erreurs comme une opportunité d'apprendre.
  - La douleur liée au déploiement.
  - Les leaders inefficaces à supporter l'équipe.
  - Le faible investissement de l'organisation dans le DevOps.
  - Le manque de temps accordé aux employés pour expérimenter, apprendre.
  - Une discordance entre les valeurs de l'employé et celles de l'entreprise, sachant que ce qui compte c'est les valeurs réelles de l'entreprise vécues par les employés.

10 - Employee Satisfaction, Identity, and Engagement

Les auteurs ont trouvé que la satisfaction et l'engagement des employés prédisent :
- La réduction du burnout.
- La performance organisationnelle, à travers la profitabilité et les parts de marché.
L'engagement et la loyauté des employés a été mesurée par le NPS (Net Promoter Score), où on demande aux employés s'ils recommanderaient leur entreprise à un ami pour venir y travailler, puis s'ils recommanderaient leur équipe.
- Les bon performers recommandent leur entreprise 2.2 fois plus que les mauvais performers.
- Cette métrique s'est révélée corrélée à :
  - La collecte et la prise en compte des feedbacks utilisateurs pour construire le produit.
  - La capacité des équipes produit à avoir une visibilité sur l'ensemble du flow business, discovery et delivery.
  - L'identification des employés aux valeurs de leur entreprise, et leur effort pour qu'elle réussisse.
Les auteurs ont étudié l'identification des employés à leur entreprise.
- Ils ont trouvé que la continuous delivery et les pratiques de management lean impactent l'identification des employés à leur entreprise, et qui à son tour impacte positivement la performance organisationnelle.
- Pour mesurer l'identification, ils ont posé des questions issues d'une autre étude, en mode Likert :
  - Je suis heureux de travailler dans cette entreprise en particulier.
  - Je parle de mon entreprise dans mon entourage.
  - Je suis prêt à faire un effort au-delà de ce qui est attendu pour mon entreprise.
  - Mes valeurs correspondent à celles de mon entreprise.
  - Mes collègues et moi travaillons vers le même objectif.
  - Je sens que mon entreprise se soucie de moi.
- Étant donné que l'identification inclut l'identification aux valeurs de l'entreprise, on a une réduction du burnout quand l'identification est forte.
- La plupart des entreprises confient des requirements sous forme de gros batch à des équipes de delivery : ça a pour conséquence que les équipes se sentent déconnectées de leur travail puisqu'elles n'ont pas de prise dessus, et en particulier déconnectés des éventuels mauvais outcomes.
  - Ce que les auteurs conseillent c'est de mettre en place plutôt une culture de l'expérimentation et de l'apprentissage, à travers des pratiques techniques et managériales.
Les auteurs ont trouvé que la continuous delivery et les pratiques de management issues du lean favorisent la satisfaction au travail, qui elle-même prédit la performance organisationnelle.
- Pour mesurer la satisfaction, ils ont regardé si les employés étaient satisfaits de leur travail, s'ils avaient les bons outils et ressources, et si leurs compétences étaient mises à profit.
- Les pratiques DevOps qui sont les plus corrélées avec la satisfaction au travail sont :
  - Le monitoring proactif.
  - L'automatisation des tests et du déploiement.
  - Le fait que les employés prennent des décisions basées sur les boucles de feedbacks.
Concernant la diversité dans les équipes, de nombreuses études montrent de manière constante qu'elle impacte positivement la performance.
- Les auteurs ont trouvé que seules peu d'équipes avaient de la diversité de genre et en termes d'inclusion de minorités.
- Pour que la diversité fonctionne vraiment, il faut qu'il y ait aussi de l'inclusion, c'est-à-dire que toutes les personnes se sentent intégrées, et reconnues pour ce qu'elles apportent.

11 - Leaders and Managers

Les auteurs pensent que le leadership est fondamental pour mettre en place les pratiques qui permettent aux organisations d'être performantes.
- Le leadership transformationnel consiste à inspirer les équipes par la vision, les valeurs. Il s'agit de faire en sorte que les employés s'identifient à l'entreprise et servent ses objectifs, là où le servant leadership consiste à aider les employés à se développer.
Les auteurs ont choisi de se concentrer sur le leadership transformationnel.
- Pour l'appréhender et construire un questionnaire, ils se sont basés sur le modèle de Rafferty et Griffin où le leader a :
  - Une vision d'où l'organisation doit aller dans les années qui viennent.
  - Une communication inspirante et motivante.
  - Stimule et challenge les subordonnés.
  - Montre de la considération pour les subordonnés et leur situation personnelle.
  - Félicite les réussites des subordonnés.
- Les auteurs ont trouvé que les organisations où les leaders avaient ces caractéristiques étaient beaucoup plus souvent dans les high performers en termes de performance de la delivery et organisationnelle.
  - C'est aussi corrélé avec la satisfaction et la loyauté des employés.
Les auteurs ont trouvé que les trois pratiques de management suivantes sont corrélées avec la performance de la delivery :
- La collaboration cross-fonctionnelle passe par :
  - Créer une relation de confiance avec les autres équipes, en ayant un comportement prévisible et en tenant ses promesses.
  - Favoriser les mouvements de développeurs entre équipes.
  - Encourager les travail qui facilite la collaboration.
- Le climat d'apprentissage passe par :
  - Mettre en place un budget de formation et encourager à l'utiliser.
  - Libérer du temps pour que les employés apprennent et explorent des idées, par exemple 15 ou 20%.
  - Faire en sorte que l'échec soit une opportunité d'apprentissage.
  - Mettre en place des moments de partage de savoir.
- Le fait d'utiliser efficacement les Outils passe par :
  - Laisser les équipes choisir leurs outils.
  - Faire du monitoring une priorité.

Part II - The Research

12 - The Science Behind the Book

La recherche primaire consiste à ce que l'équipe qui fait l'étude collecte elle-même la donnée. Elle a donc un certain contrôle sur le type de données dont elle a besoin. La recherche secondaire consiste à ce que l'équipe qui fait l'étude récupère les données récoltées par d'autres personnes. Elle est limitée à ce qui existe déjà.
La recherche qualitative consiste à récolter des données non chiffrées, et à l'analyser dans sa diversité. La recherche quantitative consiste à récolter des données chiffrées, et baser l'analyse sur ça. Ça a l'avantage de pouvoir être traité par ordinateur, et par des méthodes statistiques.
Jeffrey Leek a proposé un modèle pour classifier les analyses statistiques des données, du plus simple au plus complexe :
- 1 - Descriptive : il s'agit de décrire la donnée, et de permettre de la comprendre.
  - Par exemple, le rapport de recensement de la population est une analyse descriptive.
  - Dans ce livre, les auteurs utilisent ce type d'analyse pour présenter la population sur laquelle les études ont été menées.
- 2 - Exploratory : il s'agit de trouver des relations entre les données, notamment des corrélations, qui ne sont pas des causalités.
  - De nombreux exemples dans ce livre utilisent des corrélations de Pearson, qui sont les plus classiques dans les analyses de contexte business.
- 3 - Inferential predictive : il s'agit de partir de théories, et de les tester contre les faits, de la même manière que la méthode scientifique où on établit une hypothèse puis on la teste.
  - Si on ne partait pas de théories pour les tester, on prendrait le risque de trouver des corrélations aléatoires et sans aucun sens.
  - Dans ce livre, ce type d'analyse est utilisé pour vérifier que la continuous delivery l'architecture découplée,e t la culture générative impactent la performance de la delivery et la performance de l'organisation.
- 4 - Predictive : Il s'agit de prédire des événements futurs grâce à des données historiques.
- 5 - Causal : Il s'agit du gold standard pour le contexte business, où on mène une étude randomisée.
  - Un exemple d'analyse causale peut être l'A/B testing dans le cadre de la product discovery.
- 6 - Mechanistic : ce type d'analyse est plutôt adapté au monde de la physique. Il s'agit de prévoir des changements exacts, dans des conditions précises, et de faire l'expérience qui prouve que notre compréhension des phénomènes est la bonne.
La classification analysis (ou clustering analysis) est un autre type d'analyse, classé généralement en tant qu'exploratory, predictive ou causal.
- Il s'agit d'entrer des variables dans l'algorithme de clustering, et de constater des groupes se former.
- Les auteurs l'ont utilisé pour identifier les différences entre les high performers et les low performers dans les 4 métriques de performance de la delivery.
Les études derrière ce livre :
- Se basent sur une recherche primaire.
- Se base sur de la recherche quantitative, en particulier via l'utilisation des réponses type Likert qui sont chiffrées.
- Utilise les analyses de type descriptive, exploratory, inferential predictive et classification.

13 - Introduction to Psychometrics

Les gens pensent en général que les données issues de sondages ne sont pas fiables, mais c'est parce qu'ils ont une expérience des sondages dégradée par les mauvais sondages.
- On peut en particulier penser aux sondages politiques dont les questions sont souvent l'objet de manipulations ou d'incompétence des sondeurs.
Parmi les mauvaises pratiques liées aux sondages, il y a :
- Les questions orientées, où la formulation va biaiser le sondé. Par exemple : “Est-ce que Napoléon était petit ?” plutôt que “Comment décririez-vous la taille de Napoléon ?”.
- Les questions chargées, où le sondé ne peut pas répondre sans mentir, par exemple “Où avez-vous passé vos examens ?” si les sondés n'en ont pas forcément passé.
- Plusieurs questions en une, où on ne peut pas dire si le sondé répondait à la première partie de la question ou la deuxième.
- Un langage peu clair, ou avec lequel le sondé n'est pas familier.
Les auteurs utilisent le latent construct pour avoir des données issues de sondages plus fiables. Ils vont mesurer plusieurs aspects d'un concept transformé en construct, à travers des questions pour chaque aspect.
- C'est le cas par exemple pour le construct de la culture organisationnelle, inspirée du modèle de Westrum.
- La technique permet de bien réfléchir à ce qu'on mesure. Elle force notamment à définir les termes, et ce que les réponses veulent dire et impliquent.
- Elle permet de voir les résultats sous plusieurs angles, et d'éliminer plus facilement les mauvaises données.
  - On collecte la donnée, puis on fait des tests d'intégrité pour vérifier qu'elle est cohérente : s'assurer que les choses qui ne devraient pas être liées entre-elles ne le sont pas, et qu'à l'inverse celles qui devraient être liées entre-elles le sont.
- Une mauvaise donnée a moins de chances de corrompre les résultats étant donné que les auteurs réalisent régulièrement des tests d'intégrité statistiques pour vérifier la nature du construct vis-à-vis des données.
  - Il est possible que les données ne soient pas cohérentes entre elles, mais que plusieurs groupes, plusieurs constructs se dégagent.
  - Une fois qu'on choisit les constructs à tester, des données individuelles qui ne respectent pas l'intégrité vis-à-vis de ce construct peuvent plus facilement être identifiées et éventuellement écartées.
- Toutes ces considérations sur les latent constructs peuvent aussi être appliquées à des mesures techniques du système, par exemple mesurer la performance d'un système sous plusieurs aspects, et pouvoir identifier des données individuelles incohérentes.

14 - Why Use a Survey

Les auteurs utilisent les sondages pour plusieurs raisons :
- 1 - La collecte est rapide.
  - Collecter des données système venant de milliers d'équipes en quelques semaines serait impossible.
  - L'analyse de la donnée leur prenait à chaque fois quelques semaines aussi, et si il s'agissait de données système, il faudrait les traiter et normaliser individuellement, ce qui prendrait là aussi bien plus que quelques semaines.
  - Il y aurait aussi des biais dans les résultats puisque les concepts que chaque équipe utilise en interne sont différents. Les sondages, au contraire, permettent de clarifier au maximum en donnant une définition de ce qu'on demande, plutôt que d'utiliser les concepts que chaque organisation a en interne.
- 2 - Il est difficile de mesurer le système de bout en bout.
  - Les mesures système mesurent des choses précises, mais il est fréquent que certains aspects ne soient pas pris en compte.
  - Les sondages au contraire font appel aux êtres humains, qui ont une expérience globale du système avec lequel ils travaillent, et peuvent en rendre compte.
- 3 - La donnée des sondages est fiable.
  - On peut la comparer à la donnée de logs venant d'un système : dans les deux cas il peut y avoir des acteurs malveillants qui la modifient, ou des personnes qui ont fait des erreurs qui la rendent fausse.
  - Il semblerait que les développeurs fassent plus confiance à la donnée de logs système parce qu'ils pensent pouvoir appréhender les erreurs, mais il en est de même pour les données de sondages avec les techniques de latent construct, vérifications d'intégrité statistiques, utilisation de termes neutres dans les questions etc.
  - Le fait que la donnée vienne de nombreux sondés la rend d'autant plus résiliente aux acteurs malveillants, qui devraient alors se coordonner en grand nombre.
- 4 - Certaines choses ne peuvent être mesurées que par des sondages.
  - Quand on veut par exemple connaître la manière dont les employés se sentent, par exemple comme proxy pour la culture organisationnelle, on est obligé de leur demander.

15 - The Data for the Project

Pour collecter leurs données, les auteurs ont visé des personnes qui étaient déjà familières avec le terme DevOps.
- Les personnes visées étaient forcément des professionnels du développement logiciel.
- Elles avaient plus de chances de terminer le sondage parce qu'elles comprenaient les concepts demandés dans les questions.
- En revanche, ça veut aussi dire qu'une part non négligeable des entreprises dont les employés ne sont pas du tout familiers avec le DevOps, la continuous integration et ce genre de concepts, ont été de fait mises de côté. Les auteurs le justifient par le fait qu'il faut toujours faire des choix, et que ça a permis de creuser davantage sur la population répondante.
Les auteurs sont conscients que certains répondants pourraient vouloir donner une bonne image de leur entreprise en disant par exemple qu'ils font de la continuous integration parce que ça fait “bien” d'en faire.
- Pour éviter ce biais, ils ont par exemple posé des questions qui décrivent chaque caractéristique de la continuous integration, par exemple tests automatisés, trunk-based development etc. et non pas si les personnes pratiquaient la continuous integration directement.
Concernant le choix de l'échantillon, les auteurs ont dû se rabattre sur un échantillon non basé sur les probabilités, pour des considérations pratiques (il n'existe pas de liste de pratiquants du DevOps dans le monde, et ils n'ont pas les moyens de piocher dedans).
- Ils ont utilisé les canaux de chacun des auteurs pour toucher un maximum de monde intéressés par le concept de DevOps.
- Ils ont utilisé les réseaux sociaux pour étendre encore plus.
- Ils ont utilisé certains canaux spécialisés pour toucher des minorités.
- Ils ont aussi demandé aux répondants d'inviter des personnes à leur tour, ce qui a l'avantage de convaincre les personnes réticentes parce qu'elles pensent qu'il s'agit d'un piège.
Les auteurs sont conscients que leur étude pourrait ne pas être représentative de l'industrie. Pour l'éviter ils :
- Ils se tiennent au courant de ce qui se passe dans l'industrie, en demandant des feedbacks à la communauté et à d'autres collègues.
- Ils demandent chaque année à des experts externes à l'étude et à la communauté, de donner des feedbacks sur leurs hypothèses, et les utilisent pour améliorer l'étude de l'année suivante.
- Ils explorent la littérature pour voir si des patterns n'émergent pas dans d'autres domaines, et qui pourraient être applicables dans le développement logiciel.

Part III - Transformation

16 - High-Performance Leadership and Management

Steve et Karen Bell pensent que le leadership dans le monde de la technologie n'est clairement pas au niveau. On fait des progrès techniques, mais on n'est pas suffisamment au clair sur le rôle des leaders.
Ils proposent d'explorer des pratiques de management efficaces au travers l'exemple d'ING Netherlands.
- La partie tech/produit a été mise dans le même bâtiment que les C-levels, parce qu'ils sont considérés maintenant comme importants.
- Ils ont une salle Obeya, où les leaders se réunissent pour discuter de la stratégie, et visualiser les différents éléments sur les murs.
  - La salle contient une zone pour :
    - Les améliorations stratégiques.
    - Le monitoring de performance.
    - La roadmap produit.
    - Les actions des leaders.
  - Elle suit un code couleur pour distinguer les problèmes par exemple.
- La topologie d'équipe est composée de tribes le long de chaque verticale business, chacune composée d'équipes autonomes, avec la règle des 2 pizzas (américaines) pour la taille de l'équipe.
  - La plupart des équipes contiennent un PM, des ingénieurs et des personnes du marketing, et travaillent autour de la valeur pour le client : on appelle cette composition le BizDevOps.
  - La squad est marquée sur le schéma comme étant démantelée une fois la mission accomplie, mission qui semble être un objectif client, et non pas une verticale produit..
  - Il y a un axe secondaire regroupant les employés par horizontale technique, il s'agit des chapters.
  - Et enfin des groupements d'expertise, par exemple autour de l'architecture.
  - Les chapters ont leur lead, de même qu'il y a un lead pour al tribe, alors que le PM est au même niveau que le reste de la squad.
- Le changement de culture dans toute l'entreprise se fait par du coaching : les top leaders accompagnés d'experts en lean coachent les autres leaders, qui à leur tour coachent le reste des employés.
- Chaque squad a sa salle, avec des visuels qui concernent son travail sur les murs : objectifs, résultats, travail en cours etc.
- Les équipes pratiquent le stand-up :
  - Il s'agit de réunions de 15 mn où chacun fait un statut sur ce qu'il fait et des problèmes qu'il rencontre. Les problèmes sont ensuite discutés et traités après le meeting, et surtout ils sont mis sur un visuel.
  - Les leaders de tribe font leur stand-up après celle de la squad, et le senior leadership encore après, ce qui permet d'avoir un système de Catchball où les problèmes qui doivent être escaladés peuvent remonter dans la journée.
- Les leaders pratiquent le Gemba walk chez les squads, en posant des questions : “Expliquez-moi votre problème, qu'est-ce que je peux faire pour vous ? Expliquez-moi ce que vous apprenez.”.
  - Les leaders sont dans une démarche de coaching, où un des objectifs est de développer les employés, plutôt que dans une démarche command and control.
- Pour choisir leurs pratiques, les équipes expérimentent, puis “standardisent” la pratique, et partagent le standard avec les autres équipes, qui pourront expérimenter le standard pour en faire un standard à eux ou non.
Pour changer la culture d'une organisation, les auteurs proposent de partir sur la piste de l'apprentissage : d'abord apprendre à apprendre, en commençant par le top management, puis aider les autres à apprendre à apprendre.
- A ING Netherlands, les leaders ont commencé par eux, en engageant des coachs pour les accompagner dans cette démarche, puis ils ont aidé les subordonnés.
- Vu qu'il s'agit d'apprentissage, il n'est pas possible de simplement copier les pratiques d'une autre entreprise. On peut s'en inspirer, mais il va falloir les expérimenter et les valider.
- Il ne faut pas non plus employer une entreprise pour faire la transformation, elle doit être faite par les employés eux-mêmes. Les consultants externes peuvent au mieux servir de coachs en apprentissage.
- Pour faire la transformation, il faut de la discipline et de la patience pour construire de nouvelles habitudes.
- Un résumé des pratiques habituelles des équipes qui performant selon Steve et Karen se trouve ici (opens in a new tab).

Introduction Continuous Discovery Habits