Codelabs under the hood

28 mars 2018

15mn

Kamal Farsaoui

Sommaire

•

Quelles features ?

•

Organisation

•

Static site generation

•

La stack

•

Le Workflow

•

La structure d'un cours

•

Comment charger un tutoriel ?

•

Génération des composants react

•

Abstract Syntax Tree (AST)

•

Comment assembler tout ça

•

Déploiement

Après plusieurs mois de travail acharné, nous avons le plaisir de vous annoncer la sortie d'Eleven Codelabs !

Codelabs

Au début de l'été 2017, l'idée d'une plateforme de tutoriels "Made in Eleven Labs" a commencé à prendre forme, en même temps que la création du projet sur github. En juillet 2017, douze astronautes se rassemblent pour brainstormer autour des features qui définiront le MVP. Le projet vise à proposer du contenu plus complet et plus didactique que les articles déjà proposés sur le Blog : des tutoriels à suivre étape après étape.

Quelles features ?

Après la réunion de brainstorm, les features retenues sont les suivantes :

Une page d'accueil affichant un splash et la liste des cours
Une navigation intuitive entre les étapes des tutoriels
Un moteur de recherche
Le display des progrès de lecture de chaque cours

Organisation

CodeLabs est un “side-project”, c’est à dire un projet développé par des volontaires sur leur temps libre, il faut donc s’assurer de garder la motivation après la phase de début de conception qui est toujours la plus excitante.

Au delà du maintien de la motivation, pour Codelabs, nous avions un double objectif : obtenir la participation de tous et l’avancée rapide du projet. Mais alors comment concilier ces deux objectifs ? Pour en savoir plus sur la démarche adoptée, vous pouvez vous rendre sur l'article de Maxime

Static site generation

Créer une application comme celle-ci implique de se confronter à des problématiques complexes, comme le fait de monter une architecture server-side, en maintenant la base de données et en utilisant des moteurs de template. Pour se soustraire à ces difficultés, nous avons opté pour une technique de génération de site statique.

Le concept de génération de site statique repose sur l'aspect serverless d'une application. Quand un utilisateur appelle une page, l'application va chercher le contenu depuis des fichiers stockés en local, plutôt que depuis des scripts server-side, qui eux iraient extraire les données depuis des bases distantes. L'absence de requêtes vers des bases de données, de traitement côté serveur, et de moteurs de templates rendent l'application particulièrement rapide.

Travailler avec des fichiers statiques permet de tirer avantage des features du SCM (Source Code Management, ce qui permet de controller le versioning du contenu. C'est extrêmement prometteur car en se mettant à la place d'un auteur, on ne peut qu'apprécier la possibilité de garder une trace de l'avancement de l'écriture des tutoriels, de pouvoir rétablir une modification. Dans la pratique c'est toujours mieux de ne pas avoir à se soucier de la perte de son contenu.

Un autre avantage est le fait de ne pas avoir à se soucier non plus de la securité grâce à l'aspect serverless et à l'absence de données utilisateurs, ce qui évite beaucoup de contraintes.

La stack

Les choix sont multiples lorsqu'il s'agit de définir une stack pour votre projet. Mais chez Eleven Labs nous sommes assez fan de l'ecosystème React, qui rend très accessible un développement web "moderne", si l'on considère à quel point cela demande peu d'efforts de construire une expérience utilisateur qualitative. Nous ne couvrirons pas plus en détails cet aspect, car plusieurs articles s'attardent déjà sur React et Redux. Mais vous connaissez le principe ! Webpack, Components, Props, State, Actions, reducers... et tout le toutim.

Le Workflow

Nous voulions garder quelque chose de simple, donc nous avons gardé le process déjà éprouvé du blog :

Écrire les articles en Markdown
Stocker les fichier dans le repo (ce qui permet de bénéficier des avantages du système de Pull requests et de reviews).

La structure d'un cours

Un tutoriel est structuré, dans son dossier, par les fichiers suivants :

├── course
|   ├── index.json
|   ├── index.md
|   ├── step1.md
|   ├── step2.md
|   ├── ...

Le ficher index.json contient les metadata d'un tutoriel, voici un exemple :

{
  "title": "GraphQL with Apollo",
  "permalink": "/en/graphql-with-apollo/",
  "excerpt": "In this tutorial we are going to build a GraphQL server using the Apollo framework",
  "slug": "graphql-with-apollo",
  "stepTitles": [
    "Introduction",
    "Install GraphQL server",
    "Configure the Database",
    "Create GraphQL types",
    "Resolve queries",
    "Resolve mutations"
  ],
  "date": "2018-03-20",
  "cover": "/assets/2018-03-20-graphql-with-apollo/cover.jpg",
  "authors": [
    {
      "name": "Jonathan Jalouzot",
      "username": "captainjojo"
    }
  ]
}

Comment charger un tutoriel ?

Le chargement d'un tutoriel se fait en récupérant les fichiers Markdown via des appels XMLHttpRequest, le fait que les fichier soient stockés localement, permet d'y accéder statiquement. Quand un lecteur choisit un tutoriel, nous lazyloadons les fichiers * .md à la demande de l'utilisateur.

Génération des composants react

Cette partie explique la transformation du Markdown en composants react, ce qui se concrétise par le display d'un tutoriel au lecteur. Cette feature critique devait être traitée avec la plus grande attention. À cause de sa nature sensible, nous ne voulions pas d'une librairie tierce qui assumerait la transformation du Markdown en Composants, même si il en existe un bon nombre. Cette feature étant constitutive de la valeur ajoutée du projet, nous ne pouvions envisager qui puisse éventuellement avoir des problèmes lors d'upgrades, ou de se débattre avec des bugs insolvables. Nous voulions un contrôle total au fil de l'eau.

Manager le Markdown signifie que nous devons le parser dans quelque chose plus structuré, qui puisse facilement être interprété, dans l'optique d'avoir plus de contrôle sur notre process d'évolution des composants.

Abstract Syntax Tree (AST)

Un "Abstract Syntax Tree", ou seulement "Syntax tree", est une représentation en arborescence de la structure syntaxique abstraite du code source écrit dans un langage de programmation. Wikipedia

L'AST est un concept largement répandu dans la génération de code source. Il est utilisé par les compilateurs dans l'analyse de syntaxe, à différentes fins. En premier lieu, l'analyse sémantique permet au compilateur de vérifier si un programme utilise correctement les éléments de langage. Il est aussi utilisé dans le type-checking (ex : Typescript, Flow...) and dans bien d'autres cas.

Dans notre contexte, AST est la représentation de la structure du Markdown. Ça fournit un moyen fiable de naviguer à travers les noeuds (Paragraphes, titres, listes...) qui composent un texte en Markdown.

En voici un exemple :

hello *world*

Et son AST :

{
  "type": "Document",
  "children": [
    {
      "type": "Paragraph",
      "children": [
        {
          "type": "Str",
          "value": "hello ",
          "loc": {
            "start": { "line": 1, "column": 0 },
            "end": { "line": 1, "column": 6 }
          },
          "range": [0, 6],
          "raw": "hello "
        },
        {
          "type": "Emphasis",
          "children": [
            {
              "type": "Str",
              "value": "world",
              "loc": {
                "start": { "line": 1, "column": 7 },
                "end": { "line": 1, "column": 12 }
              },
              "range": [7, 12],
              "raw": "world"
            }
          ],
          "loc": {
            "start": { "line": 1, "column": 6 },
            "end": { "line": 1, "column": 13 }
          },
          "range": [6, 13],
          "raw": "*world*"
        }
      ],
      "loc": {
        "start": { "line": 1, "column": 0 },
        "end": { "line": 1, "column": 13 }
      },
      "range": [0, 13],
      "raw": "hello *world*"
    }
  ]
}

En se basant sur cet AST, il devient facile de prédire ce qui se passe ensuite. On sait que parmi chaque propriété de noeud, il y a un type, et bien souvent une propriété children. Cela nous rappelle les bases du développement React (props, children). Maintenant voyons comment cela va nous aider à générer des composants React.

bien sûr, nous allons créer programmatiquement des composants durant la traversée de l'AST, donc nous devrons être attentifs à la signature de certaines fonctions dans l'API React. en particulier createElement et createFactory :

function createElement<P>(
    type: SFC<P> | ComponentClass<P> | string,
    props?: Attributes & P | null,
    ...children: ReactNode[]): ReactElement<P>;

function createFactory<P>(type: ComponentClass<P>): Factory<P>;

N.B.: Il y a plusieurs signatures pour ces fonctions, mais ici j'utilise les plus classiques.

Comme on peut le voir, createElement accepte une string en tant que type, et ce doit être un "tag name" en HTML. Donc si on se base sur ces types dans l'AST généré, on a Document, Paragraph, Emphasis et Str. On peut alors considérer le mapping suivant :

const AST_NODES = {
  Document: 'div',
  Paragraph: 'p',
  Emphasis: 'em',
};

Le type Str est une simple string qui doit être ajoutée à l'HTML en tant que noeud de texte, de srote à ce que nous n'ayons pas de tag name à lui spécifier.

Nous allons utiliser createFactory afin de créer une fonction qui retourne un composant.

const createComponent = ast => React.createFactory(
  class extends React.Component {
    static displayName = ast.type;
    static defaultProps = {};

    shouldComponentUpdate() {
      return false;
    }

    render() {
      return React.createElement(
        AST_NODES[ast.type], // type
        {}, // props
        [], // content
      );
    }
  },
);

createComponentprend un AST et retourne une usine de composants qui créé à son tour un composant react avec un props et un children vides (pour le moment). Mais comment allons nous remplir les blancs ? L'AST est une arborescence, on doit donc réfléchir en termes de récursivité. createComponentsera envoyé vers un loop qui parcourra le document de l'AST principal. On doit donc l'appeler encore à l'intérieur des composants qui ont des children dans le but de maintenir le parsing opérationnel jusqu'à ce qu'il atteigne les leafs (type === ‘Str’).

Maintenant jetons un oeil à la fonction walk :

function* walk(ast) {
  if (ast.children) {
    for (const child of ast.children) {
      yield child.type === 'Str' ? child.raw : createComponent(child);
    }
  }
}

C'est un simple loop for of qui rend le contenu créé, et quand il atteint un noeud Str, il rend simplement sa valeur. Donc lorsqu'on appelle createElement, on peut aussi appeler le walk generator, afin qu'il parse le niveau de composants suivant :

  ...
  render() {
    return React.createElement(
      AST_NODES[ast.type],
      {},
      [...walk(ast)],
    );
  }
  ...

Comme createComponent peut retourner à la fois une fonction (type !== str) ou une string (type === str), on ne peut pas avoir de fonctions filles d'un composant React, on doit donc les résoudre afin qu'elles puissent extraire les réels composants :

const resolveRenderer = renderer => (
 typeof renderer === 'function' ? renderer() : renderer
);

  ...
  render() {
    return React.createElement(
      AST_NODES[ast.type],
      {},
      [...walk(ast)].map(resolveRenderer),
    );
  }

Comment assembler tout ça

On a créé une usine qui génère les composants React depuis du texte en markdown. Cette usine parse ensuite le markdown en utilisant markdown-to-ast, et il traverse récursivement l'arbre dans le but de créer un contenu pour chaque composant :

import React from 'react';
import { parse } from 'markdown-to-ast';

const AST_NODES = {
  Document: 'div',
  Paragraph: 'p',
  Emphasis: 'em',
};

function* walk(ast) {
  if (ast.children) {
    for (const child of ast.children) {
      yield child.type === 'Str' ? child.raw : createComponent(child);
    }
  }
}

const resolveRenderer = renderer => (
  typeof renderer === 'function' ? renderer() : renderer
);

const createComponent = ast => React.createFactory(
  class extends React.Component {
    static displayName = ast.type;
    static defaultProps = {};

    shouldComponentUpdate() {
      return false;
    }

    render() {
      return React.createElement(
        AST_NODES[ast.type],
        {},
        [...walk(ast)].map(resolveRenderer),
      );
    }
  },
);

const generateComponents = (md) => [...walk(parse(md))];

const components = generateComponents('hello *world*');

ReactDOM.render(
  <div>
    {components.map(renderer => renderer())}
  </div>,
  document.getElementById('root'),
);

Ce que vous venez de lire est une version très simplifiée du process de génération dans codelabs. Voyons ce que ça donne :

Et voici la représentation React des composants générés :

React components result

Voici le HTML correspondant :

Html result

Déploiement

Le déploiement d'une application comme Codelab est assez complexe. En effet, la problématique est que les développeurs qui travaillent sur le projet sont dispersés dans tout Paris. Il faut donc avoir un Continuous Delevery simple et rapide.

Nous avons opté, comme pour notre blog, pour un déploiement lors du merge d'une PR dans Master. Travis permet facilement d'utiliser des scripts de déploiement dans le Cloud lors de cet évènement, notre choix s'est porté sur cette solution.

Le déploiement se fait en deux étapes :

d'un coté les assets (Images, mais aussi les différents tutos en markdown) dans un Bucket Google Cloud
de l'autre un serveur Nginx via AppEngine qui affiche le React.

Dans la config travis, que vous trouverez ici. Vous pouvez voir que dans la partie deploy nous utilisons les providers gae pour Google App Engine, et gcs pour Google Cloud Storage.

C'est assez simple à mettre en place, il suffit de suivre la documentation :

gae
gcs

Dans notre cas nous déployons dans le Bucket le dossier _posts qui contient les assets, ainsi que les tutos en markdown. Puis dans le App Engine, le dossier Nginx qui va déployer une machine docker avec Nginx et le code React.

Auteur(s)

Kamal Farsaoui

Web developer / Previously Founder & CEO at CSI, Co-Founder & CTO at Neiio / Coffee snob

Voir le profil

Vous souhaitez en savoir plus sur le sujet ?
Organisons un échange !

Notre équipe d'experts répond à toutes vos questions.

Nous contacter

Découvrez nos autres contenus dans le même thème

MCP Server : Implémenter un serveur Model Context Protocol en TypeScript

11 juin 2025

•

26mn

•Fabien Pasquet

Découvrez comment créer un serveur MCP en TypeScript à l'aide du SDK officiel. Apprenez à fournir un contexte riche aux LLMs.

ESLint Plugin : Créer une règle personnalisée

21 mai 2025

•

14mn

•Fabien Pasquet

Découvrez comment créer un plugin ESLint en TypeScript avec la nouvelle configuration "flat config" et publiez-le sur npm.

Illustration accessibilité d'une barre de recherche pour le web inclusif

Concevoir une barre de recherche accessible : méthodes, erreurs fréquentes et bonnes pratiques

16 avr. 2025

•

14mn

•Marie Gautron

Apprenez à concevoir une barre de recherche accessible pour le web, conforme RGAA. Bonnes pratiques, erreurs fréquentes à éviter et exemples concrets en HTML et React/MUI.