Architecture des modèles

Les sept notes qui posent les fondations conceptuelles d’un LLM frontier. À lire en séquence pour construire le mental model du modèle lui-même, avant de passer à son serving (Inference) ou à son intégration applicative (Applied).

Notes

01-transformer-architecture — Self-attention, MHA/MQA/GQA, FFN, normalisations
02-position-encodings — RoPE, ALiBi, YaRN, sliding window
03-flash-attention — Tiling, online softmax, hiérarchie mémoire GPU
04-tokenization — BPE, SentencePiece, Tiktoken, multilingue
05-mixture-of-experts — Routing, expert capacity, auxiliary-loss-free balancing
06-distributed-training — DP, ZeRO, FSDP, TP, PP, mixed precision
07-post-training-alignment — SFT, RLHF, DPO, Constitutional AI

description	Les fondations : Transformer, attention, position encoding, tokenization, MoE, training distribué, post-training.
tags	cluster-index

Frontier LLM Systems

Explorateur

Architecture des modèles

Notes

01. Architecture Transformer

02. Position encodings et long context

03. FlashAttention

04. Tokenization

05. Mixture of Experts (MoE)

06. Distributed training

07. Post-training et alignment