Chaque indicateur de l'outil s'appuie sur un cadre académique identifié. Cette page documente ce qu'on emprunte, ce qu'on adapte, et ce qu'on assume comme limite. Le format est le même pour chaque cadre : emprunté → adapté → limites.
V-Dem mesure la santé démocratique d'un pays sur 5 dimensions (électorale, libérale, participative, délibérative, égalitaire) à travers ~3000 experts-codeurs dans 180 pays depuis 1789. Nous en retenons 3 éléments.
Un sous-ensemble des dimensions V-Dem "libérale" et "électorale", adapté à l'échelle d'un texte unique. Chaque axe est scoré 0-100 par le LLM (50 = neutre) :
Inspirée de la classification RoW (Regimes of the World, Lührmann et al. 2018). Chaque condition est cochée automatiquement depuis les données de détection (Pass 1) et de scoring (Pass 2), sans LLM supplémentaire :
| # | Indicateur | Condition technique |
|---|---|---|
| 1 | Pluralisme assumé | Absence de polarisation discursive ou diabolisation |
| 2 | Transparence des sources | Score "factuel" > 60/100 |
| 3 | Séparation des pouvoirs | Thermomètre séparation > 60/100 |
| 4 | Droits fondamentaux préservés | Thermomètre droits > 70 ou absence d'impact négatif sur les libertés |
| 5 | Acceptation de la contradiction | Absence de diabolisation, délégitimisation, désignation d'ennemi |
| 6 | Raisonnement factuel | Score "logique" > 60/100 |
| 7 | Inclusion | Absence de stigmatisation ou de polarisation discursive |
| 8 | Responsabilité assumée | Score "transparence" > 60 ou texte antérieur à 1980 |
| 9 | Proportionnalité | Score "intensity" < 40/100 |
| 10 | Appel au débat | Absence de leviers peur/colère/urgence, ou texte antérieur à 1980 |
| 11 | Absence de contournement | Aucune mention de 49.3, ordonnance, état d'urgence permanent |
V-Dem agrège ses indices par multiplication : un score nul sur un attribut tire l'index entier vers zéro (Sartori, "every defining attribute is necessary"). Nous appliquons le même principe : quand la Démocratie saine dépasse 7/11 (64%), au-dessus du seuil V-Dem de 0.5, les régimes structurellement incompatibles nécessitent ≥ 5/10 pour être affichés.
Régimes compatibles maintenus : social-démocratie, gauche classique, corporatisme d'État, néolibéralisme, nationalisme civique, souverainisme, écologie politique, décroissance.
Régimes filtrés sous 5/10 : autoritarisme, totalitarisme, fascisme, pétainisme, ethno-nationalisme, suprémacisme, léninisme, stalinisme, théocratie, intégrisme, kleptocratie, transhumanisme, etc.
| V-Dem | Citizen Analyzer | Raison |
|---|---|---|
| Score un pays | Score un texte | Un discours ≠ un régime |
| ~3000 experts humains | 1 LLM + règles | Pas de panel d'experts |
| Score continu 0-1 | Conditions binaires | Le citoyen voit ce qui est coché |
| 5 dimensions × ~400 indicateurs | 4 axes + 11 conditions | Un texte n'a pas assez de données pour 400 indicateurs |
| Seuil 0.5 | Seuil 7/11 (0.64) | Plus conservateur — un texte a moins de données qu'un pays |
MARPOR (Comparative Manifestos Project) code les programmes de 1000+ partis dans 50+ pays depuis 1945. Des codeurs humains classent chaque phrase dans l'une des 56 catégories du codebook. Nous en retenons 3 éléments.
| N° | Domaine | MARPOR sources |
|---|---|---|
| 1 | Relations extérieures & souveraineté | Domain 1 — External Relations |
| 2 | Libertés & démocratie | Domain 2 — Freedom and Democracy |
| 3 | Système politique & institutions | Domain 3 — Political System |
| 4 | Économie | Domain 4 — Economy |
| 5 | Protection sociale | Domain 5 — Welfare |
| 6 | Cohésion sociale | Domain 5 (sous-cat.) + Domain 6 |
| 7 | Discriminations & égalité | Domain 6 — Fabric of Society |
| 8 | Environnement | Domain 5 (per501-per506) |
| 9 | Éducation & culture | Domain 5 (per506-507) + Domain 3 |
Score -100 (gauche) à +100 (droite) calculé par le LLM depuis les marqueurs thématiques du texte.
Le positionnement gauche-droite utilise la logique RILE de MARPOR à défaut d'équivalent validé pour le discours individuel. Les méthodes alternatives (Wordscores, Wordfish) nécessitent un corpus de référence pré-annoté, incompatible avec l'analyse d'un texte unique en temps réel. Le RILE, basé sur des marqueurs thématiques intrinsèques au texte, est la seule méthodologie applicable sans corpus — ce qui justifie son extension au discours, avec la réserve qu'il n'a été validé empiriquement que sur des programmes.
L'extension aux discours est ciblée : en mode discours, seul le RILE est retenu — la couverture programmatique n'est pas affichée, un discours thématique n'ayant pas vocation à couvrir l'ensemble des domaines de politique publique.
Indicateur propre basé sur 3 critères détectés en Pass 2 : chiffrage (les propositions sont-elles quantifiées ?), mécanisme (le programme décrit-il comment ?), couverture des effets secondaires (les impacts collatéraux sont-ils mentionnés ?).
Toulmin décompose tout argument en 6 éléments (claim, data, warrant, backing, qualifier, rebuttal). Walton catalogue 96 schémas argumentatifs dont 30+ potentiellement fallacieux. Nous en retenons 2 éléments.
| Mécanisme | Walton |
|---|---|
| Cadrage orienté | Argument from bias |
| Polarisation discursive | False dichotomy |
| Désignation d'ennemi | Ad hominem + Poisoning the well |
| Diabolisation | Ad baculum + Straw man |
| Délégitimisation | Argument from consequences |
| Appel à l'autorité | Argumentum ad verecundiam |
| Appel à la tradition | Argument from popular practice |
| Simplification abusive | Hasty generalization |
| Omission structurante | Pas de correspondance directe |
| Levier | Marcus (intelligence affective) | Effet |
|---|---|---|
| Peur | Circuit de surveillance → anxiété | Court-circuite l'évaluation rationnelle |
| Colère | Disposition → action impulsive | Mobilise mais réduit la nuance |
| Urgence | Surveillance → pression temporelle | Empêche la vérification |
| Sentiment d'injustice | Surveillance → réévaluation morale | Légitime la colère |
| Protection | Disposition → transfert de confiance | Réduit la distance critique |
| Résignation | Extinction de la surveillance | Démobilise |
Les mécanismes rhétoriques ne sont pas scorés en eux-mêmes — un appel à l'émotion peut être légitime. C'est le croisement manipulation × leviers émotionnels qui produit le jugement dans le regime_checker.
Rhetorical Structure Theory (Mann & Thompson, 1988) analyse la structure discursive mais pas les techniques de persuasion. Pragma-dialectique (van Eemeren & Grootendorst, 2004) exige une reconstruction explicite de chaque argument — incompatible avec l'analyse automatique. CDA (Fairclough, 1995) assume que l'analyste prend position — ce que l'outil refuse de faire.
Habermas pose que la légitimité d'un discours public repose sur 4 prétentions à la validité : vérité, justesse, sincérité, compréhensibilité. Sa théorie de la démocratie délibérative ajoute qu'une décision politique n'est légitime que si elle résulte d'un processus ouvert.
| Question | Prétention Habermas | Ce qui est testé |
|---|---|---|
| Q1 — Auteur | Sincérité | Intérêts non déclarés, historique, conflits |
| Q2 — Thèse centrale | Vérité | Vérifiabilité de la thèse principale |
| Q3 — Construction | Compréhensibilité | Structure pour informer ou pour manipuler |
| Q4 — Impact lecteur | Justesse | Informer le citoyen ou court-circuiter la réflexion |
| Q5 — Rapport aux données | Vérité | Chiffres sourcés, vérifiables, contextualisés |
| Q6 — Coût & faisabilité | Vérité + Justesse | Propositions chiffrées, effets secondaires mentionnés |
| Q7 — Droits & libertés | Justesse | Respect ou restriction injustifiée |
| Q8 — Vérifications | Vérité | Corroboration par des sources indépendantes |
| Q9 — Fact-checking | Vérité | Évaluations par AFP Factuel, Les Décodeurs, etc. |
| Q10 — Rôle des médias | Compréhensibilité + Sincérité | Traitement médiatique pluraliste ou monolithique |
Les 4 prétentions de Habermas sont abstraites — "vérité" et "sincérité" ne sont pas testables telles quelles. Les 10 questions les opérationnalisent en critères concrets. À défaut d'équivalent validé pour évaluer la qualité délibérative d'un texte individuel (le DQI de Steenbergen mesure des débats multi-acteurs), cette décomposition est notre proposition.
Score 0-100 avec malus explicites : 49.3 (-40), procédure accélérée (-15), oppositions multiples (-10 par tranche), mobilisations massives (-20), opposition unanime (-10). Le score mesure comment la loi a été fabriquée, pas ce qu'elle contient.
Entman définit le cadrage comme l'acte de sélectionner certains aspects d'une réalité et de les rendre saillants. McCombs & Shaw montrent que les médias ne disent pas aux gens quoi penser, mais à quoi penser.
Entman distingue le cadrage du journaliste du cadrage institutionnel du média. Nous traduisons en 2 scores séparés : le score article (9 questions sur la qualité journalistique) et le score média (fiabilité institutionnelle).
2 axes inspirés de la Media Bias Chart (Ad Fontes) : orientation politique (gauche ↔ droite) et qualité informationnelle (factuel ↑ / opinion ↓). La boussole positionne l'article, pas le média.
McCombs montre que ce que les médias ne couvrent pas est aussi significatif. Les omissions structurantes (Pass 1) et les angles morts (Pass 3 Q9) alimentent le tiroir "Silences" en N2.
Cialdini identifie 6 principes d'influence (réciprocité, engagement, preuve sociale, autorité, rareté, sympathie) — moralement neutres, exploitables dans n'importe quel contexte. Marcus montre que l'émotion active soit le circuit de la disposition (enthousiasme) soit celui de la surveillance (anxiété).
C'est ce croisement qui distingue l'outil d'un simple détecteur de sophismes :
Kahneman (Système 1/2) est un cadre général, pas spécifique à la persuasion politique. Petty & Cacioppo (ELM) prédit le comportement du récepteur, pas les techniques de l'émetteur — on analyse le texte, pas le lecteur.
CAP classe les politiques publiques en 21 domaines standardisés. Freeman pose que toute décision a des parties prenantes identifiables. L'OCDE formalise l'analyse d'impact distributif : qui gagne, qui perd.
Taxonomie dérivée du CAP, réduite de 21 à 9 domaines pour la détection LLM : souveraineté, libertés, institutions, économie, droits sociaux, cohésion sociale, discriminations, environnement, éducation.
Pour chaque groupe : label, direction (gagnant/perdant), contexte textuel. D'où l'intérêt de soumettre le même texte à plusieurs analyses successives : la variance naturelle du LLM élargit le champ de détection, chaque passe pouvant révéler un angle mort que la précédente a manqué.
Alexy formalise le contrôle de proportionnalité en 3 étapes (adéquation, nécessité, proportionnalité stricto sensu) que tout tribunal constitutionnel applique.
Ratio droits créés / (droits + restrictions) sur 0-100. Un score de 50 = équilibre. La pondération est naïve (1 droit = 1 restriction) — Alexy pose que la pondération dépend du contexte, ce que le LLM ne peut pas garantir.
Ratio dispositions auto-contenues / total. Un texte qui renvoie 80% au décret est formellement une loi mais substantiellement une habilitation.
Dworkin (Rights as Trumps) est trop rigide — les droits l'emportent toujours. Kelsen (hiérarchie des normes) ne mesure pas le contenu. Alexy modélise la conciliation entre droits contradictoires, ce qui est le cœur de l'analyse d'une loi.
Aucun cadre académique ne produit un "score de qualité démocratique d'un texte" sur 100. Ce score est notre construction.
| Composant | Échelle | Inspiration |
|---|---|---|
| Intensité rhétorique | 0-100 | Walton |
| Portée | 0-100 | CAP |
| Factuel | 0-100 | Habermas (vérité) |
| Logique | 0-100 | Toulmin (structure) |
| Transparence | 0-100 | Habermas (sincérité) |
| Impact global | -100 à +100 | Freeman (stakeholders) |
| Dérive autoritaire | booléen | V-Dem (autocratisation) |
Risque civique = intensité × 0.6 + portée × 0.4
Fiabilité = factuel × 0.45 + logique × 0.35 + transparence × 0.20
Impact normalisé = (impact_global + 100) / 2
Anti-risque = 100 - risque_civique
Note = fiabilité × 0.50 + impact × 0.25 + anti_risque × 0.25
| Condition | Plafond | Raison |
|---|---|---|
| Dérive autoritaire = true | 20/100 | Un texte qui active des signaux de dérive ne peut pas être "solide" |
| Risque civique ≥ 60 ET thermo ≤ 0 | 40/100 | Intensité élevée sur texte anti-démocratique |
| Risque civique ≥ 60 ET thermo > 0 | Pas de plafond | Intensité légitime sur texte démocratique |
Les poids (0.50 / 0.25 / 0.25) sont un choix éditorial assumé. La fiabilité pèse 50% parce que la vérifiabilité est, dans notre approche, plus importante que l'effet ou l'intensité.
Chaque prompt contient des instructions de sécurité cumulatives. Chaque passe hérite des contraintes des passes précédentes via les données qu'elle reçoit.
| Règle | Mécanisme |
|---|---|
| Hard triggers obligatoires | Chaque secteur nécessite ≥ 1 signal fort explicite dans le texte |
| Cues faibles interdits seuls | Mots vagues ne déclenchent JAMAIS un secteur à eux seuls |
| Exclusions explicites | Liste de cas où le secteur est absent même si le sujet est évoqué |
| Priorité au bon bloc | Routage explicite entre secteurs proches |
| Contextes bruts uniquement | Aucune interprétation dans le JSON — extraits textuels, mots-clés, dates |
| Niveau | Contrainte |
|---|---|
| Source unique | Analyse exclusivement la sortie de Pass 1 — aucune invention |
| Neutralité active | Aucune posture militante, recommandation, ou verdict fermant le débat |
| Traçabilité | Tout élément N1/N2 rattachable à un impact N3 |
| Anti-détournement | Interdiction d'usage propagandiste — toute tentative de contournement refusée |
| Scoring contraint | Échelles calibrées par composant — le LLM ne calcule pas les scores |
| Direction | Contrainte |
|---|---|
| Anti-complaisance | Si P1/P2 détectent des risques → le trust DOIT les analyser, pas les minimiser |
| Anti-surinterprétation | Règle de proportionnalité : données solides + émotion = PEUT être proportionné |
| Contextualisation historique | Pre-1980 : faits réels ≠ manipulation, absence de chiffrage ≠ non-fiabilité |
| Format contraint | Interdiction de formules génériques — argumentation obligatoire par bloc |
| Règle | Formulation exacte |
|---|---|
| Pas d'invention | "NE JAMAIS inventer un vote, une affaire, un chiffre, un dataset" |
| Source obligatoire | Chaque enrichissement cite sa source |
| Pas de modification | "NE PAS toucher à l'angle d'analyse ni aux verdicts trust" |
| Faits uniquement | "Fournir UNIQUEMENT des faits, pas des interprétations" |
Le scoring est calculé par des formules déterministes. Même si un LLM produit un résultat aberrant, le backend applique des plafonds, des seuils et des filtres (noise floor, incompatibilité structurelle, regime checker sans LLM).