Fondements académiques

Références & adaptations

Chaque indicateur de l'outil s'appuie sur un cadre académique identifié. Cette page documente ce qu'on emprunte, ce qu'on adapte, et ce qu'on assume comme limite. Le format est le même pour chaque cadre : emprunté → adapté → limites.

Démocratie & régimes

🏛️

V-Dem — Varieties of Democracy

Coppedge et al., Université de Gothenburg, 2024

ThermomètreRégimeIncompatibilitéTous modes

▸

V-Dem mesure la santé démocratique d'un pays sur 5 dimensions (électorale, libérale, participative, délibérative, égalitaire) à travers ~3000 experts-codeurs dans 180 pays depuis 1789. Nous en retenons 3 éléments.

1. Le thermomètre à 4 axes

Un sous-ensemble des dimensions V-Dem "libérale" et "électorale", adapté à l'échelle d'un texte unique. Chaque axe est scoré 0-100 par le LLM (50 = neutre) :

Séparation des pouvoirs (V-Dem: v2x_jucon, v2xlg_legcon) — le texte respecte-t-il l'indépendance des institutions ?
Pluralisme (V-Dem: v2x_partipdem, v2elmulpar) — le texte admet-il l'existence de positions adverses légitimes ?
Droits fondamentaux (V-Dem: v2x_liberal, v2clacfree) — le texte préserve-t-il ou menace-t-il les libertés individuelles ?
Transparence du pouvoir (V-Dem: v2x_accountability) — le texte assume-t-il ses sources, ses intérêts, ses limites ?

2. La grille Démocratie saine (11 indicateurs binaires)

Inspirée de la classification RoW (Regimes of the World, Lührmann et al. 2018). Chaque condition est cochée automatiquement depuis les données de détection (Pass 1) et de scoring (Pass 2), sans LLM supplémentaire :

#	Indicateur	Condition technique
1	Pluralisme assumé	Absence de polarisation discursive ou diabolisation
2	Transparence des sources	Score "factuel" > 60/100
3	Séparation des pouvoirs	Thermomètre séparation > 60/100
4	Droits fondamentaux préservés	Thermomètre droits > 70 ou absence d'impact négatif sur les libertés
5	Acceptation de la contradiction	Absence de diabolisation, délégitimisation, désignation d'ennemi
6	Raisonnement factuel	Score "logique" > 60/100
7	Inclusion	Absence de stigmatisation ou de polarisation discursive
8	Responsabilité assumée	Score "transparence" > 60 ou texte antérieur à 1980
9	Proportionnalité	Score "intensity" < 40/100
10	Appel au débat	Absence de leviers peur/colère/urgence, ou texte antérieur à 1980
11	Absence de contournement	Aucune mention de 49.3, ordonnance, état d'urgence permanent

3. Le filtre d'incompatibilité structurelle

V-Dem agrège ses indices par multiplication : un score nul sur un attribut tire l'index entier vers zéro (Sartori, "every defining attribute is necessary"). Nous appliquons le même principe : quand la Démocratie saine dépasse 7/11 (64%), au-dessus du seuil V-Dem de 0.5, les régimes structurellement incompatibles nécessitent ≥ 5/10 pour être affichés.

Régimes compatibles maintenus : social-démocratie, gauche classique, corporatisme d'État, néolibéralisme, nationalisme civique, souverainisme, écologie politique, décroissance.

Régimes filtrés sous 5/10 : autoritarisme, totalitarisme, fascisme, pétainisme, ethno-nationalisme, suprémacisme, léninisme, stalinisme, théocratie, intégrisme, kleptocratie, transhumanisme, etc.

V-Dem	Citizen Analyzer	Raison
Score un pays	Score un texte	Un discours ≠ un régime
~3000 experts humains	1 LLM + règles	Pas de panel d'experts
Score continu 0-1	Conditions binaires	Le citoyen voit ce qui est coché
5 dimensions × ~400 indicateurs	4 axes + 11 conditions	Un texte n'a pas assez de données pour 400 indicateurs
Seuil 0.5	Seuil 7/11 (0.64)	Plus conservateur — un texte a moins de données qu'un pays

Limites assumées

Pas de cross-validation inter-codeurs. V-Dem utilise 5+ experts par pays avec un modèle bayésien. Nous utilisons un seul LLM à température 0.
Pas de mesure d'incertitude. V-Dem publie des intervalles de confiance. Nous ne le faisons pas.
Le texte n'est pas le régime. V-Dem mesure des institutions réelles. Nous mesurons ce qu'un texte dit ou sous-entend.
Le seuil 7/11 est un choix conservateur. V-Dem utilise 0.5 mais des chercheurs (Boese et al., V-Dem WP 25) montrent que le seuil optimal est ~0.42. Notre 0.64 laisse passer des faux positifs plutôt que de masquer un vrai signal.

Programmes politiques

📊

MARPOR / CMP — Manifesto Research

Volkens et al., WZB Berlin, 2024

CouvertureRILECrédibilitéProgramme + Discours (RILE)

▸

MARPOR (Comparative Manifestos Project) code les programmes de 1000+ partis dans 50+ pays depuis 1945. Des codeurs humains classent chaque phrase dans l'une des 56 catégories du codebook. Nous en retenons 3 éléments.

1. La couverture programmatique (9 domaines)

N°	Domaine	MARPOR sources
1	Relations extérieures & souveraineté	Domain 1 — External Relations
2	Libertés & démocratie	Domain 2 — Freedom and Democracy
3	Système politique & institutions	Domain 3 — Political System
4	Économie	Domain 4 — Economy
5	Protection sociale	Domain 5 — Welfare
6	Cohésion sociale	Domain 5 (sous-cat.) + Domain 6
7	Discriminations & égalité	Domain 6 — Fabric of Society
8	Environnement	Domain 5 (per501-per506)
9	Éducation & culture	Domain 5 (per506-507) + Domain 3

2. Le positionnement gauche-droite (RILE)

Score -100 (gauche) à +100 (droite) calculé par le LLM depuis les marqueurs thématiques du texte.

Pourquoi MARPOR pour le discours ?

Le positionnement gauche-droite utilise la logique RILE de MARPOR à défaut d'équivalent validé pour le discours individuel. Les méthodes alternatives (Wordscores, Wordfish) nécessitent un corpus de référence pré-annoté, incompatible avec l'analyse d'un texte unique en temps réel. Le RILE, basé sur des marqueurs thématiques intrinsèques au texte, est la seule méthodologie applicable sans corpus — ce qui justifie son extension au discours, avec la réserve qu'il n'a été validé empiriquement que sur des programmes.

L'extension aux discours est ciblée : en mode discours, seul le RILE est retenu — la couverture programmatique n'est pas affichée, un discours thématique n'ayant pas vocation à couvrir l'ensemble des domaines de politique publique.

3. La crédibilité programmatique

Indicateur propre basé sur 3 critères détectés en Pass 2 : chiffrage (les propositions sont-elles quantifiées ?), mécanisme (le programme décrit-il comment ?), couverture des effets secondaires (les impacts collatéraux sont-ils mentionnés ?).

Limites assumées

Pas de découpage en quasi-sentences. Nous analysons le texte globalement. Notre couverture détecte les domaines abordés, pas leur poids relatif.
Pas de positionnement relatif. Nous produisons un score absolu sans comparaison avec les autres partis de la même période.
Pas de fiabilité inter-codeurs. La variance entre runs sur le RILE est estimée à ±5 points mais non systématiquement mesurée.

Rhétorique & argumentation

🎭

Toulmin & Walton — Argumentation et sophismes

Toulmin, 1958 · Walton, 1995/2008

9 mécanismes6 leviersTous modes

▸

Toulmin décompose tout argument en 6 éléments (claim, data, warrant, backing, qualifier, rebuttal). Walton catalogue 96 schémas argumentatifs dont 30+ potentiellement fallacieux. Nous en retenons 2 éléments.

1. Les 9 mécanismes rhétoriques (Pass 1)

Mécanisme	Walton
Cadrage orienté	Argument from bias
Polarisation discursive	False dichotomy
Désignation d'ennemi	Ad hominem + Poisoning the well
Diabolisation	Ad baculum + Straw man
Délégitimisation	Argument from consequences
Appel à l'autorité	Argumentum ad verecundiam
Appel à la tradition	Argument from popular practice
Simplification abusive	Hasty generalization
Omission structurante	Pas de correspondance directe

2. Les 6 leviers émotionnels (Pass 1)

Levier	Marcus (intelligence affective)	Effet
Peur	Circuit de surveillance → anxiété	Court-circuite l'évaluation rationnelle
Colère	Disposition → action impulsive	Mobilise mais réduit la nuance
Urgence	Surveillance → pression temporelle	Empêche la vérification
Sentiment d'injustice	Surveillance → réévaluation morale	Légitime la colère
Protection	Disposition → transfert de confiance	Réduit la distance critique
Résignation	Extinction de la surveillance	Démobilise

Les mécanismes rhétoriques ne sont pas scorés en eux-mêmes — un appel à l'émotion peut être légitime. C'est le croisement manipulation × leviers émotionnels qui produit le jugement dans le regime_checker.

Pourquoi pas d'autres cadres ?

Rhetorical Structure Theory (Mann & Thompson, 1988) analyse la structure discursive mais pas les techniques de persuasion. Pragma-dialectique (van Eemeren & Grootendorst, 2004) exige une reconstruction explicite de chaque argument — incompatible avec l'analyse automatique. CDA (Fairclough, 1995) assume que l'analyste prend position — ce que l'outil refuse de faire.

Limites assumées

Pas de découpage argumentatif. Le LLM analyse le texte globalement, pas argument par argument.
Pas de jugement de validité logique. La détection identifie la technique sans juger systématiquement sa validité.
9 mécanismes ne couvrent pas tout. Des techniques subtiles (gaslighting, dog-whistle) ne sont pas détectées systématiquement.

Fiabilité & délibération

⚖️

Habermas — Éthique de la discussion

Habermas, 1981/1992 · Steenbergen et al. (DQI), 2003

Trust (10 Q)Processus démocratiqueTous modes + Loi

▸

Habermas pose que la légitimité d'un discours public repose sur 4 prétentions à la validité : vérité, justesse, sincérité, compréhensibilité. Sa théorie de la démocratie délibérative ajoute qu'une décision politique n'est légitime que si elle résulte d'un processus ouvert.

1. Les 10 questions de fiabilité (Pass 3)

Question	Prétention Habermas	Ce qui est testé
Q1 — Auteur	Sincérité	Intérêts non déclarés, historique, conflits
Q2 — Thèse centrale	Vérité	Vérifiabilité de la thèse principale
Q3 — Construction	Compréhensibilité	Structure pour informer ou pour manipuler
Q4 — Impact lecteur	Justesse	Informer le citoyen ou court-circuiter la réflexion
Q5 — Rapport aux données	Vérité	Chiffres sourcés, vérifiables, contextualisés
Q6 — Coût & faisabilité	Vérité + Justesse	Propositions chiffrées, effets secondaires mentionnés
Q7 — Droits & libertés	Justesse	Respect ou restriction injustifiée
Q8 — Vérifications	Vérité	Corroboration par des sources indépendantes
Q9 — Fact-checking	Vérité	Évaluations par AFP Factuel, Les Décodeurs, etc.
Q10 — Rôle des médias	Compréhensibilité + Sincérité	Traitement médiatique pluraliste ou monolithique

Pourquoi 10 questions et pas les 4 prétentions ?

Les 4 prétentions de Habermas sont abstraites — "vérité" et "sincérité" ne sont pas testables telles quelles. Les 10 questions les opérationnalisent en critères concrets. À défaut d'équivalent validé pour évaluer la qualité délibérative d'un texte individuel (le DQI de Steenbergen mesure des débats multi-acteurs), cette décomposition est notre proposition.

2. Le score de processus démocratique (mode loi)

Score 0-100 avec malus explicites : 49.3 (-40), procédure accélérée (-15), oppositions multiples (-10 par tranche), mobilisations massives (-20), opposition unanime (-10). Le score mesure comment la loi a été fabriquée, pas ce qu'elle contient.

Limites assumées

Pas d'évaluation de la sincérité réelle. Le LLM détecte des incohérences, pas des mensonges. Un menteur cohérent score "fiable".
Pas de dialogue. L'éthique de la discussion suppose un échange. Nous évaluons un monologue.
Le processus est observé de l'extérieur. Un 49.3 après 6 mois de débat riche score pareil qu'un 49.3 imposé sans consultation.

Médias & information

📰

Entman & McCombs — Framing & Agenda-Setting

Entman, 1993 · McCombs & Shaw, 1972 · Ad Fontes Media, 2024

Double scoreBoussoleOmissionsMode média

▸

Entman définit le cadrage comme l'acte de sélectionner certains aspects d'une réalité et de les rendre saillants. McCombs & Shaw montrent que les médias ne disent pas aux gens quoi penser, mais à quoi penser.

1. Le double score (article + média)

Entman distingue le cadrage du journaliste du cadrage institutionnel du média. Nous traduisons en 2 scores séparés : le score article (9 questions sur la qualité journalistique) et le score média (fiabilité institutionnelle).

2. La boussole éditoriale

2 axes inspirés de la Media Bias Chart (Ad Fontes) : orientation politique (gauche ↔ droite) et qualité informationnelle (factuel ↑ / opinion ↓). La boussole positionne l'article, pas le média.

3. La détection des omissions

McCombs montre que ce que les médias ne couvrent pas est aussi significatif. Les omissions structurantes (Pass 1) et les angles morts (Pass 3 Q9) alimentent le tiroir "Silences" en N2.

Limites assumées

Pas de comparaison inter-médias. Les omissions sont celles que le LLM identifie par rapport au sujet, pas par rapport à la couverture d'autres médias.
La boussole est une estimation. Ad Fontes analyse des centaines d'articles par analyste. Nous positionnons un seul article via LLM.
Le score média dépend des données disponibles. L'actionnariat de CNews est documenté, celui d'un blog local ne l'est pas.

Psychologie de l'influence

🧠

Cialdini & Marcus — Influence et intelligence affective

Cialdini, 1984 · Marcus, 2000/2002 · Huddy, Sears & Levy, 2013

LeviersCroisement émotion × manipulationTous modes

▸

Cialdini identifie 6 principes d'influence (réciprocité, engagement, preuve sociale, autorité, rareté, sympathie) — moralement neutres, exploitables dans n'importe quel contexte. Marcus montre que l'émotion active soit le circuit de la disposition (enthousiasme) soit celui de la surveillance (anxiété).

Le croisement émotion × manipulation

C'est ce croisement qui distingue l'outil d'un simple détecteur de sophismes :

Levier SANS manipulation → intensité rhétorique haute, pas de dérive. Un discours de résistance qui active la colère contre l'occupant est légitime.
Levier AVEC manipulation → signal de dérive. Peur + désignation d'ennemi intérieur = condition fascisme cochée.
Manipulation SANS levier → technique froide. Un cadrage orienté sans charge émotionnelle passe sous le radar du lecteur.

Pourquoi Cialdini et pas Kahneman ?

Kahneman (Système 1/2) est un cadre général, pas spécifique à la persuasion politique. Petty & Cacioppo (ELM) prédit le comportement du récepteur, pas les techniques de l'émetteur — on analyse le texte, pas le lecteur.

Limites assumées

Pas de mesure de l'effet réel. Nous détectons le mécanisme dans le texte, pas son efficacité sur un lecteur donné.
Pas de profil du lecteur. Le module "Et moi ?" (N5) tente de personnaliser mais reste rudimentaire.
La résignation est difficile à détecter. Elle se manifeste souvent par ce qui n'est PAS dit.

Impacts & secteurs

🎯

CAP, Freeman & OCDE — Impacts et parties prenantes

Baumgartner & Jones, 1993 · Freeman, 1984 · OCDE, 2008

9 secteursGroupes affectésTous modes

▸

CAP classe les politiques publiques en 21 domaines standardisés. Freeman pose que toute décision a des parties prenantes identifiables. L'OCDE formalise l'analyse d'impact distributif : qui gagne, qui perd.

1. Les 9 secteurs d'impact

Taxonomie dérivée du CAP, réduite de 21 à 9 domaines pour la détection LLM : souveraineté, libertés, institutions, économie, droits sociaux, cohésion sociale, discriminations, environnement, éducation.

2. Les groupes affectés

Pour chaque groupe : label, direction (gagnant/perdant), contexte textuel. D'où l'intérêt de soumettre le même texte à plusieurs analyses successives : la variance naturelle du LLM élargit le champ de détection, chaque passe pouvant révéler un angle mort que la précédente a manqué.

Limites assumées

Pas de quantification. "Les retraités sont perdants" ne dit pas si c'est -5€/mois ou la suppression d'un régime.
Les groupes non mentionnés sont invisibles. Le LLM ne peut pas systématiquement identifier les groupes affectés non mentionnés.
Taxonomie à 9 secteurs. CAP distingue "éducation supérieure" de "éducation primaire". Nous ne le faisons pas.

Droit constitutionnel

⚖️

Alexy — Proportionnalité et balance normative

Alexy, 1985/2003 · CC français, DC 71-44 (1971)

Balance normativeTransparence législativeMode loi

▸

Alexy formalise le contrôle de proportionnalité en 3 étapes (adéquation, nécessité, proportionnalité stricto sensu) que tout tribunal constitutionnel applique.

1. La balance normative

Ratio droits créés / (droits + restrictions) sur 0-100. Un score de 50 = équilibre. La pondération est naïve (1 droit = 1 restriction) — Alexy pose que la pondération dépend du contexte, ce que le LLM ne peut pas garantir.

2. La transparence législative

Ratio dispositions auto-contenues / total. Un texte qui renvoie 80% au décret est formellement une loi mais substantiellement une habilitation.

Pourquoi Alexy et pas Dworkin ou Kelsen ?

Dworkin (Rights as Trumps) est trop rigide — les droits l'emportent toujours. Kelsen (hiérarchie des normes) ne mesure pas le contenu. Alexy modélise la conciliation entre droits contradictoires, ce qui est le cœur de l'analyse d'une loi.

Limites assumées

Pas de contrôle de constitutionnalité. L'outil ne vérifie pas la conformité au bloc de constitutionnalité.
Pas de hiérarchie des droits. Une obligation administrative = une restriction de liberté dans le comptage.
Pas d'analyse du contenu des renvois. Un renvoi bénin et un renvoi critique pèsent identiquement.

Méthodologie propre

📐

Score citoyen — Formule de calcul

Méthodologie propre · Aucun cadre externe direct

FormulePlafondsLabelsTous modes sauf loi/média

▸

Aucun cadre académique ne produit un "score de qualité démocratique d'un texte" sur 100. Ce score est notre construction.

Composants bruts (LLM, Pass 2)

Composant	Échelle	Inspiration
Intensité rhétorique	0-100	Walton
Portée	0-100	CAP
Factuel	0-100	Habermas (vérité)
Logique	0-100	Toulmin (structure)
Transparence	0-100	Habermas (sincérité)
Impact global	-100 à +100	Freeman (stakeholders)
Dérive autoritaire	booléen	V-Dem (autocratisation)

Formule (backend déterministe)

Risque civique = intensité × 0.6 + portée × 0.4
Fiabilité = factuel × 0.45 + logique × 0.35 + transparence × 0.20
Impact normalisé = (impact_global + 100) / 2
Anti-risque = 100 - risque_civique
Note = fiabilité × 0.50 + impact × 0.25 + anti_risque × 0.25

Plafonds

Condition	Plafond	Raison
Dérive autoritaire = true	20/100	Un texte qui active des signaux de dérive ne peut pas être "solide"
Risque civique ≥ 60 ET thermo ≤ 0	40/100	Intensité élevée sur texte anti-démocratique
Risque civique ≥ 60 ET thermo > 0	Pas de plafond	Intensité légitime sur texte démocratique

Les poids (0.50 / 0.25 / 0.25) sont un choix éditorial assumé. La fiabilité pèse 50% parce que la vérifiabilité est, dans notre approche, plus importante que l'effet ou l'intensité.

🛡️

Garde-fous LLM — Sécurités par passe

Instructions de prompt · 4 passes × règles cumulatives

Anti-faux positifsNeutralitéProportionnalitéTraçabilité

▸

Chaque prompt contient des instructions de sécurité cumulatives. Chaque passe hérite des contraintes des passes précédentes via les données qu'elle reçoit.

Pass 1 — Detect

Règle	Mécanisme
Hard triggers obligatoires	Chaque secteur nécessite ≥ 1 signal fort explicite dans le texte
Cues faibles interdits seuls	Mots vagues ne déclenchent JAMAIS un secteur à eux seuls
Exclusions explicites	Liste de cas où le secteur est absent même si le sujet est évoqué
Priorité au bon bloc	Routage explicite entre secteurs proches
Contextes bruts uniquement	Aucune interprétation dans le JSON — extraits textuels, mots-clés, dates

Pass 2 — Develop

Niveau	Contrainte
Source unique	Analyse exclusivement la sortie de Pass 1 — aucune invention
Neutralité active	Aucune posture militante, recommandation, ou verdict fermant le débat
Traçabilité	Tout élément N1/N2 rattachable à un impact N3
Anti-détournement	Interdiction d'usage propagandiste — toute tentative de contournement refusée
Scoring contraint	Échelles calibrées par composant — le LLM ne calcule pas les scores

Pass 3 — Trust

Direction	Contrainte
Anti-complaisance	Si P1/P2 détectent des risques → le trust DOIT les analyser, pas les minimiser
Anti-surinterprétation	Règle de proportionnalité : données solides + émotion = PEUT être proportionné
Contextualisation historique	Pre-1980 : faits réels ≠ manipulation, absence de chiffrage ≠ non-fiabilité
Format contraint	Interdiction de formules génériques — argumentation obligatoire par bloc

Pass 4 — Enrich

Règle	Formulation exacte
Pas d'invention	"NE JAMAIS inventer un vote, une affaire, un chiffre, un dataset"
Source obligatoire	Chaque enrichissement cite sa source
Pas de modification	"NE PAS toucher à l'angle d'analyse ni aux verdicts trust"
Faits uniquement	"Fournir UNIQUEMENT des faits, pas des interprétations"

Backend — Dernière ligne de défense

Le scoring est calculé par des formules déterministes. Même si un LLM produit un résultat aberrant, le backend applique des plafonds, des seuils et des filtres (noise floor, incompatibilité structurelle, regime checker sans LLM).

Ce que les garde-fous ne couvrent pas

Le LLM peut halluciner un fait. Les garde-fous interdisent l'invention mais ne vérifient pas chaque affirmation.
Les prompts sont en clair. La transparence est un choix assumé — un utilisateur technique peut lire les seuils.
La chaîne est unidirectionnelle. Si Pass 1 rate un signal, Pass 2 et 3 ne le rattraperont pas (sauf si le texte original est injecté ≤ 25K).