← Retour à la méthodologie
Fondements académiques

Références & adaptations

Chaque indicateur de l'outil s'appuie sur un cadre académique identifié. Cette page documente ce qu'on emprunte, ce qu'on adapte, et ce qu'on assume comme limite. Le format est le même pour chaque cadre : emprunté → adapté → limites.

Démocratie & régimes
🏛️
V-Dem — Varieties of Democracy
Coppedge et al., Université de Gothenburg, 2024
ThermomètreRégimeIncompatibilitéTous modes

V-Dem mesure la santé démocratique d'un pays sur 5 dimensions (électorale, libérale, participative, délibérative, égalitaire) à travers ~3000 experts-codeurs dans 180 pays depuis 1789. Nous en retenons 3 éléments.

1. Le thermomètre à 4 axes

Un sous-ensemble des dimensions V-Dem "libérale" et "électorale", adapté à l'échelle d'un texte unique. Chaque axe est scoré 0-100 par le LLM (50 = neutre) :

  • Séparation des pouvoirs (V-Dem: v2x_jucon, v2xlg_legcon) — le texte respecte-t-il l'indépendance des institutions ?
  • Pluralisme (V-Dem: v2x_partipdem, v2elmulpar) — le texte admet-il l'existence de positions adverses légitimes ?
  • Droits fondamentaux (V-Dem: v2x_liberal, v2clacfree) — le texte préserve-t-il ou menace-t-il les libertés individuelles ?
  • Transparence du pouvoir (V-Dem: v2x_accountability) — le texte assume-t-il ses sources, ses intérêts, ses limites ?

2. La grille Démocratie saine (11 indicateurs binaires)

Inspirée de la classification RoW (Regimes of the World, Lührmann et al. 2018). Chaque condition est cochée automatiquement depuis les données de détection (Pass 1) et de scoring (Pass 2), sans LLM supplémentaire :

#IndicateurCondition technique
1Pluralisme assuméAbsence de polarisation discursive ou diabolisation
2Transparence des sourcesScore "factuel" > 60/100
3Séparation des pouvoirsThermomètre séparation > 60/100
4Droits fondamentaux préservésThermomètre droits > 70 ou absence d'impact négatif sur les libertés
5Acceptation de la contradictionAbsence de diabolisation, délégitimisation, désignation d'ennemi
6Raisonnement factuelScore "logique" > 60/100
7InclusionAbsence de stigmatisation ou de polarisation discursive
8Responsabilité assuméeScore "transparence" > 60 ou texte antérieur à 1980
9ProportionnalitéScore "intensity" < 40/100
10Appel au débatAbsence de leviers peur/colère/urgence, ou texte antérieur à 1980
11Absence de contournementAucune mention de 49.3, ordonnance, état d'urgence permanent

3. Le filtre d'incompatibilité structurelle

V-Dem agrège ses indices par multiplication : un score nul sur un attribut tire l'index entier vers zéro (Sartori, "every defining attribute is necessary"). Nous appliquons le même principe : quand la Démocratie saine dépasse 7/11 (64%), au-dessus du seuil V-Dem de 0.5, les régimes structurellement incompatibles nécessitent ≥ 5/10 pour être affichés.

Régimes compatibles maintenus : social-démocratie, gauche classique, corporatisme d'État, néolibéralisme, nationalisme civique, souverainisme, écologie politique, décroissance.

Régimes filtrés sous 5/10 : autoritarisme, totalitarisme, fascisme, pétainisme, ethno-nationalisme, suprémacisme, léninisme, stalinisme, théocratie, intégrisme, kleptocratie, transhumanisme, etc.

V-DemCitizen AnalyzerRaison
Score un paysScore un texteUn discours ≠ un régime
~3000 experts humains1 LLM + règlesPas de panel d'experts
Score continu 0-1Conditions binairesLe citoyen voit ce qui est coché
5 dimensions × ~400 indicateurs4 axes + 11 conditionsUn texte n'a pas assez de données pour 400 indicateurs
Seuil 0.5Seuil 7/11 (0.64)Plus conservateur — un texte a moins de données qu'un pays
Limites assumées
  • Pas de cross-validation inter-codeurs. V-Dem utilise 5+ experts par pays avec un modèle bayésien. Nous utilisons un seul LLM à température 0.
  • Pas de mesure d'incertitude. V-Dem publie des intervalles de confiance. Nous ne le faisons pas.
  • Le texte n'est pas le régime. V-Dem mesure des institutions réelles. Nous mesurons ce qu'un texte dit ou sous-entend.
  • Le seuil 7/11 est un choix conservateur. V-Dem utilise 0.5 mais des chercheurs (Boese et al., V-Dem WP 25) montrent que le seuil optimal est ~0.42. Notre 0.64 laisse passer des faux positifs plutôt que de masquer un vrai signal.
Programmes politiques
📊
MARPOR / CMP — Manifesto Research
Volkens et al., WZB Berlin, 2024
CouvertureRILECrédibilitéProgramme + Discours (RILE)

MARPOR (Comparative Manifestos Project) code les programmes de 1000+ partis dans 50+ pays depuis 1945. Des codeurs humains classent chaque phrase dans l'une des 56 catégories du codebook. Nous en retenons 3 éléments.

1. La couverture programmatique (9 domaines)

DomaineMARPOR sources
1Relations extérieures & souverainetéDomain 1 — External Relations
2Libertés & démocratieDomain 2 — Freedom and Democracy
3Système politique & institutionsDomain 3 — Political System
4ÉconomieDomain 4 — Economy
5Protection socialeDomain 5 — Welfare
6Cohésion socialeDomain 5 (sous-cat.) + Domain 6
7Discriminations & égalitéDomain 6 — Fabric of Society
8EnvironnementDomain 5 (per501-per506)
9Éducation & cultureDomain 5 (per506-507) + Domain 3

2. Le positionnement gauche-droite (RILE)

Score -100 (gauche) à +100 (droite) calculé par le LLM depuis les marqueurs thématiques du texte.

Pourquoi MARPOR pour le discours ?

Le positionnement gauche-droite utilise la logique RILE de MARPOR à défaut d'équivalent validé pour le discours individuel. Les méthodes alternatives (Wordscores, Wordfish) nécessitent un corpus de référence pré-annoté, incompatible avec l'analyse d'un texte unique en temps réel. Le RILE, basé sur des marqueurs thématiques intrinsèques au texte, est la seule méthodologie applicable sans corpus — ce qui justifie son extension au discours, avec la réserve qu'il n'a été validé empiriquement que sur des programmes.

L'extension aux discours est ciblée : en mode discours, seul le RILE est retenu — la couverture programmatique n'est pas affichée, un discours thématique n'ayant pas vocation à couvrir l'ensemble des domaines de politique publique.

3. La crédibilité programmatique

Indicateur propre basé sur 3 critères détectés en Pass 2 : chiffrage (les propositions sont-elles quantifiées ?), mécanisme (le programme décrit-il comment ?), couverture des effets secondaires (les impacts collatéraux sont-ils mentionnés ?).

Limites assumées
  • Pas de découpage en quasi-sentences. Nous analysons le texte globalement. Notre couverture détecte les domaines abordés, pas leur poids relatif.
  • Pas de positionnement relatif. Nous produisons un score absolu sans comparaison avec les autres partis de la même période.
  • Pas de fiabilité inter-codeurs. La variance entre runs sur le RILE est estimée à ±5 points mais non systématiquement mesurée.
Rhétorique & argumentation
🎭
Toulmin & Walton — Argumentation et sophismes
Toulmin, 1958 · Walton, 1995/2008
9 mécanismes6 leviersTous modes

Toulmin décompose tout argument en 6 éléments (claim, data, warrant, backing, qualifier, rebuttal). Walton catalogue 96 schémas argumentatifs dont 30+ potentiellement fallacieux. Nous en retenons 2 éléments.

1. Les 9 mécanismes rhétoriques (Pass 1)

MécanismeWalton
Cadrage orientéArgument from bias
Polarisation discursiveFalse dichotomy
Désignation d'ennemiAd hominem + Poisoning the well
DiabolisationAd baculum + Straw man
DélégitimisationArgument from consequences
Appel à l'autoritéArgumentum ad verecundiam
Appel à la traditionArgument from popular practice
Simplification abusiveHasty generalization
Omission structurantePas de correspondance directe

2. Les 6 leviers émotionnels (Pass 1)

LevierMarcus (intelligence affective)Effet
PeurCircuit de surveillance → anxiétéCourt-circuite l'évaluation rationnelle
ColèreDisposition → action impulsiveMobilise mais réduit la nuance
UrgenceSurveillance → pression temporelleEmpêche la vérification
Sentiment d'injusticeSurveillance → réévaluation moraleLégitime la colère
ProtectionDisposition → transfert de confianceRéduit la distance critique
RésignationExtinction de la surveillanceDémobilise

Les mécanismes rhétoriques ne sont pas scorés en eux-mêmes — un appel à l'émotion peut être légitime. C'est le croisement manipulation × leviers émotionnels qui produit le jugement dans le regime_checker.

Pourquoi pas d'autres cadres ?

Rhetorical Structure Theory (Mann & Thompson, 1988) analyse la structure discursive mais pas les techniques de persuasion. Pragma-dialectique (van Eemeren & Grootendorst, 2004) exige une reconstruction explicite de chaque argument — incompatible avec l'analyse automatique. CDA (Fairclough, 1995) assume que l'analyste prend position — ce que l'outil refuse de faire.

Limites assumées
  • Pas de découpage argumentatif. Le LLM analyse le texte globalement, pas argument par argument.
  • Pas de jugement de validité logique. La détection identifie la technique sans juger systématiquement sa validité.
  • 9 mécanismes ne couvrent pas tout. Des techniques subtiles (gaslighting, dog-whistle) ne sont pas détectées systématiquement.
Fiabilité & délibération
⚖️
Habermas — Éthique de la discussion
Habermas, 1981/1992 · Steenbergen et al. (DQI), 2003
Trust (10 Q)Processus démocratiqueTous modes + Loi

Habermas pose que la légitimité d'un discours public repose sur 4 prétentions à la validité : vérité, justesse, sincérité, compréhensibilité. Sa théorie de la démocratie délibérative ajoute qu'une décision politique n'est légitime que si elle résulte d'un processus ouvert.

1. Les 10 questions de fiabilité (Pass 3)

QuestionPrétention HabermasCe qui est testé
Q1 — AuteurSincéritéIntérêts non déclarés, historique, conflits
Q2 — Thèse centraleVéritéVérifiabilité de la thèse principale
Q3 — ConstructionCompréhensibilitéStructure pour informer ou pour manipuler
Q4 — Impact lecteurJustesseInformer le citoyen ou court-circuiter la réflexion
Q5 — Rapport aux donnéesVéritéChiffres sourcés, vérifiables, contextualisés
Q6 — Coût & faisabilitéVérité + JustessePropositions chiffrées, effets secondaires mentionnés
Q7 — Droits & libertésJustesseRespect ou restriction injustifiée
Q8 — VérificationsVéritéCorroboration par des sources indépendantes
Q9 — Fact-checkingVéritéÉvaluations par AFP Factuel, Les Décodeurs, etc.
Q10 — Rôle des médiasCompréhensibilité + SincéritéTraitement médiatique pluraliste ou monolithique
Pourquoi 10 questions et pas les 4 prétentions ?

Les 4 prétentions de Habermas sont abstraites — "vérité" et "sincérité" ne sont pas testables telles quelles. Les 10 questions les opérationnalisent en critères concrets. À défaut d'équivalent validé pour évaluer la qualité délibérative d'un texte individuel (le DQI de Steenbergen mesure des débats multi-acteurs), cette décomposition est notre proposition.

2. Le score de processus démocratique (mode loi)

Score 0-100 avec malus explicites : 49.3 (-40), procédure accélérée (-15), oppositions multiples (-10 par tranche), mobilisations massives (-20), opposition unanime (-10). Le score mesure comment la loi a été fabriquée, pas ce qu'elle contient.

Limites assumées
  • Pas d'évaluation de la sincérité réelle. Le LLM détecte des incohérences, pas des mensonges. Un menteur cohérent score "fiable".
  • Pas de dialogue. L'éthique de la discussion suppose un échange. Nous évaluons un monologue.
  • Le processus est observé de l'extérieur. Un 49.3 après 6 mois de débat riche score pareil qu'un 49.3 imposé sans consultation.
Médias & information
📰
Entman & McCombs — Framing & Agenda-Setting
Entman, 1993 · McCombs & Shaw, 1972 · Ad Fontes Media, 2024
Double scoreBoussoleOmissionsMode média

Entman définit le cadrage comme l'acte de sélectionner certains aspects d'une réalité et de les rendre saillants. McCombs & Shaw montrent que les médias ne disent pas aux gens quoi penser, mais à quoi penser.

1. Le double score (article + média)

Entman distingue le cadrage du journaliste du cadrage institutionnel du média. Nous traduisons en 2 scores séparés : le score article (9 questions sur la qualité journalistique) et le score média (fiabilité institutionnelle).

2. La boussole éditoriale

2 axes inspirés de la Media Bias Chart (Ad Fontes) : orientation politique (gauche ↔ droite) et qualité informationnelle (factuel ↑ / opinion ↓). La boussole positionne l'article, pas le média.

3. La détection des omissions

McCombs montre que ce que les médias ne couvrent pas est aussi significatif. Les omissions structurantes (Pass 1) et les angles morts (Pass 3 Q9) alimentent le tiroir "Silences" en N2.

Limites assumées
  • Pas de comparaison inter-médias. Les omissions sont celles que le LLM identifie par rapport au sujet, pas par rapport à la couverture d'autres médias.
  • La boussole est une estimation. Ad Fontes analyse des centaines d'articles par analyste. Nous positionnons un seul article via LLM.
  • Le score média dépend des données disponibles. L'actionnariat de CNews est documenté, celui d'un blog local ne l'est pas.
Psychologie de l'influence
🧠
Cialdini & Marcus — Influence et intelligence affective
Cialdini, 1984 · Marcus, 2000/2002 · Huddy, Sears & Levy, 2013
LeviersCroisement émotion × manipulationTous modes

Cialdini identifie 6 principes d'influence (réciprocité, engagement, preuve sociale, autorité, rareté, sympathie) — moralement neutres, exploitables dans n'importe quel contexte. Marcus montre que l'émotion active soit le circuit de la disposition (enthousiasme) soit celui de la surveillance (anxiété).

Le croisement émotion × manipulation

C'est ce croisement qui distingue l'outil d'un simple détecteur de sophismes :

  • Levier SANS manipulation → intensité rhétorique haute, pas de dérive. Un discours de résistance qui active la colère contre l'occupant est légitime.
  • Levier AVEC manipulation → signal de dérive. Peur + désignation d'ennemi intérieur = condition fascisme cochée.
  • Manipulation SANS levier → technique froide. Un cadrage orienté sans charge émotionnelle passe sous le radar du lecteur.
Pourquoi Cialdini et pas Kahneman ?

Kahneman (Système 1/2) est un cadre général, pas spécifique à la persuasion politique. Petty & Cacioppo (ELM) prédit le comportement du récepteur, pas les techniques de l'émetteur — on analyse le texte, pas le lecteur.

Limites assumées
  • Pas de mesure de l'effet réel. Nous détectons le mécanisme dans le texte, pas son efficacité sur un lecteur donné.
  • Pas de profil du lecteur. Le module "Et moi ?" (N5) tente de personnaliser mais reste rudimentaire.
  • La résignation est difficile à détecter. Elle se manifeste souvent par ce qui n'est PAS dit.
Impacts & secteurs
🎯
CAP, Freeman & OCDE — Impacts et parties prenantes
Baumgartner & Jones, 1993 · Freeman, 1984 · OCDE, 2008
9 secteursGroupes affectésTous modes

CAP classe les politiques publiques en 21 domaines standardisés. Freeman pose que toute décision a des parties prenantes identifiables. L'OCDE formalise l'analyse d'impact distributif : qui gagne, qui perd.

1. Les 9 secteurs d'impact

Taxonomie dérivée du CAP, réduite de 21 à 9 domaines pour la détection LLM : souveraineté, libertés, institutions, économie, droits sociaux, cohésion sociale, discriminations, environnement, éducation.

2. Les groupes affectés

Pour chaque groupe : label, direction (gagnant/perdant), contexte textuel. D'où l'intérêt de soumettre le même texte à plusieurs analyses successives : la variance naturelle du LLM élargit le champ de détection, chaque passe pouvant révéler un angle mort que la précédente a manqué.

Limites assumées
  • Pas de quantification. "Les retraités sont perdants" ne dit pas si c'est -5€/mois ou la suppression d'un régime.
  • Les groupes non mentionnés sont invisibles. Le LLM ne peut pas systématiquement identifier les groupes affectés non mentionnés.
  • Taxonomie à 9 secteurs. CAP distingue "éducation supérieure" de "éducation primaire". Nous ne le faisons pas.
Droit constitutionnel
⚖️
Alexy — Proportionnalité et balance normative
Alexy, 1985/2003 · CC français, DC 71-44 (1971)
Balance normativeTransparence législativeMode loi

Alexy formalise le contrôle de proportionnalité en 3 étapes (adéquation, nécessité, proportionnalité stricto sensu) que tout tribunal constitutionnel applique.

1. La balance normative

Ratio droits créés / (droits + restrictions) sur 0-100. Un score de 50 = équilibre. La pondération est naïve (1 droit = 1 restriction) — Alexy pose que la pondération dépend du contexte, ce que le LLM ne peut pas garantir.

2. La transparence législative

Ratio dispositions auto-contenues / total. Un texte qui renvoie 80% au décret est formellement une loi mais substantiellement une habilitation.

Pourquoi Alexy et pas Dworkin ou Kelsen ?

Dworkin (Rights as Trumps) est trop rigide — les droits l'emportent toujours. Kelsen (hiérarchie des normes) ne mesure pas le contenu. Alexy modélise la conciliation entre droits contradictoires, ce qui est le cœur de l'analyse d'une loi.

Limites assumées
  • Pas de contrôle de constitutionnalité. L'outil ne vérifie pas la conformité au bloc de constitutionnalité.
  • Pas de hiérarchie des droits. Une obligation administrative = une restriction de liberté dans le comptage.
  • Pas d'analyse du contenu des renvois. Un renvoi bénin et un renvoi critique pèsent identiquement.
Méthodologie propre
📐
Score citoyen — Formule de calcul
Méthodologie propre · Aucun cadre externe direct
FormulePlafondsLabelsTous modes sauf loi/média

Aucun cadre académique ne produit un "score de qualité démocratique d'un texte" sur 100. Ce score est notre construction.

Composants bruts (LLM, Pass 2)

ComposantÉchelleInspiration
Intensité rhétorique0-100Walton
Portée0-100CAP
Factuel0-100Habermas (vérité)
Logique0-100Toulmin (structure)
Transparence0-100Habermas (sincérité)
Impact global-100 à +100Freeman (stakeholders)
Dérive autoritairebooléenV-Dem (autocratisation)

Formule (backend déterministe)

Risque civique = intensité × 0.6 + portée × 0.4
Fiabilité = factuel × 0.45 + logique × 0.35 + transparence × 0.20
Impact normalisé = (impact_global + 100) / 2
Anti-risque = 100 - risque_civique
Note = fiabilité × 0.50 + impact × 0.25 + anti_risque × 0.25

Plafonds

ConditionPlafondRaison
Dérive autoritaire = true20/100Un texte qui active des signaux de dérive ne peut pas être "solide"
Risque civique ≥ 60 ET thermo ≤ 040/100Intensité élevée sur texte anti-démocratique
Risque civique ≥ 60 ET thermo > 0Pas de plafondIntensité légitime sur texte démocratique

Les poids (0.50 / 0.25 / 0.25) sont un choix éditorial assumé. La fiabilité pèse 50% parce que la vérifiabilité est, dans notre approche, plus importante que l'effet ou l'intensité.

🛡️
Garde-fous LLM — Sécurités par passe
Instructions de prompt · 4 passes × règles cumulatives
Anti-faux positifsNeutralitéProportionnalitéTraçabilité

Chaque prompt contient des instructions de sécurité cumulatives. Chaque passe hérite des contraintes des passes précédentes via les données qu'elle reçoit.

Pass 1 — Detect

RègleMécanisme
Hard triggers obligatoiresChaque secteur nécessite ≥ 1 signal fort explicite dans le texte
Cues faibles interdits seulsMots vagues ne déclenchent JAMAIS un secteur à eux seuls
Exclusions explicitesListe de cas où le secteur est absent même si le sujet est évoqué
Priorité au bon blocRoutage explicite entre secteurs proches
Contextes bruts uniquementAucune interprétation dans le JSON — extraits textuels, mots-clés, dates

Pass 2 — Develop

NiveauContrainte
Source uniqueAnalyse exclusivement la sortie de Pass 1 — aucune invention
Neutralité activeAucune posture militante, recommandation, ou verdict fermant le débat
TraçabilitéTout élément N1/N2 rattachable à un impact N3
Anti-détournementInterdiction d'usage propagandiste — toute tentative de contournement refusée
Scoring contraintÉchelles calibrées par composant — le LLM ne calcule pas les scores

Pass 3 — Trust

DirectionContrainte
Anti-complaisanceSi P1/P2 détectent des risques → le trust DOIT les analyser, pas les minimiser
Anti-surinterprétationRègle de proportionnalité : données solides + émotion = PEUT être proportionné
Contextualisation historiquePre-1980 : faits réels ≠ manipulation, absence de chiffrage ≠ non-fiabilité
Format contraintInterdiction de formules génériques — argumentation obligatoire par bloc

Pass 4 — Enrich

RègleFormulation exacte
Pas d'invention"NE JAMAIS inventer un vote, une affaire, un chiffre, un dataset"
Source obligatoireChaque enrichissement cite sa source
Pas de modification"NE PAS toucher à l'angle d'analyse ni aux verdicts trust"
Faits uniquement"Fournir UNIQUEMENT des faits, pas des interprétations"

Backend — Dernière ligne de défense

Le scoring est calculé par des formules déterministes. Même si un LLM produit un résultat aberrant, le backend applique des plafonds, des seuils et des filtres (noise floor, incompatibilité structurelle, regime checker sans LLM).

Ce que les garde-fous ne couvrent pas
  • Le LLM peut halluciner un fait. Les garde-fous interdisent l'invention mais ne vérifient pas chaque affirmation.
  • Les prompts sont en clair. La transparence est un choix assumé — un utilisateur technique peut lire les seuils.
  • La chaîne est unidirectionnelle. Si Pass 1 rate un signal, Pass 2 et 3 ne le rattraperont pas (sauf si le texte original est injecté ≤ 25K).