Russell et les paradoxes

Bertrand Russell est un gigantesque philosophe logicien du XXe siècle. Après la publication des Fondements de l’arithmétique par Frege (précurseur de la logique dite « analytique »), il a fait parvenir à ce dernier une lettre décrivant le paradoxe qui porte aujourd’hui son nom.

Sources et références : 

Logique pour les nuls, sur le site du Centre de logique de l’UCL

Russell’s Paradox (Stanford Encyclopedia of Philosophy)

RUSSELL, B., « Mathematical Logic as Based on the Theory of Types » In American Journal of Mathematics, Vol. 30, No. 3, The Johns Hopkins University Press (Jul., 1908), pp. 222-262.

CRABBE, M., Cours et syllabus de Notions de logique et de Philosophie analytique, Louvain-la-Neuve : UCL, 2009-2010.

Paradoxes : la version ensembliste

Nous abordons ici la résolution du paradoxe selon sa « version ensembliste ».

D’autres formulations similaires du paradoxe et de sa résolution existent, comme pour le paradoxe du menteur ou encore le paradoxe du barbier, que Russell utilise lui-même dans un but didactique.

Le paradoxe du menteur peut se formuler comme ceci : « je mens en ce moment » (si je mens en disant cette phrase, alors je dis la vérité et si je dis la vérité en disant cette phrase, alors je mens…). La phrase suivante en est une variante : [la phrase écrite ici entre crochets n’est pas vraie] (cette phrase est vraie si et seulement si elle n’est pas vraie). On peut également le trouver sous la forme de deux propositions : « la phrase suivante est fausse. La phrase précédente est vraie ».

Je mens ↔ Je dis la vérité

Le paradoxe du barbier concerne quant à lui un barbier qui rase toutes les personnes qui ne se rasent pas elles-mêmes. Se rase-t-il lui-même ? Il se rase lui-même si et seulement si il ne se rase pas lui-même.

Le barbier ne se rase pas lui-même ↔ Le barbier se rase lui-même

La résolution de paradoxe dans sa « version ensembliste » proposée par Russell peut s’appliquer aux paradoxes du menteur et du barbier.

Pour comprendre l’origine du cheminement de Russell, un petit détour par Frege est éclairant. Frege élargit et enrichit la logique classique d’Aristote et des stoïciens (cf. Calcul des propositions) en considérant de nouvelles entités logiques, comme les ensembles, les variables relationnelles – ou prédicats ou encore les variables quantifiées (voir aussi Calcul des prédicats et Logique d’ordre supérieur). Il identifie également des axiomes qui permettent notamment de définir des ensembles en fonction de n’importe quelle propriété. Quand un objet a une propriété, cela revient à dire qu’il appartient à l’ensemble des objets qui ont cette propriété. Par exemple, si l’on parle de la propriété « être blanc », on peut définir l’ensemble des éléments qui sont blancs. Chaque chose qui est blanche fait partie de cet ensemble ; on dit qu’elle lui appartient.

Russell a d’ailleurs montré que son paradoxe rendait contradictoire la théorie de Frege, qui est une théorie des fondements dont les aspects logiques (…) ont eu une grande influence, mais qui utilisait une version de la compréhension non restreinte, c’est-à-dire la possibilité de définir un ensemble en compréhension à partir de n’importe quelle propriété du langage étudié.

Source : Wikipédia – Théorie naïve des ensembles

Le problème, c’est que ce système théorique contient de manière inhérente un paradoxe, du fait de ses propres axiomes. Développons :

  • Avec ce système, on peut envisager des ensembles qui s’appartiennent.
    • Prenons l’ensemble des étants, c’est-à-dire l’ensemble des choses qui existent (ne serait-ce qu’en imagination). Toute chose qui est (ou existe) est un étant.
    • Quelque chose qui a la propriété d’exister fait partie de cet ensemble.
    • L’ensemble des étants a lui-même la propriété d’exister, donc il s’appartient (il appartient à lui-même ; il a la propriété d’appartenir à lui-même).
    • Autrement dit, l’ensemble des choses qui existent existe lui aussi, et donc il s’appartient.
  • L’ensemble des ensembles est un ensemble qui s’appartient également : cet ensemble a la propriété d’être un ensemble, donc il appartient à lui-même.
  • Nous venons de décrire que la théorie de Frege permet de former des ensembles qui s’appartiennent, comme l’ensemble des ensembles. Il existe aussi des ensembles qui ne s’appartiennent pas. Par exemple, l’ensemble des chiens. L’ensemble lui-même n’est pas un chien (il n’a pas la propriété d’être un chien), il ne s’appartient donc pas. Il y a donc des ensembles qui ont la propriété de ne pas appartenir à eux-mêmes.
  • Dès lors, nous pouvons envisager cet ensemble de tous les ensembles qui ne s’appartiennent pas. La question est : s’appartient-il ? S’il s’appartient (c’est-à-dire qu’il est un ensemble qui ne s’appartient pas), alors il ne s’appartient pas. Et vice-versa. Il y a donc un paradoxe.

En langage mathématique, on a (w étant l’ensemble des ensembles qui ne s’appartiennent pas) :

Pour tout x, x appartient à w SSI x n’appartient pas à x.

C’est-à-dire qu’un ensemble appartient à w (l’ensemble des ensembles qui ne s’appartiennent pas) si et seulement si il ne s’appartient pas à lui-même.

Si on remplace x (la variable) par w (l’ensemble particulier des ensembles qui ne s’appartiennent pas), on obtient :

w appartient à w SSI w n’appartient pas à w.

w ∈ w ↔ w ∉ w

C’est-à-dire que l’ensemble w s’appartient si et seulement si il ne s’appartient pas. C’est contradictoire.

Russell décrivit ce paradoxe dans une lettre adressée en 1902 à Gottlob Frege, où il montrait à ce dernier que l’une des règles introduite dans ses Grundgesetze der Arithmetik, la compréhension non restreinte, rendait la théorie de Frege contradictoire. Le paradoxe est alors bel et bien une antinomie : une contradiction interne à la théorie. Frege souhaitait dans cet ouvrage fonder les mathématiques sur des bases purement logiques, tâche à laquelle devait également s’atteler Russell (voir logicisme), avec les Principia Mathematica. Il fait paraître ce paradoxe, (et d’autres) dans son ouvrage The Principles of Mathematics publié en 1903, tandis que, la même année, Frege adjoint au second volume de Grundgesetze der Arithmetik un appendice où il l’expose en en faisant précéder l’analyse de cet aveu d’une honnêteté confondante : « Pour un écrivain scientifique, il est peu d’infortunes pires que de voir l’une des fondations de son travail s’effondrer alors que celui-ci s’achève. C’est dans cette situation inconfortable que m’a mis une lettre de M. Bertrand Russell, alors que le présent volume allait paraître » (Appendice de Grundgesetze der Arithmetik, vol. II, in The Frege Reader, p. 279).

Source : Wikipédia – Paradoxe de Russell

La solution de Russell

La solution de Russell est au fond assez simple (mais loin d’être simpliste). L’idée de base est qu’on ne peut parler de tout à la fois. Il s’agit de délimiter le domaine de vérité de ce dont une proposition rend compte : en quelque sorte, une proposition n’est pas vraie « pour tout x », mais « pour tout x d’un certain type » (sachant que la définition de ce type relève d’un autre type).

Il convient dès lors de distinguer les propositions qui caractérisent les éléments d’un ensemble de celles qui caractérisent cet ensemble lui-même. Ces dernières sont des « méta » propositions et ne peuvent donc s’inclure elles-mêmes dans le champ des objets qu’elles caractérisent.

Selon cette théorie, les ensembles sont de types hiérarchisés. À un ensemble ne peuvent appartenir que des objets, qui peuvent être des ensembles, mais sont de types strictement inférieurs au type de l’ensemble initial, de sorte qu’on ne peut tout simplement plus écrire l’énoncé paradoxal.

Source : Wikipédia – Paradoxe de Russell

C’est la solution orthodoxe du paradoxe, qui distingue langage et métalangage : « on ne peut pas exprimer la propriété de vérité pour les énoncés d’un langage dans ce même langage, mais dans un métalangage » (CRABBE, M.). Dans ce métalangage, en corollaire, cette propriété de vérité n’a pas de sens : le métalangage est « exclu » de son champ d’application.

La proposition paradoxale est donc résolue si l’on détermine que w est d’un autre type (un type supérieur) que tous les x quantifiés. Autrement dit encore, les lois qui s’appliquent aux éléments d’un ensemble sont d’un type différent de celles qui s’appliquent à cet ensemble lui-même. Pour Russell, « il ne peut y avoir d’ensemble de tous les ensembles et on dit que le rassemblement de tous les ensembles est une classe propre » (Wikipédia).

En ce qui concerne les versions « populaires » de paradoxes logiques, comme celui du barbier ou encore de la personne qui « ment en ce moment », on peut aisément comprendre que l’affirmation « je mens en ce moment » ne peut pas s’appliquer à elle-même. Cela n’a pas de sens (c’est pragmatiquement impossible), de même qu’imaginer un barbier qui raserait toutes les personnes qui ne se rasent pas elles-mêmes : cela n’existe pas en-dehors de l’assemblage de mots spéculatif. Même en restreignant à un nombre réaliste de personnes à raser, au mieux, un barbier peut raser chaque autre personne que lui-même – de son village, par exemple – qui ne se rase pas elle-même, et au choix se raser lui-même ou non.

> Lire aussi l’article Wikipédia consacré au paradoxe de Russell ou encore l’article Russell’s Paradox (en) de la Stanford Encyclopedia of Philosophy

Concrètement, ces considérations ont des retombées pratiques dans les maths et la philosophie du langage, mais aussi dans la métaphysique et l’épistémologie.

  • Dans les maths : des restrictions ou modèles alternatifs de compréhension quant à la vérité, la validité et la signification des énoncés ou encore des fonctions émergent (théorie des classes, théorie des types…).
  • Dans la philosophie du langage (voir également les travaux de Tarski et sa théorie des modèles), la différence entre différents langages et métalangages et la délimitation de leurs différents domaines de signification permet de transcender des modèles naïfs d’appréhension de la vérité. La vérité d’une langue se définit souvent dans une « métalangue » qui ne peut elle-même fixer ses conventions qu’en ayant recours à une « grammaire » d’ordre supérieur. La langue naturelle (celle que nous parlons) est plus riche que la langue logique, mais elle peut donner lieu à des paradoxes. Elle sert néanmoins à définir les règles des langages logiques, des conventions, etc.
  • Dans la métaphysique et l’épistémologie : on retrouve l’idée que l’on ne peut pas définir de « vérité absolue » qui vaudrait pour tout x, sans aucune restriction (en soi, il est incorrect de le dire comme ça, dans la mesure où cela supposerait que cette phrase échappe à cette règle. S’il est contradictoire de dire « il n’y a pas de vérité » – cette phrase ne peut être que fausse, sinon elle se contredit, on peut néanmoins dire « il n’y a pas d’indiscutabilité », c’est-à-dire que chaque proposition – et donc aussi les propositions au sujet de la vérité elle-même – sont sujettes à une réflexion quant à leurs fondements). Lorsque nous émettons des propositions, nous sommes toujours en présence de vérités partielles (c’est-à-dire signifiantes dans un modèle donné, en fonction de postulats, d’axiomes, de présupposés), d’un certain type, dans un certain système/langage. Contre le dogmatisme, nous avons l’idée de ces vérités partielles, contextuelles, relatives à des modalités d’expression, à des référentiels, à des perspectives données… Contre le relativisme, l’engagement logique, pour la vérité est préservé : le concept de vérité reste signifiant.

Notons enfin que d’autres propositions de résolution ont été apportées par rapport aux paradoxes logiques, notamment l’idée d’une logique qui aurait davantage que deux valeurs de vérité (classiquement : soit vrai (1), soit faux (0)). Cf. entre autres la logique polyvalente et la logique modale.

> Sur un thème connexe, lire aussi : L’empirisme modal, par Quentin Ruyant (2018)

Pour conclure et terminer par des illustrations, il n’y a pas de sens à « programmer » un barbier dont la « règle » serait de raser toutes les personnes qui ne se raseraient pas elles-mêmes, tout comme on ne peut pas programmer un compte Twitter qui retweete uniquement tous les tweets de comptes qui ne se retweetent pas eux-mêmes (retweete-t-il ses propres tweets ?), ou un compte Facebook qui réagit uniquement à tous les statuts auxquels l’auteur ne réagit pas lui-même (réagit-il à ses propres statuts ?). Pour sortir du paradoxe, il faut exclure l’individu de la règle : on peut alors créer un BOT1 qui retweete uniquement tous les autres comptes (non-BOT1) qui ne se retweetent pas eux-mêmes. La règle n’aurait pas de sens le cas échéant : on ne peut pas lui attribuer de valeur de vérité classique, « vraie » ou « fausse ».

Mise à jour 2019 > Lire aussi : Jean-Paul Delahaye, « L’ensemble de tous les ensembles » (Pour la science, 2010).