Philosophie Digitale
Posté par alpheccar le21 Jui 2005 à 19:45 CEST
Chaque époque a son paradigme dominant. Après Newton, ce fut la mécanique et l’on essayait de donner une explication mécanique pour tout. A tel point que l’on dit, et je ne sais pas si c’est seulement une légende, que Maxwell utilisa un modèle mécanique pour établir ses fameuses équations de l’électromagnétisme.
Bien entendu, cela ne signifie pas que Maxwell pensait réellement que l’électromagnétisme avait un fondement mécanique mais seulement qu’il a utilisé un langage avec lequel il était plus familier.
Notre époque n’échappe pas à ce phénomène et de nos jour le paradigme dominant c’est le digital : information, ordinateurs, algorithmes. La philosophie digitale c’est le courant de pensée qui tente de réécrire notre vision du monde à partir de ces concepts.
En physique d’abord, les tentatives pour unifier la relativité générale et la physique quantique pointent toutes vers cette hypothèse : le monde n’est pas continu mais discret. Un volume d’espace ne peut contenir qu’une quantité finie d’information et cette quantité semble proportionnelle à la surface englobant ce volume. C’est la conjecture holographique. D’un point de vue informationnel, le monde ne serait que bidimensionnel. Les physiciens commencent à dire que, finalement, Dieu n’est pas un mathématicien mais juste un programmeur et que l’Univers dans son ensemble n’est qu’une machine de traitement de l’information.
En maths, la vision digitale force à remettre en cause la notion même de nombre réels et la vision platonique des mathématiques. Les maths ne seraient finalement qu’une discipline expérimentale.
En philo, le problème fondamental de l’acquisition du savoir semble être relié à la notion de compression de l’information.
Dans tous ces domaines, la notion de calculabilité joue un rôle de plus en plus grand. Alors, commençons pas voir ce que signifie ce terme et ses implications en mathématiques. Après, nous explorerons les implications philosophiques de cette idée.
Calculabilité
Une chose est calculable si elle peut être décrite par une suite finie d’étapes élémentaires simples. Se pose donc la question de savoir ce qu’est une étape élémentaire simple d’où l’existence de plusieurs définitions de la notion de calculabilité. Or, il se trouve que jusqu’à présent toutes les définitions proposées se sont révélées être équivalentes. Que ce soit une machine de Turing universelle, le lambda calcul, un ordinateur quantique ... : tout ce qui est calculable selon une des définitions l’est aussi selon les autres définitions. La différence entre ces définitions n’est donc pas théorique mais juste pratique : on a des implémentations différentes qui permettent d’exprimer plus ou moins facilement certains algorithmes ou de les exécuter plus ou moins rapidement.
Ainsi, on peut faire l’hypothèse, appelée thèse de Church-Turing, qu’il n’existe pas une définition de la calculabilité qui serait non équivalente à celles déjà proposées.
Une chose est donc calculable si elle peut être décrite avec un algorithme écrit dans un formalisme particulier ou implémenté par un processus physique particulier car un algorithme c’est une suite finie d’étapes élémentaires simples : une recette.
En quoi cette notion de calculabilité peut-elle bien remettre en cause la notion de nombre réel et quels liens peut-elle avoir avec la philo ?
Nombres réels
Un nombre réel c’est soit un entier, une fraction (nombre rationnel) ou un nombre irrationnel (qui ne peut s’écrire sous forme de fraction). Par exemple, la racine de 2 qui mesure la longueur de la diagonale d’un carré de coté 1 est un nombre irrationnel. C’est aussi un nombre dit algébrique car il est solution d’une équation algébrique à coefficient rationnels : x^2-2=0.
Mais, la plupart des nombres réels sont en fait transcendant (comme pi ou e) : ils ne sont solution d’aucune équation algébrique à coefficients rationnels. Quand je dis la plupart cela signifie avec une probabilité 1 : si vous choisissez au hasard un nombre réel vous obtenez avec une probabilité 1 un nombre transcendant.
Les nombres réels sont non dénombrables donc vous ne pouvez donner un nom à chacun d’entre eux. Donc, les nombres que vous utilisez en pratique, que vous pouvez nommer, constituent une partie infinitésimale des nombres réels. Ces autres nombres réels dont l’existence a été prouvée à partir des axiomes utilisés par les mathématiciens sont pour la plupart transcendants. Mais, ils sont bien plus étranges encore.
Ils sont aussi non calculables avec une probabilité 1. Un nombre réel est non calculable s’il n’existe aucun algorithme qui peut générer toutes ses décimales.
Pire, ces nombres réels sont aléatoires avec une probabilité 1 : un nombre réel est aléatoire s’il n’existe aucun algorithme pour calculer ses N premières décimales et qui puisse s’exprimer de façon bien plus concise qu’en listant ces N décimales. Autrement dit : il n’y a pas de structure identifiable dans les décimales du nombre et qui permettrait de le décrire de façon plus concise.
Ainsi, la plupart des nombres réels ne peuvent être nommées, ne peuvent être calculés et sont aléatoires.
On peut commencer à mettre en doute la notion de nombre réel : en quoi peut-on dire que des entités aussi insaisissables sont réelles.
Ce qui vient d’être dit pour les réels peut être transposé dans le monde des théorèmes et démonstrations. Un système formel ce sont des règles de syntaxe, d’orthographe + des axiomes + des règles de grammaires permettant de produire des théorèmes à partir des axiomes. Autrement dit, un système formel c’est un algorithme de production de théorèmes écrit dans un langage particulier.
Or, il y a des assertions vraies mais qui sont non calculables : ce ne sont pas des théorèmes. Et, il y a des assertions vraies qui sont aléatoires : elles sont vraies “par hasard”. Elles ne peuvent donc pas être compressés. Il n’existe pas d’ensemble d’axiomes permettant de redémontrer la vérité de l’assertion et qui soient plus concis que l’assertion elle-même alors autant rajouter l’assertion à la liste d’axiomes puisqu’on ne pourra jamais la redériver à partir de structures plus simples.
Ainsi, rechercher la vérité s’apparente à une science expérimentale : je teste la valeur de vérité de certaines assertions sur des exemples. Je conjecture que l’assertion est vraie. Mais, il se peut que cela ne puisse être démontré avec les axiomes dont on dispose (non calculabilité) et que quel que soit le choix de mes axiomes je sois obligé d’avoir quelque chose d’aussi complexe que l’assertion elle-même pour pouvoir la démontrer (caractère aléatoire). Mais alors, en quoi ma compréhension a-t-elle progressé si mes nouveaux axiomes sont aussi complexes que ce que je cherche à démontrer ? Autant décider de rajouter l’assertion à ma liste d’axiomes et supposer qu’elle est vraie : je ne pourrais pas le démontrer à partir de quelque chose de plus simple. Ainsi, les maths sont donc forcément une science expérimentale par l’existence même d’assertions vraies “par hasard”.
Se pose donc le problème de savoir ce qui me donne l’impression que j’ai compris une chose ?
Epistémologie
Dans l’exemple précédent, on voit que le mathématicien semble avoir compris quelque chose lorsqu’il peut le redémontrer à partir d’éléments plus simples : les axiomes. Il n’est pas satisfait lorsque ses axiomes sont aussi complexes que ce qu’il cherche à démontrer car alors il a l’impression de ne pas avoir progressé. Ainsi, la compréhension semble être de la compression ! J’ai compris quelque chose lorsque je peux le redériver algorithmiquement à partir de concepts plus simples. Cette remarque ne s’applique pas seulement au monde des maths. Dans la vie de tous les jours c’est la même chose : on a compris quelque chose quand on peut le ramener à des concepts plus simples.
Détaillons un peu plus ce processus de compression/compréhension. Un processus aléatoire dans le monde réel peut être décrit en transmettant une information qui pourra être codée avec des 0 et des 1. On a donc un certain nombre de bits pour décrire le processus aléatoire (si ce processus est une suite de nombres alors on peut se contenter de communiquer simplement cette liste même si ce n’est pas optimal car il y a souvent une certaine redondance qui peut être facilement éliminée).
Mais, d’autre part on peut essayer de regénérer ce processus en utilisant un algorithme. Cet algorithme nécessite des bits pour sa description et le résultat de cet algorithme sera une approximation du processus. L’erreur de description résiduelle devra être décrite à son tour. Le cas précédent correspond à l’absence d’algorithme, à l’absence de compression où l’on donne les données brutes. L’erreur de prédiction y est maximum car il faut décrire totalement le processus.
Au total, la complexité du processus aléatoire est donné par le nombre total de bits : algorithme + description de l’erreur résiduelle.
Si l’on a beaucoup de bits pour l’algorithme et peu pour l’erreur résiduelle alors le processus est sur-spécifié. On a un algorithme très complexe, trop complexe.
Sinon, on a une sous-spécification : un algorithme simple mais trop simple ce qui fait que l’erreur résiduelle de prédiction est grande.
L’idéal est donc d’avoir un algorithme simple et une erreur résiduelle faible : on a alors une très bonne description du processus à partir de quelque chose de simple.
Acquérir du savoir, apprendre, avoir l’impression de comprendre ce serait donc être capable d’encoder un processus de la manière précédente en utilisant un nombre de bits largement inférieur à la description brute du phénomène. Comprendre c’est compresser l’information et apprendre c’est construire le processus de compression.
C’est bien l’hypothèse de Solomonoff et de sa fameuse induction : si vous avez une séquence de nombres a,b,c,d. Comment prédire le nombre le plus probable qui vient ensuite ? Solomonoff nous dit qu’il faut considérer tous les processus algorithmiques qui génèrent des suites de nombres dont les premiers termes sont a,b,c,d et attribuer ensuite une probabilité à chaque algorithme cette probabilité dépendant de la longueur de l’algorithme.
Il faut ensuite utiliser cette probabilité pour calculer le nombre le plus probable à venir dans la suite.
L’idée de cette induction c’est que la compression c’est la compréhension. Si j’ai une description d’un phénomène qui est très longue (beaucoup de bits) alors j’ai une grande flexibilité et je peux produire n’importe quoi : je n’ai pas vraiment compris le phénomène. Ce type de description ne m’apporte rien et ne me permet pas de prédire correctement ce qui est susceptible d’advenir dans le futur car je n’ai identifié aucune structure dans le phénomène. Donc, ces descriptions longues se voient attribuer une probabilité faible. Et, réciproquement, les descriptions courtes se voient attribuer une forte probabilité. Ce qui est nouvelle expression du fameux principe d’Ockham.
Mais, l’induction se ramène-t-elle seulement à de la compression ? N’y a-t-il pas autre chose ?
En fait, Solomonoff postule une probabilité pour les algorithmes. Le seul moyen de comprendre d’où vient cette probabilité est de se replacer dans le cadre de la théorie Bayesienne des probabilités. Dans cette théorie, une probabilité n’est pas une fréquence : c’est une plausibilité. Une sorte de généralisation des valeurs de vérité ; une logique floue. Cette théorie Bayesienne est une traduction de la façon dont fonctionne notre esprit. C’est une traduction du principe de non contradiction sur lequel repose nos interactions avec le monde extérieur.
Dans cette théorie, toute chaîne d’induction commence avec un état de non-savoir absolu : un vide informationnel. L’induction de Solomonoff nous dit comment on peut acquérir de nouvelles informations par l’observation mais elle ne nous dit pas comment commence la chaîne et d’où proviennent les probabilités initiales.
Ces probabilités initiales proviennent des symétries du vide informationnel. Comme en physique quantique, ce vide n’est pas le néant et il a une structure. Lorsque l’on démarre une chaîne d’induction on part toujours d’une représentation du monde qui possède des symétries et qui encodent ce que l’on ne sait pas.
Par exemple, si je considère un dé à six faces, peu importe si les faces se nomment 1,2,...,6 ou a,b,...,f ou si je change l’ordre des chiffres sur le dé. Tous ces états sont équivalents pour moi si je n’ai aucune information me permettant de différencier un état d’un autre (une face d’une autre). C’est bien cette absence d’information qui rend le problème symétrique et qui me force à donner une probabilité de 1/6 à chaque face ce qui n’est que la traduction de mon indifférence initiale vis-à-vis de chaque face.
Solomonoff fait la même chose avec les algorithmes. Ainsi, la notion d’algorithme, de calculabilité n’est pas suffisante à elle seule même si elle nous enseigne quelque chose d’intéressant sur les mécanismes d’apprentissage et de compréhension.
On peut aller plus loin et essayer de réduire le problème de l’attribution initiale des probabilités: les lois de probabilités encodent l’information que l’on a sur le monde réel et permettent d’inférer des observations. En théorie Bayesienne, on peut imaginer un moteur d’inférence probabiliste qui ne s’appliquerait plus au monde réel mais au moteur d’inférence précédent. Ainsi, on aurait des lois de probabilités qui permettent de faire des inférences sur les lois de probabilités à utiliser pour faire des inférences sur le monde réel : ce sont les distributions dites A^p (a priori). Avec cette approche, le problème n’est pas simplement repoussé mais il est simplifié. En effet, toutes les symétries traduisant notre indifférence vis-à-vis de différentes situations dans le monde réel proviennent en fait de l’utilisation de différentes distributions A^p (différents a priori sur le monde extérieur) et ces distributions A^p proviennent d’un état d’indifférence interne dont les symétries sont beaucoup plus restreintes. Ainsi, l’attribution des probabilités initiales pourrait peut-être être fixé ou se faire dans un espace plus réduit en considérant plusieurs niveaux d’inférence.
Conclusion
La philosophie digitale est un terme générique utilisé pour nommer cette nouvelle vision du monde tournant autour des notions d’algorithmes, de calculabilité et d’information. Cela couvre non seulement la philo mais aussi la physique et tous les domaines où finalement ces notions peuvent être utilisées (exemple : biologie).
Il faut probablement être prudent et ne pas imaginer, comme cela se produit à chaque changement de paradigme dominant, que ce nouveau va résoudre tous les problèmes. Mais, il ne faut pas non plus rejeter ses résultats qui sont souvent profonds.


Posté par alpheccar le21 Fév 2008 à18:48 CEST
Après mes études, j'étais moi aussi platonicien. Mais, en découvrant les travaux de Chaitin sur la complexité algorithmique, j'ai commencé à douter. Comment puis-je dire qu'une entité abstraite que je ne peux nommer, compter ou décrire existe ? Elle n'est nulle par dans mon cerveau. Elle m'est définitivement inaccessible. Je suppose qu'elle existe parce que cela permet aux théorèmes de fonctionner sans introduire d'inconsistance.
C'est un problème qui avait été soulevé par Brouwer avec sa logique Intuitioniste qui n'a pas été comprise à l'époque et j'avoue que je vois pourquoi : il n'est pas très clair. Son idée c'est que le principe du tiers exclu (A OU NON A) n'est pas universellement vrai. Il doit être prouvé au cas par cas.
Ensuite, j'ai laissé un peu tomber les maths pour m'intéresser à l'informatique théorique (je fonctionne par phases). J'ai vite réalisé que cela revient à s'intéresser aux fondations des maths : logique, théorie des catégories etc ... Progressivement, la logique intuitioniste ou constructivsite a commencé à avoir de plus en plus de sens. J'ai réalisé qu'il y a des liens très forts entre logique et programme. Un programme c'est une preuve et un type une assertion logique. J'ai découvert qu'il y a aussi des liens très forts entre calcul et topologie (cf le blog Mathematics and computation dans mes liens). Finalement, j'ai appris que Bishop a réussi à réécrire l'analyse dans un cadre constructiviste. On n'a donc pas besoin du principe du tiers exclu. On obtient les mêmes théorèmes avec des formulations qui ne sont pas plus difficiles et souvent plus intuitives.
Au final, même s'il va me falloir encore quelques années avant de comprendre toutes les conséquences de la logique constructiviste, j'adhère de plus en plus à cette approche. Je me demande finalement si le platonicisme n'est pas une solution de facilité. L'approche constructiviste me semble apporter un nouvel éclairage très intéressant sur de nombreux théorèmes comme si on allait plus au fond des choses.
Et maintenant je programme en Haskell. C'est un peu comme faire des maths. Il n'y a plus de différence.
Posté par Laurent le20 Fév 2008 à23:41 CEST
très instructif , précis , clair ... certains ce sont un peu énervé dans leur commentaire lol . bref comme dans toute chose humaine il y a des imperfections des choses à prendre et à laisser ( en toute subjectivité car chacun aura "ses" choses à prendre et "ses" choses à laisser). j'aime bien l'idée d'analyser le néo paradigme juste par curiosité . étant étudiant en master maths à tendance philosophique platonicienne j'ai pris une douche froide quand j'ai lu ta décente à la science expérimentale et surtout le doute sur l'existence des nombres réels j'ose même pas parler des complexes . il est vrai que je suis peut être un peu trop "à l'ancienne" car un peu trop fasciné par les maths pures fondamentales et autres galoiseries donc les néo concepts digitaux m'échappent un peu . naïvement j'aime à penser qu'à partir du moment où l'on accepte le postulat que tous ce que notre cerveau peut concevoir et ressentir est notre réalité alors l'application des concepts mathématiques à la physique astronomique est la preuve de la véracité des mathématiques. après si tu es de ceux qui conçoivent que nous vivons dans un monde de perception et bien toutes les portes sont ouvertes et bienvenue dans la matrice. après tout nous ne sommes pas Dieu .
Posté par alpheccar le23 Déc 2006 à09:33 CEST
Je n'en ai jamais entendu parler.
digitalisme ?
Posté par nnn le23 Déc 2006 à00:16 CEST
Merci pour cet article très clair et très instructif !
Sinon, pour une précision de vocabulaire, il me semble que c’est le mécanisme, plutôt que la mécanique, qui désigne le paradigme évoqué au début ? Du coup, y a-t-il déjà eu des propositions d’introduire le terme « digitalisme » (par exemple pour mieux faire apparaître cette philosophie en la nommant) ?
Merci
Posté par alpheccar le07 Fév 2006 à19:08 CEST
Cela me motive pour écrire le prochain ...
Ma foi
Posté par Constantin le07 Fév 2006 à00:29 CEST
J'ai trouvé ce petit texte fort instructif, pour ma part. Bravo, Alpheccar.
Il faut lire avant de commenter
Posté par alpheccar le18 Jan 2006 à18:03 CEST
Je peux me demander si vous avez réellement lu ce que j'ai écrit. Il est pourtant clair que ce texte est une critique d'un courant qui veut tout ramener à des 0 ou des 1. Courant d'idées que j'ai tenté de résumer.
J'apprécie fortement les mathématiques mais je me méfie des gens qui veulent tout mathématiser, axiomatiser ou formaliser justement parce que je sais ce que sont les mathématiques.
D'un autre coté, ce n'est pas parce que la digitalisation du monde est une idée excessive que cette vision des choses ne peut pas apporter des idées intéressantes en forçant à regarder les choses d'un point de vue différent. Mais cela demande une ouverture d'esprit qui consiste à faire temporairement abstraction de ses idées préconçues et cela semble être un exercise difficile pour certains.
Le commentaire aurait gagné en clarté si vous aviez abordé la distinction fondamentale entre le savoir mathématique et le savoir physique (et non pas la connaissance). C'est-à-dire la différence entre les vérités synthétiques et les vérités analytiques qui est le message que votre commentaire essaie bien maladroitement de faire passer. Mais dans le fond, je suis d'accord avec vous.
Ainsi, la plupart des
Posté par Anonymous le18 Jan 2006 à01:46 CEST
Du doute mon Q ! (Ce Q désigne l'ensemble des rationnels, tu l'avais compris, n'est-ce pas)
Je ne vois pas en quoi le fait que la grande majorité des réels ne soit pas nommable démontre quoi que ce soit à l'encontre de leur réalité. As-tu besoin de nommer les objets qui t'entourent pour t'assurer de leur existence ? Ou bien peux-tu te cogner dans une chaise et te faire mal sans être pour autant capable de nous donner sa formule chaisique ?
Ta connaissance progresse, parce que tu parles d'objets du monde.
Le monde, gamin, pas un quelconque modèle mathématique.
Tu n'as pas besoin d'axiomatiser Ikéa pour t'asseoir sur une chaise ni trouver ça confortable.
Les mathématiques que tu encenses (c'est-à-dire, enfumes) ne sont même pas les seules qu'on ait pratiquées ni qu'on pratiquera. C'est une hypostase du courant formaliste né dans le tournant du XXe siècle.
Ce sont des mathématiques qui tournent "à vide", et dont Gödel a voulu démontrer l'inanité (curieusement tout le monde le cite aujourd'hui, et tu y fais même un peu allusion en passant).
Il n'y a rien de surprenant à ce que, dans un monde qui tourne à vide sur des formules creuses (le calcul formel, ce sont des formules creuses dont la validité ne dépend pas de comment on les remplit, mais tu as le droit de prendre cette expression dans un sens plus polémique)...
...rien d'étonnant, dis-je, que dans un tel monde tu puisses enchaîner théorème sur théorème sans jamais rien gagner en terme de compréhension.
Oui c'est vrai, la compréhension que tu auras de 123456+111111=234567 est la même que celle de 1+1=2 et des axiomes de Peano, et la compréhension du théorème de Pythagore est la même que celle des axiomes de ta géométrie préférée.
Mais si tu te tournes vers les objets du monde, tu dois t'extraire d'une manière ou d'une autre de la pure activité déductive, et affronter le réel (= cette expression veut dire, prendre de front une "res" = une chose qui vient heurter ta pratique = un ob|jet, quelque chose qui se jette en travers de toi (ob))
Exemple, tu veux calculer la hauteur d'une montagne, c'est un objet du monde, une chose (res). Tu dois affronter ce réel, par exemple, en escaladant la montagne et en dévidant de quoi la mesurer, si c'est possible. Comme ça ne l'est pas, tu essaies autre chose, tu modélises la montagne par une pyramide, par exemple, puis tu appliques des formules en te basant sur des mesures optiques.
Ceci reste un modèle, car il se pourrait que tu vives dans un monde où les propriétés optiques soient telles que ta mesure est une illusion.
Mais, que ton modèle soit plutôt exact ou plutôt inexact, l'objet montagne est un objet du monde, extérieur aux axiomes des mathématiques, et tu ne l'as pas inventé toi (à moins que tu ne t'appelles Dieu).
Conclusion : cet objet n'était pas d'emblée dans tes axiomes... tu t'es "cogné dedans", il s'est jeté contre toi (tu as découvert le Mont Blanc en regardant par la fenêtre du chalet, par ex.), c'est un ob-jet (jeté contre).
Donc, ta connaissance augmente après la mesure du Mont Blanc, et de même, ta connaissance augmente après une découverte en Physique, et même après toute découverte ailleurs...
Ta connaissance, pas ta compréhension.
--
Bien sûr, si tu penses que le monde est fait de zéros et de uns dans la pensée de je ne sais quel cyborg, connaissance = compréhension, et tous les paradoxes (pour employer un terme poli) que tu as mentionnés surgissent.
Mais courage... Encore un peu de Hoffstadterisme et les pitits hackeurs auront transformé le monde en Matrixe. Tu pourras enfin être pris au sérieux et dire que la cuiller n'est pas réelle (elle est transcendante, pourtant).
Concept de dimension
Posté par alpheccar le12 Nov 2005 à00:26 CEST
Je pense qu'il y a confusion entre dimension et cardinalité/bijection dans ton commentaire. Deux ensembles peuvent être en bijection et n'avoir pas la même dimension topologique.
Tout dépend du concept de dimension que l'on considère. Il y en a plusieurs. Ici on s'intéresse aux degrés de liberté d'un système et on cherche à savoir si c'est proportionnel au volume d'un système ou à sa surface. Et les degrés de libertés du système ce sont les constituants ultimes, ceux qui permettent de définir les micro-états du système.
dimensions
Posté par carovince le11 Nov 2005 à23:17 CEST
A la ligne 12, tu parles d'un monde bidimensionnel, et pourquoi pas d'un monde monodimensionnel? En effet, si Dieu est un programmeur, pourquoi parler de 2 dimensions? N'importe quel code informatique est en 1 dimension... Qu'est-ce qu'un monde bidimensionnel, moi, personnellement, je vis dans un monde monodimensionnel... A+.