![]()
Les significations sont-elles dans la tête ?
L’intérêt pour la langue est un trait dominant de la philosophie contemporaine. Non que nos contemporains soient les premiers à découvrir le langage. Celui-ci a toujours été à la place d’honneur dans la philosophie, tant il est vrai que la compréhension que l’homme prend de lui-même et de son monde s’articule et s’exprime dans le langage ; les sophistes grecs sont sans doute les premiers à en avoir pris une conscience aiguë ; Socrate cherche les " définitions ", c’est-à-dire le sens permanent de nos mots et de nos phrases ; Platon, dans le Cratyle , s’interroge sur la " justesse " des mots et établit, dans le Théétète et Le Sophiste , que c’est la structure complexe de la phrase, faite d’un entrelacs du nom et du verbe, qui seule permet la fausseté, qui est le pouvoir de dire faux, de dire ce qui n’est pas. Dans son traité Sur l’interprétation, Aristote établit que toutes les lois de la logique s’édifient sur les caractères de la proposition, laquelle consiste à affirmer ou nier " quelque chose au sujet de quelque chose ". La métaphysique prend ainsi appui sur une connaissance exacte du fonctionnement du langage. Il y a eu dans l’histoire plusieurs grandes époques pour la philosophie du langage : la dialectique des médiévaux et des discussions autour du nominalisme ; la théorie des signes du XVIIIe siècle, en particulier chez Condillac et chez Rousseau ; les conjectures et les discussions sur l’origine des langues, chez Herder et dans le grand idéalisme allemand.
Cependant, du fait de l’apparition de certaines nouvelles disciplines telles que la linguistique, la psychologie, ou encore les neurosciences, les problèmes posés par la philosophie du langage au XXème siècle ne sont plus les mêmes, et surtout ne sont plus abordés de la même manière. Ainsi, l’intelligence artificielle, par exemple, a permis de révéler concrètement certains problèmes posés par la philosophie du langage, et notamment celui de la signification. En effet, l’ingénierie linguistique a véritablement progressé durant ces trente dernières années. Cependant, celle-ci reste très éloignée des objectifs que l’intelligence artificielle s’était fixés. Les ordinateurs ont rencontré un certain succès dans des domaines formels et proches de l’aspect codique du langage, c’est-à-dire ce qui dans le langage est traité comme code, mais ils ont échoué dans les aspects les plus quotidiens et les moins formalisables de l’usage du langage. En cela, les problèmes que le langage pose à l’informatique font écho à une formule générale en intelligence artificielle : ce qui est difficile pour l’homme est facile pour l’ordinateur et ce qui est facile pour l’homme est difficile pour l’ordinateur. Ainsi, le calcul mathématique, le jeu d’échecs et bien d’autres activités de ce type qui imposent à l’être humain un effort intellectuel sont relativement faciles à résoudre pour un ordinateur. En revanche, la reconnaissance visuelle des objets, la capacité à comprendre et à produire des phrases sont au-delà de la capacité actuelle des ordinateurs. Cet échec relatif est dû en partie au fait que l’analyse du langage n’a pas porté de façon satisfaisante, pendant longtemps, sur l’usage que les gens font du langage, la façon dont on utilise des phrases pour exprimer des pensées, et plus important encore, la façon dont cet usage s’appuie sur une masse énorme de connaissances sur le monde à partir desquelles les interlocuteurs font des inférences sur ce que la personne qui leur parle veut leur dire. On peut donc ainsi expliquer les problèmes posés par la signification au sein même de la compréhension du langage. En effet, par quel moyen obtenons-nous la signification d’un mot ou d’un énoncé ? Où se «trouve » cette signification. En d’autres termes, les significations sont-elles dans la tête ?
Pour répondre à cette question, nous verrons, d’une part, qu’est-ce qu’une signification ? D’autre part, quelle est la position des cognitivistes en ce qui concerne le problème de la signification ? Et enfin, que peut-on reprocher à cette conception et quelles sont les solutions envisageables ?
Le langage est probablement et avant toute chose un outil de représentation et de transmission de connaissance et d’information. On pourrait donc le considérer comme un code. Cependant est-il réductible à un simple code ? L’un des facteurs qui a contribué à l’échec relatif de l’intelligence artificielle, est que le langage a été perçu et abordé exclusivement comme un code. Dans cette optique, il y aurait une association de nature conventionnelle entre les mots, conçus comme des signaux, et la signification des mots, conçue comme le message. Le langage permet de tout exprimer et est, d’une certaine façon, transparent quant au message que véhicule les phrases. Il se suffit à lui-même et l’interprétation d’une phrase consiste à le décoder, c’est-à-dire à utiliser le code constitué par la langue dans laquelle elle est exprimée, pour restituer le message. Le langage, ainsi perçu, est une sorte de substrat par le moyen duquel les pensées, qui ne sont pas directement transportables puisque immatérielles, peuvent le devenir par l’intermédiaire des phrases (matérielles) qui les expriment. Mais cette approche se heurte à des difficultés importantes lorsque l’on cherche à l’appliquer. En effet, loin que le message se réduise à un code de communication transparent, il est vite évident que l’usage du langage, la production et la compréhension des phrases font appel à des connaissances non linguistiques et impliquent des processus inférentiels. Ainsi, même si le langage peut être considéré comme un code indépendant, son usage ne peut se séparer des capacités humaines, telles que le raisonnement ou les connaissances sur le monde, qui n’ont rien de spécifiquement linguistique.
Mais revenons au problème de la signification au sein de la philosophie du langage. En effet, qu’est ce qu’une signification ? Pour comprendre ce qu’est une signification, nous analyserons pour commencer la conception frégéenne de la signification. Gottlob Frege, l’un des fondateurs de la logique contemporaine, a également été perçu, après sa mort, comme le fondateur de la philosophie du langage. C’est à lui que l’on doit les notions centrales du paradigme dominant de la philosophie du langage au XXème siècle qui peuvent être caractérisées en trois thèses : premièrement, la signification d’un énoncé déclaratif s’identifie avec ses conditions de vérité, c’est-à-dire avec la vérification des circonstances dans lesquelles un énoncé est vrai. Deuxièmement, la valeur sémantique d’une expression complexe dépend fonctionnellement des valeurs sémantiques de ses constituants (c’est ce que l’on appelle le principe de compositionnalité de la signification). Et enfin, les images, les représentations et les autres entités mentales, éventuellement associées aux expressions linguistiques, ne sont pas les significations des expressions. De plus, les considérations psychologiques n’interviennent pas dans la théorie de la signification. Cette dernière thèse a pour objectif de s’opposer directement à la conception mentaliste de la signification.
Les travaux de Frege sur le langage commencent par la constatation que deux expressions distinctes peuvent avoir le même sens. Frege distingue dans les noms, d’une part leur sens, et d’autre part leur dénotation ; la dénotation du nom étant l’objet désigné par ce nom. Cependant, même si Frege conçoit que deux expressions distinctes puissent avoir le même sens, il est convaincu que le langage doit être capable d’exprimer un contenu objectif. En effet, comment serait-il possible de communiquer, s’il n’existait pas une certaine objectivité dans le sens de chaque expression ? Frege reconnaît cependant qu’il existe dans une expression linguistique une part de subjectivité ; c’est ce qu’il appelle la représentation d’une expression. En effet, chacun de nous associe à une même expression une représentation différente, parce que la représentation dépend de l’expérience, et celle-ci est propre à chaque individu. C’est par le principe de compositionnalité, selon lequel, comme nous l’avons vu précédemment, la valeur sémantique (sens ou dénotation) de toute expression complexe est fonction des valeurs sémantiques de ses constituants, que Frege parvient à introduire la notion d’objectivité au sein même de la signification. Selon cette thèse, le sens d’un énoncé est la pensée qu’il exprime, et sa dénotation est sa valeur de vérité (le terme «pensée » n’est pas assimilé à celui de «représentation », et même il s’y oppose, puisque selon Frege, la pensée est quelque chose d’objectif, et qui n’est pas perceptible par les sens.). Ainsi, Frege arrive à la conclusion suivante : les pensées sont des entités objectives, identifiées aux significations des phrases d’un langage, qui ont la propriété d’être vraies ou fausses de toute éternité, indépendamment des esprits qui peuvent reconnaître leur condition de vérité, et de manière absolue, c’est-à-dire indépendamment de toute relativisation à un contexte. De ce fait, Frege s’oppose à toute vision mentaliste de la signification.
Wittgenstein, philosophe autrichien et élève de Russel à Cambridge, publie en 1921 son Tractatus logico-philosophicus. Il y expose, en soixante-quinze pages d’aphorismes, que le seul usage correct du langage est d’exprimer les faits du monde, que les règles a priori de ce langage constituent la logique (telle que l’ont conçue Frege et Russell), que le sens éthique et esthétique du monde relève de l’indicible et que la philosophie, dans son effort pour montrer les pièges du langage, se condamne finalement elle-même au silence. Pour Wittgenstein, le seul langage pourvu de sens est celui qui produit une image du monde, c’est-à-dire dont la forme logique reflète la structure des faits. L’auteur postule, en effet, que tout fait est exprimable par une proposition obtenue en combinant des liaisons de propositions «atomiques » (thèse de l’atomisme logique) et dont la valeur de vérité ne dépend que de celle de ses ultimes composantes (thèse d’extensionnalité). Cette forme logique joue le rôle d’un système universel de référence dont la «géométrie » délimite nécessairement et a priori les structures d’un monde possible. Pour Wittgenstein, comme pour Frege, les propositions ont un sens, à la différence des noms qui n’en ont pas, et dont leur valeur sémantique est simplement leur dénotation. Le sens d’une proposition est ce que l’on connaît quand on la comprend, c’est-à-dire, la proposition étant une image, l’état des choses figurées, à savoir la manière dont les choses sont, si la proposition est vraie. La proposition montre comment sont les choses, c’est-à-dire qu’elle montre son sens, et dit que les choses sont ainsi. Elle peut être vraie si les choses sont réellement ainsi, ou fausse dans le cas contraire. Pour savoir si la proposition est vraie, il faut la confronter avec la réalité, mais pour la comprendre, il n’est pas nécessaire de connaître sa valeur de vérité, il suffit de savoir ce qu’elle advient si elle est vraie. De cette manière, Wittgenstein institue le rapport entre signification énonciative et vérité, qui sera centrale dans le paradigme dominant.
Les philosophes néo-positivistes du cercle de Vienne, tels que Carnap et Schlick, s’intéressèrent de très près au Tractatus logico-philosophicus de Wittgenstein. Mais ces derniers l’interprétèrent de façon à ce que les notions développées par wittgenstein aillent dans le sens de leur propre philosophie. Les néo-positivistes retiendront de l’œuvre de Wittgenstein que l’analyse du langage est la seule voie d’accès à la logique et que l’appareil de la logique symbolique est l’instrument que doit appliquer le philosophe à l’élucidation de tout énoncé quel qu’il soit. Ainsi, les néo-positivistes pensaient que le langage évoqué par le Tractatus était un langage idéal. De ce fait ils étaient convaincus de la supériorité du langage artificiel sur le langage naturel. De plus leur lecture empirique du Tractatus les amenèrent à une interprétation abusive de certaine thèse. Ainsi, La proposition 4.024 du Tractatus («comprendre une proposition, c’est savoir ce qu’il advient si elle est vraie ») est interprétée comme si l’on affirmait qu’un énoncé est compris si l’on est en mesure d’en déterminer la vérité ou la fausseté par rapport à l’expérience, c’est-à-dire de le vérifier empiriquement. La vérifiabilité empirique est donc, pour les néo-positivistes, un critère de signification. Schlick écrivait à ce sujet : « établir la signification d’un énoncé équivaut à établir les règles selon lesquelles l’énoncé est utilisé, ce qui, à son tour, revient à établir la manière dont il peut être vérifié (ou falsifié). La signification d’un énoncé est la méthode de sa vérification. » (Schlick, Meaning and Verification). Ainsi, si un énoncé n’est pas empiriquement vérifiable, il est dénué de sens. Il semble donc que les néo-positivistes placent la signification du coté de l’expérience.
Le philosophe américain Quine est totalement opposé à la conception néo-positiviste de la signification. En effet, Quine résume sa thèse de la façon suivante : « L’empirisme moderne dépend en grande partie de deux dogmes. Le premier consiste à croire à un clivage fondamental entre les vérités analytiques (ou fondées sur les significations indépendamment des faits) et des vérités synthétiques (ou fondées sur les faits). Le second, le réductionnisme, consiste à croire que chaque énoncé doué de signification équivaut à une construction logique à partir de termes qui renvoient à l’expérience immédiate. Ces deux dogmes semblent mal fondés. Si on les abandonne, d’une part, on contribue à effacer la frontière entre la métaphysique spéculative et les sciences de la nature ; d’autre part, on se réoriente vers le pragmatisme » (De Vienne à Cambridge, trad. P. Jacob, 1980, p. 87). Le second dogme est un corollaire du premier. En prenant isolément chaque énoncé doué de signification pour le confronter à l’expérience immédiate, on entreprend la tâche impossible de distinguer, phrase par phrase, la part de la théorie et celle de l’évidence sensorielle. Le fait que la logique distribue les valeurs de vérité (vrai, faux) phrase par phrase ne doit pas faire oublier que le discernement de la signification ou des conditions de vérité requiert que chaque phrase soit replacée non seulement dans son contexte mais aussi dans un horizon scientifique plus ou moins large suivant les cas. Les objections au premier dogme sont plus fondamentales, puisque Quine rejette la conception linguistique de la logique, qu’il attribue à Carnap (et indirectement à Wittgenstein), cette conception linguistique étant une forme de conventionnalisme. Quine a énoncé une autre thèse, liée aux deux précédentes, celle de l’indétermination de la traduction (avec son corollaire, l’inscrutabilité de la référence ). Cette thèse a donné lieu à des controverses encore plus nombreuses : « Les manuels pour traduire une langue dans une autre, écrit-il, peuvent être construits de manières divergentes, toutes compatibles avec la totalité des dispositions à parler, et cependant incompatibles entre elles. » La conséquence en est la «disparition » de ce monde objectif des «significations », que Quine relègue au rang des mythes. Ainsi la notion de signification prend un sens totalement différent avec Quine, opposée à celles de Frege, de Wittgenstein, et des néo-positivistes. Nous nous approchons donc avec Quine d’une conception pragmatique de la signification.
Nous avons donc vu, que l’interprétation de la notion de signification a véritablement évolué, et que cette variation est due, entre autre, à l’évolution du concept de langage au sein de la philosophie, mais aussi de la linguistique, de la logique, de la psychologie, et de l’avancé des travaux en intelligence artificielle. Mais, la discipline dans laquelle la notion de signification a réellement pris toute son ampleur, est les sciences cognitives.
Mais quel est l’enjeu de cette discipline ? Les sciences cognitives ont pour objet de décrire, d’expliquer et le cas échéant de simuler les principales dispositions et capacités de l’esprit humain : langage, raisonnement, perception, coordination motrice, planification, etc. Nées il y a quelque trente-cinq ans dans un contexte scientifique fortement marqué par la naissance de l’informatique et le développement des notions et des techniques de traitement formel de l’information, elles constituent actuellement un faisceau de programmes de recherche relevant de différentes disciplines, articulés autour de quelques paradigmes, appuyés sur certains concepts pivots et animés par un petit nombre d’hypothèses fondamentales concernant la nature profonde de leur objet d’étude et la manière de la dévoiler.
Pour comprendre les répercussions des sciences cognitives sur la philosophie du langage, et plus précisément, sur la notion de signification, il est intéressant d’analyser brièvement la conception cartésienne de la pensée. En effet, la conception cartésienne de la pensée permet d’expliquer, en partie, la conception cognitiviste de la signification. Selon Descartes, Les pensées reposent sur des actes mentaux, dont les contenus sont constitués par certaines représentations du monde dans l’esprit (ou idées) immédiatement présentes et connaissables. En ce sens, il est possible de rapprocher la notion de pensée, telles que Descartes la conçoit, avec des significations purement internes. Les pensées sont, selon cette conception, essentiellement «privées », c’est-à-dire que leur existence et leur nature dépendent du sujet qui les pense. Nul autre que moi ne peut accéder au contenu de mes propres pensées et le vérifier. Il s’en suit que j’ai toujours une autorité ou un «accès privilégié » à ces pensées, qui les rend à la fois transparentes et indubitables, et susceptibles d’être l’objet d’une attention et d’une réflexion particulières. Descartes admet que les pensées ont une certaine structure : elles sont composées «d’idées », qui peuvent se combiner entre elles et représenter le monde, avec un degré plus ou moins grand de certitude selon qu’elles proviennent de la sensation et de l’imagination, ou de l’entendement en tant qu’il est capable de produire des idées claires et distinctes, et ainsi conférer à ces représentations une objectivité (garantie par la véracité divine). Cette conception vise donc à montrer que le langage n’est pas la condition de la pensée, mais la conséquence directe de celle-ci. Cette conception cartésienne de la pensée permet donc d’introduire la notion de signification interne, qui sera reprise par une grande partie des cognitivistes.
Comme nous l’avons vu précédemment, les sciences cognitives ont pour objectif d’éclairer le fonctionnement de l’esprit humain, et celles-ci reposent sur certaines hypothèses fondamentales. L’une d’entre elles consiste à dire que, malgré les différences évidentes entre le cerveau humain et les machines (le premier biologique, les secondes mécaniques ou électroniques), il n’y a pas de raison, en principe, pour que l’on ne puisse pas obtenir les mêmes résultats avec le cerveau ou avec les machines, c’est-à-dire en obtenir le même fonctionnement. Cette thèse qui est plus ou moins la thèse officielle des sciences cognitives est connue sous le nom de fonctionnalisme. Elle repose sur une autre hypothèse non moins forte, selon laquelle le cerveau a une caractéristique fondamentale qu’il partage avec les ordinateurs, à savoir la capacité à manipuler des représentations sous forme symbolique. Cette capacité correspond à une dimension «computationnelle » qui serait commune à l’homme et à l’ordinateur. La thèse en question est connue sous le nom de représentationnalisme. Ainsi, un grand nombre de cognitivistes se sont penchés sur le problème du fonctionnement du cerveau humain, et plus précisément sur le traitement de l’information à l’intérieur de celui-ci.
L’une des théories allant dans le sens du fonctionnalisme et du représentationnalisme est celle proposée par le philosophe et psychologue cognitiviste américain Jerry Fodor, que celui-ci appelle le moduralisme. Selon lui, le fonctionnement de l’esprit humain est un fonctionnement hiérarchisé et le traitement de l’information, quelle que soit la source (visuelle, auditive, linguistique, etc.), se fait par étapes successives, chacune correspondant à un composant de l’esprit : celle du «transducteur », du «système périphérique », et du système «central ». Selon cette thèse, le traitement de l’information peut s’expliquer ainsi : dans un premier temps, lorsqu’un événement se produit (son, apparition d’un objet dans le champ de vision, énoncé, etc.), les données de la perception sont traitées dans un transducteur qui les «traduit » dans un format accessible pour le système qui opère à l’étape suivante. Dans un deuxième temps, la traduction opérée par le transducteur est traitée par un système périphérique, un module, spécialisé dans le traitement des données perçues par tel ou tel canal. Ainsi, on aurait un système spécialisé dans le traitement des données visuelles, un autre spécialisé dans le traitement des données auditives, un autre spécialisé dans le traitement des données linguistiques, etc. Ce système livre une première interprétation des données perçues, interprétation qui, dans le cas des énoncés, est largement codique. Cependant, cette première interprétation doit être complétée. Le complément se fait dans la dernière étape, lorsque l’interprétation fournie par le système périphérique spécialisé arrive au système central. C’est la tâche du système central de la compléter, et ce complément se fait par la confrontation avec d’autres informations déjà connues ou fournies simultanément par d’autres systèmes périphériques et grâce à des processus inférentiels.
Fodor est raisonnablement optimiste quant aux possibilités d’arriver à décrire de façon appropriée le fonctionnement des transducteurs et celui des systèmes périphériques. En revanche, le caractère complexe et non spécialisé du système central en rend le fonctionnement difficile, voire impossible à observer et à décrire, et Fodor est pessimiste quant aux chances d’en observer le fonctionnement.
Nous voyons donc, avec cette théorie du moduralisme, qu’il est possible de donner une explication au traitement de l’information au sein de l’esprit humain. Il est donc nécessaire désormais de se demander sous quel format cette information nous est donnée. En effet, si le but d’un système cognitif est de se construire une représentation du monde, et si cette représentation doit être appropriée, c’est-à-dire si elle doit représenter correctement des faits qui existent dans le monde, la question qui se pose est celle de son évaluation. Un point important pour construire une telle représentation consiste à l’évaluer et à la modifier constamment, en y ajoutant, en y retranchant, ou en changeant l’évaluation de certains de ses éléments au fur et à mesure des éléments d’information que l’on acquiert. La simple confrontation entre la représentation du monde et les données nouvelles auxquelles on accède ne peut fonctionner que si toutes ces informations sont représentées dans le même format. La notion de format, du moins dans une version simple, se laisse facilement saisir. Supposons que nous croyons vraie l’affirmation suivante : « Il y a un tueur dans la ville ». Supposons aussi que l’on nous dise en anglais : « there is no killer in the town ». Si nous ne parlons pas anglais, nous ne pouvons pas réévaluer notre croyance quant à la présence d’un tueur dans la ville en question, tout simplement parce que ces deux informations ne sont pas données dans le même format. Si nous savons parler anglais, nous pouvons réduire ces deux informations au même format, en les mettant toutes les deux soit en anglais, soit en français. Mais alors, sous quel format la représentation du monde se fait-elle ? La réponse à cette question ne peut être qu’hypothétique. Une réponse couramment apportée est celle de Fodor, qui consiste à dire que la représentation du monde se fait dans un langage interne et universel, le langage de la pensée, baptisé «mentalais ». Ce langage doit être conçu comme un langage formel, tels ceux de la logique mathématique : il possède donc des règles morphologiques et syntaxiques qui lui confèrent une autonomie formelle, et des règles sémantiques qui précisent les relations entre expressions du langage et entités ou situations représentées. Si l’on admet donc que le contact avec l’environnement permet au système de déterminer la valeur sémantique des symboles primitifs de son langage interne, celle des symboles composés qu’il produit dans le cours de son fonctionnement est entièrement déterminée ; c’est le parallélisme strict entre syntaxe et sémantique, ou, dit autrement, le caractère compositionnel de la sémantique, qui garantit le maintien, au cours des processus cognitifs, d’une adéquation des représentations du monde représenté.
L’hypothèse du «mentalais » possède plusieurs avantages par rapport à certaines thèses, telle que celle des linguistes, selon laquelle, la langue que l’on parle, quelle que soit cette langue, suffit à représenter le monde. D’une part, elle rend compte du fait que les capacités mentales des gens pour leur représentation du monde et pour leur capacité de raisonnement sur le monde semblent être les mêmes quelle que soit leur langue, alors que les capacités de représentation des langues ne sont pas les mêmes. En effet, il n’est pas question de dire que certaines langues sont meilleures que d’autres, mais aucune langue n’a exactement la même capacité de représentation. D’autre part, l’hypothèse du «mentalais » permet d’expliquer comment les animaux ont une représentation du monde alors que, d’évidence, ils n’ont pas de langage au sens humain du terme. Non que les animaux aient un langage intérieur ou une représentation du monde aussi sophistiqués que ceux des êtres humains ; reste qu’ils semblent bien en avoir une. Et enfin, le «mentalais » semble bien s’allier avec l’hypothèse chomskienne de la grammaire universelle.
En effet, L’ensemble des travaux linguistiques de Chomsky depuis 1955 se laisse décrire comme une tentative constamment reprise pour répondre aux deux questions suivantes : d’une part, comment caractériser le savoir linguistique d’un locuteur maîtrisant sa langue ? Et d’autre part, comment cette «compétence » est-elle acquise ? Un examen même superficiel suffit à attribuer à cette compétence des propriétés complexes et subtiles. Chacun comprend et produit des phrases qu’il n’a jamais entendues : nos discours sont faits pour l’essentiel d’énoncés nouveaux dans l’histoire de notre langue. Nous pouvons segmenter les énoncés, y discerner des ambiguïtés de structure, comme dans la phrase «un voleur de blé espagnol est tombé par la fenêtre » où l’adjectif «espagnol» peut porter aussi bien sur «blé » que sur «voleur » ; leur attribuer différents statuts allant de l’acceptable à l’inacceptable en passant par le douteux, comme dans les phrases interrogatives «quel livre as-tu acheté ?, comment ne sais-tu quel livre acheter ?, quel livre ne sais-tu comment acheter ? » ; et nous discernons les relations de coréférence possibles entre pronoms et expressions référentielles : nous savons par exemple que «pierre » et «le » ne peuvent désigner la même entité dans «pierre l’aime » mais le peuvent dans «le père de Pierre l’aime ». Dans chacun de ces domaines (syntaxe, phonologie, morphologie et sémantique lexicale), nos connaissances sont donc subtiles. Pourtant, aucune d’entre elles n’est apprise. En fait, seuls des aspects secondaires de la langue font l’objet d’un véritable apprentissage, impliquant répétitions, corrections, etc., par exemple le fait que le participe de «peindre » est «peint » et non «peindu » comme le croient souvent les enfants. Notre savoir se développe de plus sans efforts apparents, inconsciemment et uniformément : à huit ans, un enfant maîtrise sa langue qu’il ne modifiera plus que sur sa périphérie, par ajout lexical. Cela est vrai en dépit des aptitudes inégales des individus et des disparités dans l’environnement culturel et affectif qui ont de grands effets dans d’autres domaines. Enfin, cette compétence linguistique s’étend à des faits auxquels le locuteur ne peut avoir accès, par exemple les statuts des énoncés interrogatifs mentionnés ci-dessus.
Afin de répondre à ces questions, Chomsky va montrer que, par-delà les descriptions qu’elle rend possibles, la théorie linguistique doit spécifier les aspects invariants des systèmes de règles qu’elle autorise. Elle doit aussi inventorier les «universaux de substance », comme la liste des traits distinctifs qui caractérisent les systèmes phonologiques des langues naturelles. Chomsky montre que si nous imputons cette théorie générale à l’état initial des locuteurs, nous pourrons faire le départ entre les aspects de notre savoir linguistique qui viennent de notre «faculté de langage » et qui y sont donc nécessairement inclus, et ceux qui nécessitent un apprentissage.
La totalité de l’hypothèse d’une grammaire universelle, autant que celle du «mentalais », repose sur une autre hypothèse : celle de l’innéisme des concepts. Cette capacité innée à former des concepts a été développée de façon à proposer une solution mieux adaptée que l’acquisition de la connaissance par induction. En effet, selon certains philosophes, et principalement Hume, l’induction n’apporte aucune connaissance vraie. Celle-ci consiste à livrer des conclusions à partir de prémisses qui s’appuient sur l’expérience. La question est de savoir s’il est possible de tirer avec un minimum de certitude une conclusion générale vraie de prémisses particulières. Or on s’aperçoit que ce passage du particulier au général peut amener à des conclusions parfaitement erronées, comme dans le raisonnement suivant : j’ai vu un chat blanc, j’ai vu un autre chat blanc, j’ai vu encore un autre chat blanc ;… ; donc tous les chats sont blancs. L’induction peut cependant nous apporter une connaissance, mais celle-ci n’est pas stable. De ce fait, si l’on disposait d’un modèle inductif fiable, la formation des concepts serait un problème réglé depuis longtemps. Il suffirait de montrer à un enfant un objet tel qu’une pomme, de lui en dire le nom, de répéter l’opération un certain nombre de fois, et le problème serait réglé. Tout ce que nous aurons appris à cette enfant, c’est que l’objet A, l’objet B, et l’objet C portent une étiquette commune : « pomme ». Ils n’ont aucun moyen de généraliser à l’ensemble de tous les objets qui ont un certain nombre de caractéristiques communes avec A, B, et C. Une façon de se sortir de la difficulté consiste donc à adopter l’hypothèse fodorienne sur la formation des concepts, selon laquelle, il n’y a pas de formation des concepts parce que l’être humain possède, dès la naissance, les concepts qui sont «précâblés » (pre-wired). En d’autres termes, les significations sont innées et il n’y a pas lieu de les acquérir. Les concepts innés, qui ne réduisent pas strictement aux contenus lexicaux attachés aux mots, font partie du langage de la pensée. L’hypothèse fodorienne d’un langage de la pensée innée a fait l’objet de controverses enflammées, que nous examinerons dans la troisième partie. Elle s’appuie sur le fait, difficilement discutable, qu’il y a d’avantage dans les concepts que ce que l’on acquiert par expérience ; même des concepts très quotidiens incorporent des informations au-delà de celles qui sont disponibles dans l’expérience.
Pour défendre la position de Fodor, au moins partiellement, nous pouvons partir d’un exemple de Quine. Il imagine la situation suivante : un anthropologue est isolé dans une tribu autochtone dont il étudie le langage. Un lapin traverse le chemin et un des autochtones dit «gavagai ! ». Le problème que soulève Quine est celui de la signification que l’anthropologue doit attribuer à l’expression «gavagai ! ». Est-ce que cela signifie «tiens, un lapin ! », « Regardez un lapin ! », « Gavagai ! »(où Gavagai est le nom propre du lapin en question), «lapin », «voilà un lapin ! », ou encore «il lapine !» (comme on dit il pleut), etc. Malgré l’ingéniosité de Quine, toutes les possibilités ne sont pas ouvertes, car la perception de la réalité est bornée par les capacités perceptives et conceptuelles humaines. Ainsi il y a très peu de chance pour que «gavagai » veuille dire «il lapine ». Un enfant qui apprend à parler est dans une situation identique à celle de l’anthropologue, son entourage jouant le rôle des autochtones. Ce que montre l’exemple de Quine, et c’est lui qui le dit, est qu’une approche purement inductive de l’acquisition des concepts ne peut pas fonctionner. Ce qu’il ne dit pas, en revanche, c’est que son exemple montre aussi que nous n’avons pas une approche inductive des concepts et du langage, qu’il s’agisse des concepts de notre langue maternelle dans notre enfance ou de ceux d’une langue étrangère que nous essayons d’acquérir par la suite. En effet, face à une image, un enfant ne fait pas un nombre incalculable d’hypothèses sur ce que peut désigner le mot. Il pense, à juste titre, que le mot qu’on lui dit, désigne l’objet représenté sur l’image. Le point notable de ces observations est que cette relation entre un mot et un objet bien déterminé soit aussi peu problématique.
Ainsi, il semble bien que, si ce n’est l’ensemble des concepts dans leur détail, en tout cas de grandes catégorisations de base sont universelles et innées. Fodor n’a pas nécessairement raison, mais cela signifie quand même que son hypothèse est loin d’être impossible, et que l’hypothèse de catégorisation et de connaissances préalables innées est à peu près inévitable.
Nous avons donc vu, que pour des cognitivistes, tels que Fodor et Chomsky, les significations dérivent d’un processus exclusivement interne. En ce sens, nous pouvons dire, que, selon eux, les significations sont «dans la tête ». Cependant, cet avis n’est pas partagé par tous. L’un des mouvements les plus opposé à cette conception est le béhaviorisme. Les béhavioristes ne s’intéressent qu’aux comportements des individus, et refusent l’existence d’états mentaux, ou du moins, ils ne s’en occupent pas. Une impulsion déterminante pour le béhaviorisme fut donnée par l’étude de la façon dont l’animal résolvait des problèmes élémentaires tels que trouver le mécanisme permettant d’ouvrir une boîte dans laquelle il se trouvait enfermé, ou utiliser un instrument pour atteindre un appât. Il apparut alors que l’intelligence pouvait être abordée à partir de la seule étude du comportement de solution (nature des différentes tentatives de solution, temps nécessaire à la solution, etc.) et il sembla tout naturel d’appliquer la même méthode à l’étude de l’intelligence humaine. On proposa donc des problèmes analogues à de jeunes enfants, des problèmes plus complexes à des adultes, en s’attachant essentiellement, sinon uniquement, à l’étude des comportements mis en œuvre pour tenter d’aboutir à la solution. La théorie des béhavioristes, par rapport à ces expériences, est que la découverte de la solution, de plus en plus rapide au fur et à mesure des essais successifs, était attribuée à l’élimination des comportements avérés inutiles et au renforcement des comportements adaptés. Cette théorie, transposition de la loi darwinienne de sélection naturelle, permet de comprendre la genèse d’un comportement finalisé sans faire appel à un plan dirigé par une intention. Ainsi, selon eux, l’intelligence animal et l’intelligence humaine sont de même nature ; leur différence n’est qu’une question de degré. Cette théorie entraîne des répercussions sur le domaine du langage, puisque selon eux, il n’y a pas de raison d’attribuer le langage seulement à l’homme. Cette thèse est donc radicalement opposée à la thèse de Chomsky, selon laquelle, le langage est une capacité cognitive humaine et seulement humaine. Le béhaviorisme réduit donc les processus mentaux à leurs manifestations extérieures comportementales.
Wittgenstein, qui n’est pas à proprement parlé un behavioriste, est également opposé, dans ses thèses, à la conception cognitiviste d’un langage privé. En effet, Wittgenstein est opposé à la thèse, selon laquelle, les significations des mots sont, en général, des entités mentales. Pour ruiner cette thèse, ce dernier émet l’hypothèse de l’existence d’un langage dont les expressions assument une signification lorsqu’elles sont associées à une expérience vécue, par exemple avec une sensation. Selon Wittgenstein, les significations de ces expressions seraient accessibles exclusivement à la personne qui ressent la sensation et à personne d’autre. « Wittgenstein montre que quiconque se proposerait de communiquer (avec lui-même) dans un tel langage ne disposerait d’aucun critère pour déterminer si son emploi de ses expressions est correct : il n’aurait aucun moyen de savoir s’il les utilise correctement, ou s’il ne fait que croire les utiliser correctement. » (Marconi, La philosophie du langage au XXème siècle, p.75, l’éclat). Il apparaît donc que selon Wittgenstein, la signification est directement liée à l’usage correct que l’on en fait. Or, sans ce critère, une expression n’a pas de signification. De ce fait, un langage privé est inconcevable. En d’autres termes, ce qui manque au langage privé pour être un véritable langage, ce sont des règles et des critères publics sans lesquels un langage ne peut exister. En montrant qu’un langage privé est impossible, Wittgenstein entend non seulement réduire à l’absurde la thèse selon laquelle un contenu mental quelconque pourrait être privé, mais aussi affirmer que toute attribution d’un contenu mental présuppose la possession d’un langage. En ce sens, tout contenu mental doit répondre à des critères extérieurs. De la même manière, Peirce soutient que toute pensée est un signe qui suppose l’usage du langage, et requiert un mode d’expression public par lequel tout signe mental est interprété par un tiers, y compris quand elle paraît être purement solitaire. Pour Peirce, toute pensée est bien un dialogue avec soi-même, mais dans lequel le moi parle à un autre moi qui se pose en «interprète » de ce que dit le premier. Une pensée se mesure à d’autres pensées ou signes, qui sont ses antécédents ou conséquents, et doit nécessairement faire partie d’un processus d’inférence ou de raisonnement. Nous avons donc à faire ici à une vive opposition à la thèse fodorienne du «mentalais », puisque selon Fodor, ce langage serait interne et universel.
Revenons maintenant à l’une des thèses les plus critiquées du cognitivisme. Nous faisons allusion ici à la thèse fodorienne des concepts innés que nous avons vue plus haut. Malgré que celle-ci paraisse résoudre un certain nombre de problèmes liés à celui de la signification, on s’aperçoit que les objections ne manquent pas. La première objection est celle du philosophe américain Hilary Putnam. Celui-ci objecte à cette thèse que de nombreux concepts sont extrêmement récents. En effet, il paraît difficile de justifier comment des concepts liés à la technologie moderne, comme ordinateur, avion, satellite géospatial, carburateur, etc., puisse être innées. On peut comprendre que des concepts qui ont été utiles, voire indispensables, à la survie des individus depuis l’apparition de l’espèce humaine soient innés, comme chaleur, eau, danger, nourriture, etc., mais il est difficilement concevable que des concepts innés nécessaires à l’origine de l’humanité (s’il y en a un) pourraient inclure des concepts correspondant à des réalités impossibles, même à entrevoir, à cette époque. La deuxième objection, qui n’est pas de Putnam, s’attaque au caractère flou ou vague des concepts. En effet, il est difficile de mettre en lumière des concepts stables chez les individus. De ce fait, comment pourraient-ils être innés, puisque, en effet, l’innéisme semble supposer une certaine rigidité dans les comportements. ? Et enfin, la troisième objection reprend une accusation générale contre les hypothèses innéistes : ce sont des hypothèses faciles qui permettent de proposer des pseudo-solutions, mais laissent en fait le problème entier.
Malgré le fait que toutes ces objections semblent fondées (si ce n’est peut-être la troisième), il est cependant possible d’y répondre. La première objection (celle de Putnam) ne prend pas en compte le fait qu’un concept puisse être construit à partir de plusieurs autres. En d’autres termes, il n’y aurait rien d’extravagant à différencier des concepts simples et élémentaires et des concepts complexes construits par composition de concepts simples. De fait, cette hypothèse se marie bien avec l’hypothèse Frégéenne de la «compositionnalité », selon laquelle, à partir de propositions simples, on peut former de nouvelles propositions complexes, ou à partir de mots, des phrases. La troisième objection, de principe, ne paraît néanmoins pas entièrement fondée. En effet, sauf à établir une barrière infranchissable entre l’espèce humaine et les autres, barrière qu’en tout état de cause rien ne justifie sur le plan scientifique, ou sauf à admettre que les comportements instinctifs et innés n’existent pas chez les animaux (une affirmation que nombre d’observations anciennes ou récentes contredisent.), il faut admettre qu’il y a des comportements innés chez les espèces animales. La deuxième objection, est certainement la plus délicate, mais une réponse partielle a été proposée dans la deuxième partie, lorsque nous avons remarqué que l’hypothèse d’une capacité de catégorisation préalable innée est difficilement inévitable, si l’on veut expliquer le processus de catégorisation humain des significations.
Cependant, quel modèle pourrait expliquer que nous avons la capacité de former des concepts et de ranger les objets du monde sous les catégories correspondantes, tout en admettant que nous possédons des concepts vagues ou flous ? Pour répondre à cette question, nous pouvons nous référer à la conception de Putnam sur la signification et sa référence. Selon lui, la référence des mots comme «eau » ou «citron », n’est pas déterminée par un ensemble de conditions associées au mot lui-même qui en constituent la définition. En effet, l’une des définitions les plus courantes de «citron» est «fruit de couleur jaune ». Cependant, un citron vert n’en n’est pas moins un citron. Mais «ceci vaut également pour la plus soignée des définitions que la science est en mesure de produire à un moment donné de son développement, et en général pour n’importe quelle détermination conceptuelle qu’un locuteur puisse avoir dans «la tête », en association à un nom d’espèce ou de substance naturelle. » (Marconi, La philosophie du langage au XXème siècle, p. 109). De façon à montrer que ce n’est pas la signification qui fixe la référence, Putnam imagine une expérience. Supposons que sur une «terre jumelle » en tout point semblable à la nôtre, l’eau ait les mêmes propriétés phénoménales que l’eau sur Terre, mais une composition chimique différente («xyz » au lieu de H2O). Sur cette Terre jumelle ce liquide s’appelle eau, et leur degré de connaissance chimique en ce qui concerne ce liquide est équivalent à celui de la Terre pour l’eau. De ce fait un terrejumellien qui viendrait sur Terre reconnaîtrait la différence entre ces deux liquides, malgré les apparences. Cependant, si celui-ci était venu avant que ces connaissances en chimie lui permettent de connaître la formule chimique de l’eau, il n’aurait pu faire la différence entre ce qu’il appelle «eau » et ce que nous appelons «eau ». Putnam en conclut que la référence du mot «eau » n’est pas déterminée par la signification associée à ce mot. Ainsi, la référence des mots comme «eau » ou «citron », n’est pas déterminée par la signification de ces mots qui pourrait être inscrite dans «notre tête », mais par notre position objective dans le monde réel, et par la nature de celle-ci. La conclusion de Putnam sur «la place » de la signification étant que les significations ne sont pas dans «la tête », ce qui va donc à l’encontre de la thèse fodorienne des idées innées. Ainsi, celui-ci a une conception externaliste de la signification, qui s’oppose à la conception internaliste de la signification de Fodor et de Chomsky. « Putnam ne dit pas que les noms d’espèce et de substance naturelle n’ont pas de sens, mais il insiste sur le fait que si leur sens sont des entités cognitives, ils ne déterminent pas la référence. Certainement les locuteurs ont «à l’esprit » quelque chose en association avec ces mots : s’il s’agit de locuteurs compétents, ils ont «à l’esprit » un ensemble d’informations (que Putnam appelle «stéréotype ») considérées socialement nécessaires pour une utilisation adéquate du mot. » (Marconi, p. 110). En d’autres termes, selon Putnam, le stéréotype correspond à ce que sait le commun des mortels, qui s’en remet aux spécialistes de la question pour définir précisément le concept. Ainsi, ceux d’entre nous qui ne sont pas capables de distinguer les chats siamois des chats persans ne nient pas qu’il y a une différence entre les uns et les autres, mais ils s’en remettent aux spécialistes pour leur expliquer quelles sont ces différences. Cette solution, connue sous le nom de «division du travail linguistique », permet d’éviter de considérer des concepts vagues ou flous lorsqu’ils ne font pas partie des concepts couramment connus.
En conclusion, il apparaît que nous sommes face à deux thèses antagonistes pour répondre à notre interrogation de départ : les significations sont-elles dans «la tête » ? Ou nous sommes de l’avis de Fodor et de Chomsky, et de ce fait nous adhérons à une conception internaliste de la signification, en admettant les hypothèses des concepts innés, du langage interne et universel et de la grammaire universelle, et nous affirmons que les significations sont dans la «tête » ; ou alors nous sommes de l’avis de Putnam et de Wittgenstein, et de ce fait nous adhérons à une conception externaliste de la signification, en affirmant que le fait que la signification ne fixe pas la référence montre que les significations ne sont pas dans «la tête ».
Cependant, n’est-il pas possible d’envisager une hypothèse sur les significations, à mi-chemin entre ces deux thèses antagonistes ? le modèle hypothético-déductif de formation des concepts peut être une solution. En effet, celui-ci utilise des règles de déduction logique et par des prémisses constituées tout à la fois par des connaissances catégorielles innées (sur la rigidité de certains concepts et leur stabilité, sur la différence radicale entre espèces naturelles et artefacts ou objets inanimés, sur le fait qu’il y a des conditions nécessaires et suffisantes d’appartenance à une catégorie, même si l’individu qui utilise la catégorie en question n’est pas capable de les énumérer, etc.) et par la perception de l’objet et du mot qu’il lui est associé. De ces prémisses, l’individu tire une conclusion qui est une hypothèse sur la catégorie à laquelle ressortit l’objet. Ce modèle n’est pas inductif, puisqu’il n’est pas fondé sur la multiplicité des expériences en l’absence de toute connaissance préalable. Au contraire, il s’appuie sur des connaissances préalables pour produire une conclusion, et une expérience suffit à obtenir celle-ci. Les tests suivent, mais ils ne constituent pas en eux-mêmes des éléments permettant de construire inductivement d’autres définitions : ils permettent plutôt de contredire la conclusion hypothétique ou de la confirmer, voire de l’affirmer lorsque certains d’entre eux sont positifs et d’autres négatifs. Cependant, même si cette théorie relie en partie les deux thèses antagonistes que nous avons citées plus haut, celle-ci ne peut être acceptée qu’en supposant l’existence de concepts innées, hypothèse qui, actuellement, paraît indispensable.