Un exemple d’analyse lexicographique de corpus médiatique : le cas des réseaux de santé en France, par Lucile Hervouet

Cette étude de cas s’inscrit dans le cadre d’une recherche sociologique sur l’émergence d’organisations innovantes en santé : les réseaux de santé. L’analyse d’un corpus d’article de presse « grand public » visait à comprendre la manière dont les réseaux de santé se représentent et sont représentés sur la scène publique.

Cette méthode et ce questionnement peuvent être adaptés à tout autre objet d’étude, dès lors que l’on dispose d’un corpus écrit constitué d’articles de quotidiens nationaux et locaux, de littérature grise ou scientifique.

1. Contexte et objectifs de l’analyse lexicographique

Afin de retracer l’émergence de ces nouveaux dispositifs dans le paysage sanitaire français, l’analyse d’un corpus médiatique est pertinente. Le discours politique et médical sur la coordination et les réseaux de santé a été relayé par les chercheurs et les journalistes. La mise sur l’agenda politique s’accompagne ici d’une mise sur l’agenda médiatique et scientifique. On peut ainsi rendre compte de la manière dont les réseaux de santé se sont progressivement inscrits dans l’espace publique à travers l’évolution des représentations et des enjeux dont rend compte la presse. Ce processus participe de « la production de la santé publique » décrite par D. Fassin selon qui « là où la médecine semble se dire en se faisant, la santé publique se fait en se disant » (Fassin, 1998, p.12).

Dans cet article, on répond à la question suivante : comment les réseaux sont appréhendés comme des objets médiatiques, mettant en évidence les débats auxquels ils renvoient, les « batailles » politiques dans lesquelles ils s’inscrivent, puis la stabilisation des représentations autour de réseaux de santé dédiés à la coordination territoriale et aux pathologies chroniques.

  • L’analyse du traitement médiatique d’un sujet peut donner lieu à deux interprétations :
    • d’une part, celle du traitement médiatique comme symptôme ;
    • et d’autre part celle de l’influence du traitement médiatique sur le sujet.

 Le traitement médiatique des réseaux de santé sera principalement appréhendé comme un symptôme du passage de cet objet dans le champ de la santé publique, sans pour autant totalement rejeter la seconde interprétation. Le discours médiatique est considéré comme un indicateur des logiques des acteurs et des enjeux associés au développement des réseaux de santé. En tant que relais intermédiaires entre les individus et les décideurs, les médias sont également appréhendés comme acteurs du système. On peut faire l’hypothèse que les représentations véhiculées interagissent avec les représentations des acteurs en présence – malades, professionnels de santé, représentant des tutelles-, et contribuent au processus de construction du rôle social des réseaux de santé.

La construction d’un espace médiatique représente un enjeu pour les réseaux eux-mêmes, face à l’enjeu de visibilité et de lisibilité des réseaux largement soulignés lors des entretiens réalisés auprès des malades, de leurs proches, des professionnels de santé, des représentant des autorités de tutelles mais aussi des promoteurs des réseaux eux-mêmes. Nombre d’articles recueillis relaient des informations diffusées par des réseaux locaux eux-mêmes sur leur activité.

2. Méthode de l’analyse lexicographique

La mise sur agenda médiatique a été appréhendée par la constitution d’un corpus non-exhaustifs d’articles parus entre janvier 1996 à mai 2011, analysés à l’aide du logiciel d’analyse de données textuelles Alceste. Il ne s’agit pas de rendre compte de l’intégralité des discours médiatiques produits autour des réseaux de santé, mais de mettre en évidence les différentes approches possibles. D’où la pertinence du recours au logiciel Alceste analysant la distribution du vocabulaire et définissant des classes de discours.

 Cette analyse trouve néanmoins ses limites dans la mesure où nous n’avons pu mettre en évidence de résultats pertinents d’un point de vue statistique en termes d’analyse dynamique (i.e. en observant l’évolution des classes discursives dans le temps) ou comparative (i.e. en comparant la distribution du discours médiatique « grand public » au discours scientifique). Par conséquent, nous ne rendrons compte ici que des résultats de l’analyse du corpus de presse « grand public » sur une période de 15 ans (1996-2011).

• Présentation du logiciel Alceste

Le logiciel Alceste (Analyse des Lexèmes Co-occurrents dans un Ensemble de Segments de TExte) est basé sur un ensemble de techniques d’analyse de données textuelles. Développée par Max Reinert du CNRS, cette méthodologie prend ses sources dans les travaux de Jean-Paul Benzecri au début des années 1960, dans la lignée de l’Ecole française d’analyse des données textuelles.

Le logiciel analyse un corpus de données numérisées, la distribution de son vocabulaire et défini des classes de discours. La méthodologie Alceste se distingue par l’utilisation de la classification descendante hiérarchique, qui classifie des unités textuelles et non des mots. Cette méthode procède par fractionnements successifs du texte. Elle repère les oppositions les plus fortes entre les mots du texte et extrait ensuite des classes d’énoncés représentatifs. Schématiquement, cela consiste à partir d’une première classe contenant la totalité des unités textuelles, puis à procéder à des partitions successives de sorte que les sous-classes obtenues aient les vocabulaires les plus différents possibles. L’intérêt de cette méthode est à la fois d’étudier l’organisation interne du corpus et de mettre en évidence les informations essentielles à sa description.

Avant de présenter les résultats notre étude, nous préciserons ci-dessous les définitions du vocabulaire associé à l’analyse textuelle sous Alceste.

– Le corpus constitue l’ensemble de textes réunis pour l’analyse. Dans notre cas, il s’agira de l’ensemble des articles sélectionnés.

– Les Unités de Contexte Initiales sont définies par l’auteur. Il s’agit des divisions « naturelles » du corpus telles que des réponses à des questions ouvertes ou, dans notre cas, les différents articles. On y associe des variables signalétiques telles que les dates de publication qui permettront par la suite de réaliser des tris croisés.

– Les Unités de Contexte Elémentaire sont définies par le logiciel Alceste. Chaque UCE est constituée d’une ou plusieurs lignes de morceaux de texte, définie à partir d’un compromis entre la forme syntaxique et la taille du corpus. Ces unités constituent les unités statistiques de base que l’on retrouvera tout au long des résultats de l’analyse.

–  Une classe est définie par l’ensemble des termes ou « formes » caractéristiques. Le profil de chaque classe est déterminé par l’ensemble des formes les plus significativement présentes et les plus absentes dans celle-ci.

• Constitution du corpus
  • Le corpus est constitué d’articles de presse quotidienne et hebdomadaire française, recueillis par le biais du logiciel d’archivage de presse Factiva avec les critères suivants :
    • Date : « toutes les dates » jusqu’au 02/05/2011
    • Langue : « français »
    • Support : « presse française »

Une première recherche a été réalisée avec les mots clés : « réseau(x) de santé » ; « réseau(x) de soins ». En ouvrant notre recherche aux « réseaux de soins », il s’agissait d’être en mesure d’appréhender la problématique des réseaux en santé de la manière la plus large possible. Pendant plusieurs années, la terminologie est en effet restée fluctuante tout en désignant des structures de prise en charge variées, comme nous le verrons par la suite.

A l’issu de cette première recherche, une base de 1230 articles issus de 28 sources[1], de janvier 1996 à mai 2011 a été constituée.

[1] Alternatives Economiques, Aujourd’hui en France, Dimanche Ouest France, Enjeux les Echos, L’Expansion, l’Yonne Républicaine, La Charente Libre, La Croix, La Montagne, La Nouvelle République du Centre Ouest, La Tribune, Le Berry Républicain, Le Figaro, Le Monde, Le Monde Economique, Le Nouvel Economiste, Le Parisien, Le Point, Le Progrès, Les Echos, L’Humanité, L’Humanité Dimanche, Libération, L’Indépendant, Midi Libre, Ouest France, Presse Océan, Sud Ouest.

De cette base ont été retirés plusieurs centaines d’articles où nos termes de recherche étaient cités mais sans développer d’information sur le sujet. Il s’agissait notamment d’articles de presse locale énumérant les coordonnées des structures administratives et médicosociales de communes.  A l’issue de ce tri, un corpus final de 833 articles a été analysé. Au sein de ce corpus, cinq classes discursives ont été différenciées par Alceste[1], sous la forme de cette classification descendante :

[1] Nous avons choisi de paramétrer l’analyse en classification double : deux classifications successives sont effectuées sur des unités de contexte de grandeur légèrement différente. Cette technique vise à assurer la stabilité des classes obtenues en écartant les biais dus au découpage du corpus. 

Avant de revenir en détail sur l’articulation de ces cinq classes, nous présentons ci-dessous les principaux termes caractérisant chacune d’elles :

Classe 1 : Négociations et décisions relatives aux réformes du système de santé (20% des u.c.e. classées)

Gouvernement, Juppé, Aubry, syndicat, ministère, caisse, réforme, ordonnance, texte, plan, CNAM [Caisse nationale d’assurance maladie], sanction, hier, loi, filière, CSMF [Confédération des Syndicats Médicaux Français], expérimentation, conflit.

Classe 2 : Actions et acteurs de la prise en charge ambulatoire (14% des u.c.e. classées)

Domicile, patient, équipe, malade, prise [en charge], famille, soigner, infirmières, accompagner, aider, douleur, mobile, soin, proche, personne, fin, mourir, coordonner.

Classe 3 : Définition et traitement des problématiques de santé publique (19% des u.c.e. classées)

Cancer, femmes, dépister, professeur, cancérologie, accoucher, CHU [Centre hospitalier universitaire], urgent, établissement, infection, hôpital, institut, homme, lutte, mortalité, recherche, télémédecine, sanitaire.

Classe 4 : Organisation des soins à l’échelle locale (21% des u.c.e. classées)

Association, commune, maison [de santé], canton, local, élu, réunion, réseau, territoire, maire, santé, journée, thème, organiser, régional, municipal, communauté, rural.

Classe 5 : Réflexion sur les modes de financement du système de santé (26% des u.c.e. classées)

Assurance, complémentaire, coût, entreprise, concurrent, système, prévoyance, milliard, marché, couverture, client, rembourser, privé, gestion, euro, compagnie, million, dépenses.

A travers la description des cinq classes discursives, nous nous attacherons ici à mettre en évidence la diversité des enjeux auxquels achoppent les réseaux de santé.

3. Résultats de l’analyse lexicographique : l’identification de trois types d’enjeux associés aux réseaux de santé

Les cinq classes discursives repérées à l’aide du logiciel Alceste s’organisent autour de trois enjeux déjà évoqués précédemment : la réforme du système de santé en France et son financement (classes 1 et 5), la prise en charge des problèmes de santé publique et le développement de la médecine ambulatoire (classes 2 et 3), et l’organisation territoriale des soins (classe 4).

Pour décrire les classes, nous mobiliserons largement le terme de « présence significative ». La présence significative d’un mot est déterminée en fonction du résultat du khi2 calculé par Alceste. Il s’agit des valeurs de khi2 d’association d’un terme, ou d’une catégorie grammaticale par rapport à une classe donnée. Les valeurs de khi2 positives correspondent à une forte présence tandis que les valeurs de khi2 négatives montrent une absence significative. Un Khi2 nul signifie que la présence de la catégorie ou du terme dans la classe n’est pas significative.

Un terme ou une catégorie grammaticale peuvent être surreprésentés significativement dans plusieurs classes.

• La réforme du système de santé en France et son financement

Les classes 1 et 5 portent respectivement sur les négociations et décisions relatives aux réformes du système de santé et sur les modes de financement du système de santé. Elles représentent la majeure partie du corpus (46% des u.c.e. classées) et apparaissent les premières chronologiquement.

En termes de catégories grammaticales, la classe 1 est caractérisée par une surreprésentation de noms propres et de prénoms de décideurs politiques (Juppé, Aubry, Kouchner, Chirac) ainsi que par des marqueurs de temporalité (mois, jours, saisons) faisant référence au processus temporel de la prise de décision. Cette classe traite des acteurs impliqués dans la réforme du système de santé : syndicat, commission, confédération, parlement. En termes de champ lexical, la classe 1 est marquée par les registres financiers (dépense, honoraire, revalorisation), législatifs (ordonnance, texte, droit, loi, projet) et par celui de la délibération (expérimentation, accord, conflit, décision, négociation, discussion).

Dans la classe 1, les réseaux sont traités sous l’angle de leur inscription à l’agenda politique et de leur traduction dans le corpus législatif.

Ce thème s’articule avec celui de la classe 5 qui traite des modes de financement du système de santé. Il s’agit en effet de déterminer la place des réseaux dans le système de santé et leur potentielle mobilisation dans la régulation des dépenses. Le terme de « réseau » est associé à celui de filière, d’HMO, ou encore de réseau informatique. Les articles concernés traitent notamment des réseaux portés par des compagnies d’assurance privées qui assurent une fonction de construction de filière de soins et d’orientation des malades :

uce n° 874 Khi2 = 30 uci n° 129 : *date_2010

Ces deux (assureurs) en (complementaire) sante (proposent) a (leurs) 6 (millions) d’ (assures) l’ (acces) a un reseau de 1. 500 (opticiens) et 3. 400 chirurgiens (dentistes) (agrees). pour (garantir) des soins au meilleur rapport (qualite) (prix), il faut (voir) (grand). armes de cette conviction, le premier (assureur) sante individuelle (francais), groupama, et le (groupe) de (prevoyance) pro BTP, qui (assurent) a eux deux 6 (millions) de (beneficiaires), ont cree un groupement d’ (interet) (economique). 

La classe 5 est marquée par la présence des acteurs de l’assurance santé (Axa, complémentaire, entreprise, client, bénéficiaire). En termes de catégories grammaticales, on observe une surreprésentation de lieux et de pays (Etats-Unis, français, europe) faisant référence à l’opposition entre le modèle français et le modèle nord-américain où les réseaux d’assureurs privés sont développés. L’enjeu financier est marqué par une série de verbes : rembourser, cotiser, payer, investir. Les registres du marché (coût, concurrent, milliard, croissance, capital, rentable, marge) et de la protection sociale (prévoyance, assurance, obligatoire, risque) y sont développés.

Dans leur traitement médiatique, les réseaux de santé illustrent donc la rencontre entre les enjeux politique et financier de réforme du système de santé.

• La prise en charge des problèmes de santé publique et le développement de la médecine ambulatoire

Le traitement médiatique des réseaux de santé publique les renvoie également à un enjeu de santé publique. Les classes 2 et 3 font référence à la définition et au traitement des problèmes de santé publique ainsi qu’au développement de la médecine ambulatoire.

La classe 2 développe cet enjeu en se centrant sur le registre du soin, à l’échelle du malade et des professionnels de santé. Cette classe met en scène l’action de prise en charge à travers des verbes (accompagner, aider, soutenir, expliquer, intervenir), des acteurs (équipe, infirmière, malade, entourage, docteur) et des marqueurs de temporalité (quotidien, souvent, quand, moment). Les registres de la maladie (douleur, mourir, souffrant) et de la médecine ambulatoire (domicile, retour, séjour) sont développés. 

Le réseau renvoie ici tant aux réseaux informels de professionnels qu’à des structures de coordination formalisées :

uce n° 2866 Khi2 = 33 uci n° 356 : *date_2007

aujourd hui, il (existe) une centaine de (ces) reseaux (en) france. leur (objectif) (est) d (apporter) une (reponse) collective aux questions medicales et ethiques qui se posent dans (ces) (situations) de (fin) de (vie). (de-maniere) (concrete), (cela) (permet) a un generaliste (isole) mais (aussi) une (infirmiere) (ou) un kine de (faire) (appel) a une (equipe) de professionnels qui vont l epauler sur le (terrain) (en) (mettant) en- place, si necessaire, des (soins) (palliatifs) a (domicile),

Le réseau s’intègre dans le développement de la médecine ambulatoire, en lien avec la limitation des durées d’hospitalisation. En coordonnant la prise en charge des malades entre l’hôpital et la ville, le réseau de santé facilite notamment le maintien à domicile et la fin de vie à domicile. Contrairement aux acceptions en termes de filières portées par des assurances privées, les réseaux sont ici présentés dans leur acception en  termes de réseau de prise en charge, tourné vers des actions de coordination des professionnels et d’accompagnement du malade.

La forme réseau est ici fortement associée à un enjeu de soin et intégré dans l’équipe soignante. Son destinataire n’est plus nommé client ou assuré mais patient ou malade.

Ce thème s’articule à celui développé dans la classe 3, où l’enjeu du soin est appréhendé à l’échelle de la santé publique. Les catégories grammaticales soutiennent des raisonnements démonstratifs, avec une présence significative de marqueurs d’intensité et de mots outils démonstratifs. Cette classe met en scène la prise en charge des malades en termes de santé publique et de prévention, à travers des verbes (dépister, diminuer, repérer) et des acteurs non plus appréhendés en termes d’individus mais de population (femme, enfant, homme). Les registres épidémiologiques (mortalité, sanitaire, cas, étude, géographique) et thérapeutiques (chimiothérapie, chirurgie, traitement) sont développés. Les formes pathologie et décès caractérisent la classe 3, en opposition à maladie et mort pour la classe 2.

Le réseau renvoie alors à la densité des ressources médicales données sur un territoire – en termes de démographie médicale -, ou aux réseaux de santé formalisés qui participent à des actions de prévention et de dépistage organisé.

• L’organisation territoriale de soins

Le traitement médiatique des réseaux de santé publique les renvoie enfin à un enjeu d’organisation des soins à l’échelle locale. Cette approche représente le plus faible volume du corpus (21% des u.c.e. classées) et apparait la dernière chronologiquement.

L’intégration des réseaux au niveau de l’organisation territoriale des soins est un gage de légitimité ; la proximité et la connaissance du terrain fournissant désormais à la fois la « raison sociale » et l’« argument rhétorique » des acteurs de l’intervention sanitaire (Arène, 1997).

Les catégories grammaticales caractérisant la classe 4 sont des marqueurs de cette proximité, avec une présence significative de marqueurs de temps (soir, jeudi, demain) et de spatialité (rue, lieu) informant de la planification d’évènements par un réseau. Les verbes mettent également en scène ces évènements (organiser, accueillir, animer, inviter) tandis que les acteurs font davantage référence au monde associatif et local qu’au monde médical (association, communauté, maison, élu). Le champ lexical de la territorialité est particulièrement développé (local, commune, canton).

Les destinataires des réseaux ne sont ni désignés comme des assurés (classe 5) ou des malades (classe 2) mais comme des usagers et des habitants.

La forme réseau est ici fortement associée à un enjeu de promotion de la santé locale, en partenariat avec des structures de proximité : 

Réseau de la forme réseau dans la classe 2[1]

[1] Un « réseaux de forme » permet de mettre en évidence la proximité des formes, en termes de cooccurrences et de distance physique à l’intérieur de la classe (lecture de gauche à droite).

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.

En conclusion, l’analyse du discours médiatique traitant des réseaux de santé met en évidence la rencontre des différentes échelles de l’action publique (entre réforme nationale du système de santé et organisation territoriale des soins) et de la santé, (entre épidémiologie et vécu individuel de la maladie). L’analyse factorielle[1] du corpus fait apparaître deux couples d’opposition structurant : celui de l’échelle et celui des acteurs (décideurs politiques nationaux/décideurs politiques locaux, professeurs/médecins, clients/malades/habitants).

[1] L’analyse factorielle des correspondances est utilisée ici pour décrire la structure d’un tableau de cooccurrences, à l’aide de plusieurs facteurs. Les tableaux soumis à l’A.F.C. dans Alceste croisent le vocabulaire retenu avec des classes d’U.C.E. L’objectif est de donner une représentation spatiale schématique des relations entre les classes discursives.

En termes chronologiques, les réseaux semblent être de moins en moins associés à des enjeux de régulation des dépenses de santé pour s’associer davantage à l’enjeu de l’action sanitaire territorialisée. L’intégration des réseaux comme acteur de la santé locale va de pair avec un accroissement du poids de la presse régionale dans le traitement médiatique, alors que la presse économique produisait la majorité du discours médiatique portant sur les réseaux jusqu’en 2000.

La substitution de la presse régionale à la presse économique dans le traitement médiatique des réseaux de santé (en pourcentage, base de 802 articles)[1]

[1] A la suite de l’analyse via Alceste, le corpus de presse a subi une analyse secondaire quantitative, via un codage en six variables : Année de publication, source, nombre de mots, échelle d’observation, thème générale, pathologies citées. Ce codage « manuel » avait notamment pour but de faciliter l’interprétation des résultats de l’étude Alceste par une lecture des articles. Le décalage entre la base de 802 articles dans le tableau présenté, contre 833 articles dans corpus s’explique par le non-codage de certains articles dans le but d’éviter un codage erroné.

Conclusion

L’étude du discours des relais médiatiques a été l’occasion de s’interroger sur les valeurs portées par les réseaux. L’analyse lexicographique a permis de caractériser « l’idéologie » associé au concept de réseau. Cette dernière met en évidence la dimension fédératrice d’un terme « valise » où chaque acteur peut entrevoir un moyen de répondre à ses enjeux propres. Le réseau est un concept mobilisateur (Robelet et al., 2005) véhiculant des représentations fédératrices telles que celle de la modernité.

L’analyse lexicographique permet également d’identifier la diversité des représentations et ainsi de montrer que les réseaux de santé sont néanmoins associés à des valeurs distinctes si ce n’est contradictoires, par exemple entre économie de la santé et égalité de l’accès aux soins.  

Dans le cas des réseaux de santé, cette étude illustre le mouvement symétrique entre définition d’un problème et de sa solution :  « Bien souvent, sous ce terme problème, on désigne de façon indifférenciée un problème, sa solution et le processus qui va conduire à son traitement ou sa résolution – ce processus n’étant pas toujours, loin s’en faut, postérieur à la détermination du problème. » (Gilbert, Henry, 2009, p.20)

Le discours médiatique sur les réseaux met en évidence le passage d’un enjeu centré sur la régulation des dépenses de santé à celui de l’organisation territoriale des soins. En passant du modèle du réseau d’assurance privé, au réseau de soin et au réseau de santé territorial, la fonction et l’organisation du réseau évolue, mais le terme unificateur « réseau » persiste quant à lui.

Le développement des réseaux de santé est né de la rencontre entre une dynamique d’organisation spontanée de professionnels et d’un soutien financier et administratif des tutelles. A partir des années 1980 et notamment autour de la prise en charge des patients atteints du sida, les professionnels de santé inventent de nouveaux modes de fonctionnement collectif qui donneront lieu aux réseaux de santé. Dans le cadre de l’instrumentation de l’action publique en faveur de la coordination et dans une logique de rationalisation du système de soins, ces dispositifs sont institutionnalisés à partir des années 1990. 

Dans le cas de la cancérologie, les réseaux s’inscrivent désormais dans un itinéraire de la régulation, entre des décisionnaires centralisés autour des Plans Cancer et de l’INCa, et des acteurs de terrain individualisés tels que les médecins généralistes, en passant par des relais régionaux tels que les réseaux régionaux de cancérologie. L’institutionnalisation des réseaux est associée à des effets ambivalents entre d’une part, leur développement quantitatif, et d’autre part, leur dépendance, la mise en concurrence et l’entretien d’un contexte d’incertitude sur la pérennité des dispositifs. Pour les réseaux de santé, l’enjeu de subsistance s’est ainsi progressivement substitué à celui d’innovation. La pérennité des financements dépendant de plus en plus de l’atteinte d’objectifs contractuels, l’institutionnalisation des réseaux témoigne de leur reconnaissance mais génère en même temps une forme de dépossession (Schweyer, 2005)

L’entrée des réseaux de santé dans le champ de l’action publique est donc associée à une série de transformations ainsi qu’à un encadrement externe et en partie centralisé de ces initiatives locales et militantes. L’institutionnalisation va de pair avec la professionnalisation des réseaux, passant notamment d’un fonctionnement autour de « chefs charismatiques » à un organigramme structuré autour de « chefs organisateurs ». 

Pour plus d’information, vous pouvez contacter Lucile Hervouet : 

https://www.linkedin.com/in/lucile-hervouet-060a4068/?originalSubdomain=fr