ANALYSE – FRANÇAIS

C’est parti pour l’analyse des résultats en français !

Nous allons à partir du corpus obtenu étudier la vie du mot « chinoiserie(s) » sur les pages web françaises.

Les pages utilisées sont assez variées, on retrouve des articles de presse, des forums, des définitions, etc.
Note : pour l’une des pages, le nombre d’apparitions du motif est beaucoup plus important, mais j’ai testé les analyses sur un nouveau corpus en la retirant et les résultats n’étaient que très peu différents, j’ai donc préféré la garder.

  1. NUAGES DE MOTS

Dans un premier temps, j’ai créé un petit script bash (vous pouvez retrouver tous les scripts sur le site web du projet) dans un nouveau dossier « CONCAT » pour concaténer tous mes fichiers « contextes » et obtenir un seul fichier « GROS_FICHIER_NUAGES.txt ».
Cependant, en utilisant ce fichier pour créer des nuages de mots, j’ai réalisé que beaucoup de mots « inutiles » (« des », « les »…) apparaissaient. Le résultat était biaisé.

J’ai donc créé un script python (j’avoue que je maîtrise beaucoup plus ce langage !) pour supprimer ces mots. J’ai importé la bibliothèque « NLTK » de python qui inclut une liste de « stopwords » pour chaque langue. J’ai pu facilement supprimer ces mots vides et générer un nouveau fichier nettoyé (gros_fich_nuages_nett.txt)

À partir de ce nouveau fichier, j’ai pu créer des nuages de mots beaucoup plus intéressants !

Ce nuage a été créé avec Wordle.

Analyse :

Les mots « chinoiseries » et « chinoiserie » sont les plus gros, ce qui est très logique (l’inverse aurait même été inquiétant !)

Mon hypothèse de base était que le mot « chinoiserie(s) » avait une connotation négative en France. En effet, ce mot semblait utilisé négativement dans deux cas :
– pour désigner des complications ou extravagances inutiles/excessives
– pour désigner des objets de mauvaise qualité, des « bibelots » sans valeur

On peut penser que ces deux connotations se retrouvent bien dans certains mots mis en évidence par le nuage :

– pour le premier sens négatif, on repère notamment le mot « difficulté« . On peut aussi relever le mot « visa » ; en parcourant les sites j’ai en effet réalisé que plusieurs personnes parlaient des difficultés liées à l’obtention d’un visa en utilisant le mot « chinoiseries » (on entend parfois parler de « chinoiseries administratives »)

– pour le deuxième sens négatif, les mots « objet » et « objets » sont présents, mais on repère surtout le mot « qualité« . En effet, beaucoup d’internautes parlent (notamment sur les forums) de la mauvaise qualité d’objets chinois (surtout électroniques), ou s’interrogent sur leur qualité.

/!\ Mais si on regarde uniquement le nuage, rien ne prouve que ces 3 mots sont toujours utilisés avec des adjectifs négatifs (comme « mauvaise » pour « qualité »)… Une partie de mon analyse est évidemment subjective, puisqu’en recherchant les URLs j’ai parcouru les sites et j’ai vu la manière dont ces mots étaient utilisés ; mais une analyse objective du nuage, sans consultation des sites web, ne permet pas vraiment de mettre en avant ces connotations négatives !

De plus, il faut bien constater que ces mots sont minoritaires !

Effectivement, la plupart des mots du nuage semblent prouver que le mot chinoiserie a une connotation neutre voire positive.

Beaucoup de mots font référence à l’art, à un savoir-faire typiquement attribué à la Chine, et au courant orientaliste : « arts », « porcelaine », « décoratifs », « décors », « goût », « motifs », « arabesques », « manufacture », « doré », « bronze », « reproduction »

On retrouve également « lumières » et « xviiième », ce qui semble lié au courant orientaliste .
cf Wikipédia : L’orientalisme est un mouvement littéraire et artistique né en Europe occidentale au xviiie siècle (…)
L’attrait pour les chinoiseries se manifesta en Europe dès l’antiquité, avant de s’épanouir du xive au xviiie siècle, où il fut assimilé d’une part à la vogue rococo et d’autre part à l’excentricité anglomane. On peut prêter à cet engouement des résonances « philosophiques », tel qu’il est inscrit dans des thèmes littéraires développés aux Lumières.

-> Mon hypothèse n’est donc pas validée par les nuages de mots obtenus, le mot « chinoiserie(s) » semble avoir plutôt une connotation neutre ou positive.

alternative un peu plus cool

2. ITRAMEUR

Pour utiliser itrameur, j’ai d’abord concaténé mes fichiers « contextes » avec un nouveau script qui permet également de les segmenter avec des balises. J’ai obtenu un fichier « GROS_FICHIER_ITRAM.txt ».

J’ai créé un nouveau petit script python pour le nettoyer, un peu différent de celui utilisé pour les nuages puisque ce dernier aurait supprimé les balises (il ne gardait que les « mots » composés de caractères alphabétiques)
J’ai ainsi obtenu un fichier « gros_fich_itram_nett.txt », que j’ai importé dans itrameur.

Malgré le nettoyage, beaucoup d’unités inutiles restent présentes.

Dans un premier temps, on voit que les mots qui reviennent le plus souvent sont pour la plupart les mêmes que ceux qui apparaissent dans le nuage de mots (logique) :

Les plus fréquents, « chinoiserie » et « chinoiseries », évidemment

etc.

On s’intéresse maintenant aux cooccurrences.
On rentre le mot « chinoiseries » dans « pôle source ».


Résultat :


On retrouve des termes liés à l’art et au courant orientaliste (« lumières », « xviiième », « inspiration »)
Cependant, une connotation négative qui était peu visible avec le nuage est mise en évidence ici avec le mot « administratives« . En effet, le mot seul n’apparaissait pas sur le nuage mais la recherche de cooccurrences prouve que le syntagme « chinoiseries administratives » est susceptible d’apparaître assez souvent, faisant probablement référence aux complications inutiles et excessives.

J’ai ensuite essayé de lancer la même recherche mais avec le mot « chinoiserie » au singulier.

Le mot « qualité » apparaît ici avec une fréquence élevée, il peut renvoyer à une connotation négative (les objets sans valeur, de mauvaise qualité, fabriqués en Chine). Mais une fois de plus, cette conclusion est basée sur ma connaissance des sites web utilisés, la fréquence en elle-même ne prouve pas que le mot est toujours utilisé de manière négative.

On voit apparaître les mots « motif » et « fleur« , qui peuvent faire référence à l’art chinois.

CONCLUSION

Ces analyses ne permettent donc pas vraiment de confirmer mon hypothèse de base concernant la connotation négative du mot « chinoiserie(s) ».
En effet, même si certains éléments peuvent renvoyer aux deux sens négatifs du mot (complications inutiles/excessives et objets/bibelots de mauvaise qualité, sans valeur), l’analyse met plutôt en évidence une connotation neutre ou positive.
Le mot semble souvent utilisé pour parler de l’art chinois, des objets de goût chinois, du courant orientaliste.

Publié par annawenfeijuliette

Trois étudiantes qui ont hâte de savoir la vérité et de maîtriser des outils informatique... :)

Laisser un commentaire

Concevoir un site comme celui-ci avec WordPress.com
Commencer