-
Notifications
You must be signed in to change notification settings - Fork 0
/
QO_Pee_K1_Spad.qmd
126 lines (84 loc) · 4.29 KB
/
QO_Pee_K1_Spad.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
---
title: "Premiers pas pour analyser une question ouverte avec Spad"
format:
revealjs:
theme: style.scss
scrollable: true
smaller: true
editor:
markdown:
wrap: 72
---
## Contenu de cette présentation
Captures d'écran présentant un exemple d'analyse de question ouverte
avec Spad. Les premières étapes sont détaillées afin de comprendre le
fonctionnement du logiciel. La dernière diapositive synthétise
l'ensemble des méthodes présentées en démo
------------------------------------------------------------------------
## Données
Le *corpus* utilisé dans cet exemple contient un extrait des réponses à
une question ouverte issue de l'enquête Populations, Espaces de Vie,
Environnements (Ined, 1992). L'intitulé de la question est celui-ci :*Si
je vous dis Environnement, qu'est ce que cela évoque pour vous ?*
Pour chaque enquêté, on dispose de caractéristiques socio-démographiques
(<https://data.ined.fr/index.php/catalog/41>).
------------------------------------------------------------------------
## Spad
Le logiciel est commercialisé par la société
[Cohéris](https://ia-data-analytics.fr/logiciel-data-mining/analyse-de-donnees/)
![](images/im_coheris.png){fig-align="center"}
------------------------------------------------------------------------
## Interface
Spad propose un grand nombre de méthodes d'analyses, notamment pour
l'Analyse Géométrique des Données dont l'analyse textuelle (Text Mining)
dans la zone *Méthodes* de l'interface
On paramètre les analyses par selection de *Méthodes* et choix d'options
via des *fenêtres.* On fait un "double clic" sur les méthodes à utiliser
ce qui génère une icône correspondante dans la zone *Diagramme*
------------------------------------------------------------------------
## Import des données
Dans la rubrique *Import / Export de données*, on sélectionne *Import
d'un fichier texte délimité* et on indique le chemin et nom de fichier
![](images/im_spad_import.png){fig-align="center"}
------------------------------------------------------------------------
## Paramétrage du type des variables
La fenêtre d'importation propose un autre *onglet* *Métadonnées* qui
permet de spécifier le type de chaque variable. Par défaut, elles sont
repérées comme des variables *Nominales* et il faut changer le type de
la variable correspondant à la question ouverte (ici K1) en *Textuelle*
![](images/im_spad_import_type.png){fig-align="center"}
Après exécution de la méthode, les données sont chargées et on peut
utiliser les méthodes de la rubrique *Text Mining*
------------------------------------------------------------------------
## Création du lexique associé au corpus
On commence par sélectionner la méthode *Construction de vocabulaire*.
On dessine un *lien* entre les méthodes à l'aide de la souris. Puis dans
la fenêtre de paramétrage, on peut sélectionner la variable textuelle à
analyser (ici K1)
![](images/im_spad_vocab.png){fig-align="center"}
Après exécution des méthodes, les résulats s'affichent dans la zone
*Exécutions.* Ici, c'est un fichier Excel caractérisant le **lexique** :
nombre de mots, occurences ... dans des onglets différents
## Lemmatisation
Spad propose différents type de lemmatisation comme par exemple :
- Suppression des mot-outils simplement
- Racinisation
- Utilisation d'un lemmatiseur personnalisé
![](images/im_spad_lemmatisation.png){fig-align="center"}
![](images/im_spad_lemmatisation2.png)
Il convient ensuite de "brancher" la méthode voulue pour utiliser le
lexique résultant
## Concordances
La méthode *Edition de contextes des mots* permet de visualiser les
concordances de mots au choix tout au long de l'analyse. Indispensable
au moment de l'intéerprétation des résultats ou faire des choix lors de
la lemmatisation
## Enchainement de méthodes de statistique textuelle
![](images/im_spad_synthese.png){fig-align="center"}
Pour en savoir plus sur l'utilisation de spad voir Garnier B.,
Guérin-Pace F. 2010 - Appliquer les méthodes de la statistique
textuelle, [Ceped, les clefs
pour](http://www.ceped.org/fr/publications-ressources/editions-du-ceped-1988-2012/les-clefs-pour/article/appliquer-les-methodes-de-la),
Paris
[![](images/im_back.png){fig-align="left" width="20"
height="21"}](https://benegarbi.github.io/AGD_QO/)