Le forum du Master ESA économétrie et statistique appliquée - Université d'Orléans

Vous n'êtes pas identifié.

Annonce

Vous êtes sur le forum du master ESA !

Le site du master ESA - description de la formation, notes de cours, contacts... est ici :

http://www.univ-orleans.fr/deg/masters/ESA/

#1 11-12-2015 12:16:45

doctorante2015
membre extérieur
Date d'inscription: 09-12-2015
Messages: 4

Classification hiérarchique

Bonjour,

je travaille sur une enquête:
individus: 1000 ménages numérotes de 1 à 1000
Variables: dépense par an par ménage, taille ménage, sexe chef ménage, région de résidence,... (Variables qualitatives et quantitatives).
Ma tâche consiste à déterminer 5 classes sociales (pauvres, riches, quasi-pauvres,...). je pense directement à la classification hiérarchique en se basant sur la variable dépense par an par ménage (je cherche à décomposer cette variable en cinq groupes homogènes). Le problème est que j'arrive pas à spécifier le nombre des groupes (5) en utilisant le logiciel SPSS. Avez-vous une solution SVP.
Merci par avance

Hors ligne

 

#2 02-01-2016 20:39:29

Clairant
membre extérieur
Date d'inscription: 30-07-2015
Messages: 23

Re: Classification hiérarchique

Bonjour,
je pense que ton problème n'est pas bien structuré. je m'explique, en parlant de classification hiérarchique il y a généralement deux perceptions :
La première, vous disposer de n (pas très grand) individus et de k variables et vous voulez obtenir des groupes d'individus homogènes vis à vis des k variables..(classification des individus)
La deuxième approche est que vous voulez faire une classification sur les variables (lorsque le nombre de variable est important) c'est à dire vous voulez des groupes homogènes de variables. Autrement dit, Obtenir des groupes de variables qui sont corrélées à l'interne et non liées à l'extérieur des groupes.

Pour plus de précision, je peux revenir sur certains détails.

Par rapport à votre préoccupation, je pense que vous voulez regrouper votre variable "dépense par ménage" en cinq modalités? Si tel est le cas, vous pouvez le faire avec "l'algorithme de Jenks" implémenté sous R..elle se base sur le principe de ressemblance /
dissemblance en calculant la distance paramétrique entre toutes les valeurs de la série. La méthode minimise la variance intraclasse et maximise la variance interclasse. Il s'agit d'un algorithme itératif formant, dans un premier temps, autant de couples qu'il y a de combinaisons de valeurs (triées par ordre croissant) pour un nombre de classes donné. On calcule alors la variance intraclasse et interclasse.
Cet algorithme est implémenté sous le logiciel R 
ça se fait via le package "cartography". toutefois ce package ne s'utilise pas seul..si vous êtes intéressé on verra le reste.

Bon courage.

Hors ligne

 

Pied de page des forums

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson