CoursSTATA

Cours 3 : STATA

CHAPITRE IV : ANALYSE GRAPHIQUE DES DONNEES

Dans le cadre d’une analyse de données, les graphiques jouent un grand rôle. Depuis la version 10, Stata propose un interface graphique permettant de réaliser des graphiques scientifiques de bonne qualité. Cependant, il y’a de grands avantages à se passer à ces outils et onglets et à utiliser les commandes. Parmi les avantages, l’un des plus importants est la répétitive de la commande sur d’autre variable et la logique du graphique.

Dans ce chapitre, on apprendra à faire des graphiques de bonne qualité sur Stata.

  1. La logique

Dans Stata, il y’a une logique de représentation graphique. On distingue 2 classes de graphiques: Ceux qui représentent une variable et commencent par « graph » et ceux qui mettent en relation 2 variables ou plus et commencent par « twoway ».

A la suite de ses commandes, on ajoute le types de graphique suivi des options après une virgule.

Syntaxe générale de tous les graphiques :

  • graph type_de_graph Y, options : Graphe pour la variable Y
  • twoway type_de_graph Y X, options : Graphe de Y en fonction de X
  • Les options permettent de décrire l’organisation du graphique. On peut utiliser ici sont : title(), ytitle(), legend().
  • On peut également superposer des graphiques construits séparément chacun avec ses propres options.

La syntaxe : twoway (type_graph1 Y1 X, option1) (type_graph2 Y2 X, option2), option générales

Labéliser les axes et définir les échelles

Pour modifier le nombre de marqueurs, sous marqueurs et labels, on a les options suivants :

  • xlabel(), ylabel() : Positionne un marqueur avec son label.
  • xtick(), ytick() : Positionne uniquement un marqueur
  • xmlabel(), ymlabel() : Positionne un sous marqueur avec son label
  • Xmtick(), ymtick() : Positionne uniquement un sous-marqueur.

Entre parenthèse on spécifie le nombre ou la position des labels et des marqueurs.

Entre parenthèse on spécifie le nombre ou la position des labels et des marqueurs :

(#8) environs 8 valeurs

(##10) 10 – 1 = 9 sous marqueurs entre deux marqueurs principaux

(10(2)20) Un marqueur toutes les 2 unités de 10 à  20.

(minmax) labélise uniquement la valeur min et max de la série.

Les options by() et over()

Les options by() et over() permettent de répéter un graphique selon le nombre de modalités d’une variable catégorielle donnée. La différence réside dans le rendu :

  • Avec by(), les deux graphique s’affiche séparément avec chacun des axes alors qu’avec over() les deux représentations sont sur le même graphique. Ce qui facilite la comparaison.

  1. Les types de graphiques

Les graphiques unidimensionnelle

Comme mentionné précédemment, pour faire un graphique pour une variable, la syntaxe générale est : graph type_de_graph Y, options où Y est la variable.

Pour une un graphique unidimensionnelle, les types de graphiques possible dépend de la nature de la variable.

Les graphiques bi-dimensionnels

Comme mentionné précédemment, pour faire un graphique bi-dimensionnels c’est-à-dire mettant en relation 2 variables, la syntaxe générale est :

twoway type_de_graph Y, options où Y est la variable.

Pour une un graphique unidimensionnelle, les types de graphiques possible dépend de la nature de la variable.

 

2 réflexions sur “Cours 3 : STATA

  • Abdelwahid Ali Nour Guedemi

    Bonjour
    J’aimerai connaître le code stata qui permet d’évaluer le pouvoir prédictif, à partir d’un échantillon test, d’un modèle entraîné sur un échantillon d’apprentissage.

    Répondre
  • BEAVOGUI

    Content de voir cette information

    Répondre

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *