R++ est un logiciel d’analyse statistique haute performance. Simple, rapide, efficace. Pour mettre les statistiques à la portée de tous.

Forum

R++ / Forum

Importation des données  

  RSS
charbel.youzan
(@charbel-youzan)
New Member Customer

Bonjour, j'ai choisi de structurer mes retours par module, dans celui-ci il s'agira essentiellement de parler du module "importer.

J'ai essayé d'importer différents types de données, structurées de diverses manières. R++ s'en sort très bien, (+) l'importation se fait assez facilement et le volet prévisualisation est très bien pensé. Sauf que (-) j'aurais aimé pouvoir modifier les noms et types des variables à l'importation, par exemple si dans ma base de données initiale une variable est nommée "sexe" et avec des modalité 1 et 2, à l'importation je veux pouvoir modifier le nom de la variable passer de "sexe" à " Genre" par exemple puis spécifier que 1 et 2 sont en fait des facteurs. Aussi il n'est possible d'importer de gros volumes de données, la limite c'est 35 Mo je crois.   

Et pendant tout mon expérience j'ai pas eu à utiliser le type = inconnu , pouvez vous m'expliquer à quoi il sert ? 

Merci pour ce gros travail. 

RépondreQuote
Posté : 24/08/2018 11:14
Moussa-Koumo Mahamat
(@mahamat-moussa-koumo)
New Member Customer

j'ai reussi à importer  avec succès, une base (600 observations de 113 variables) . le ficher est sous format csv.  la plupart des types des variables sont bien  devinés par r++. Mais quand j'essaie d'importer un fichier csv comportant 1.8 millions d'observations(de 26 var), ça met longtemps et  meme apres l'ouverture de la base, les graphes tracés par defaut ne sont pas au complet(seulement pour quelques variables sont construits). 

Lorsqu'on double-clique sur un graphr pour apporter quelques modifications, la fenetre contenant le graphe est tres petite et je n'arrive pas à l'agrandir pour pouvoir voir toutes les modalités sur l'axe des abscisses. 

  Sinon je m'adapte assez vite à son utilisation, super!

RépondreQuote
Posté : 03/09/2018 11:23
andeol.evain
(@andeol-evain)
Eminent Member Team R++

Bonjour,

Merci pour vos retours, je vais essayer d'y répondre dans l'ordre.

Nous sommes en train de revoir l'interface d'import des données, notamment pour donner plus de possibilités de spécifications. Notez cependant que modifier le type ou les modalités d'une colonne peut déjà être fait dans la vue d'édition de données.

Il ne devrait pas y avoir de limite à 35Mo de données. Je viens par exemple d'importer une base de 60Mo. Cela prends un peu plus de temps, naturellement, mais l'import se fait bien. Si vous avez des données que vous ne parvenez pas à importer, pouvez-vous nous en dire plus sur elles ? Taille, format, etc ? Dans le cas où vos données ne seraient pas confidentielles, l'idéal, pour nous serait de pouvoir les récupérer. Cela nous permettrait de faire nos tests et de déboguer directement sur ce qui pose problème.

pendant tout mon expérience j'ai pas eu à utiliser le type = inconnu

Je suis très curieux de savoir où vous avez vu mentionner ce type ? Nous utilisons un type "inconnu" en interne, pour des questions de synchronisation, quand le type d'une colonne n'est pas encore déterminé. Mais cela ne devrait jamais être visible pour l'utilisateur. Où l'avez-vous vu ? Pouvez-vous faire une capture d'écran ?

L'import d'un fichier de 1.8 millions de lignes et 26 colonnes est effectivement une opération lourde. Nous faisons notre possible pour l'optimiser, mais le plus long, dans cette opération, c'est l'import par R lui-même (un appel à read.table) que nous pouvez difficilement éviter (du moins tant que nous dépendons de R).

L'absence de certains graphes est un bug, qui apparait plus souvent avec de grosses bases de données. La bonne nouvelle, c'est que je crois avoir compris d'où il provenait, et que nous allons pouvoir le corriger. La mauvaise, c'est que cela prendra un peu de temps. Cela devrait être prêt pour la sortie officielle de R++, mais sans doute pas pendant la beta.

Lorsqu'on double-clique sur un graphe pour apporter quelques modifications, la fenêtre contenant le graphe est très petite et je n'arrive pas à l'agrandir pour pouvoir voir toutes les modalités sur l'axe des abscisses.

Voilà qui est étrange. Dans l'éditeur de graphe, les graphes sont censés faire 420 pixels par 420 (par défaut). A moins que vous n'ayez une très haute résolution, cela devrait être assez gros (voir capture d'écran jointe). Pour agrandir l'image, vous avez deux options:

1) Dans l'arbre des options, à gauche de la vue d'export, sélectionnez Feuille/Dimension. Puis à droite, éditez la largeur (ou la hauteur) pour agrandir le graphe (option visible sur la capture d'écran jointe également). Si le graphe porte sur un grand nombre de lignes, cette opération peu ne pas être instantanée. C'est cependant le meilleur choix si l'axe des abscisses n'est pas assez large pour afficher les modalités.

2) En maintenant la touche ctrl appuyée, vous pouvez zoomer/dézoomer sur la vue à l'aide de la molette de la souris. Cette fois, il s'agit d'un simple zoom sur l'image, qui doit donc être instantané même si le graphe porte sur un gros volume de données. Si votre graphe apparait très petit, cela pourrait être expliqué si nous avons un bug dans l'initialisation de ce niveau de zoom. Je vais vérifier ça.

Merci pour vos retours !

Andéol

This post was modified Il y a 4 mois  3 times by andeol.evain
RépondreQuote
Posté : 04/09/2018 9:52 Moussa-Koumo Mahamat aime
NJATOSOA-AMMY Fiadanana
(@fiadanana-njatosoa-ammy)
New Member Customer

Bonjour,

J'ai importé une donnée au format native de R (*.rda). et je n'ai pas réussi, ce n'est pas disponible dans les types de fichiers supportés et quand  je choisis d'ouvrir le fichier (en cochant "tous les fichiers" pour que cela apparaisse dans la fenêtre de sélection de dossier, il n'arrive pas à identifier correctement les données. Pourtant tous mes fichiers sont au format native de R. Est-ce que ce n'est pas encore implémenté ?

Merci pour vos efforts ! et bon courage, vous êtes une équipe gagnante !

Ammy Fiadanana

This post was modified Il y a 3 mois  by NJATOSOA-AMMY Fiadanana
RépondreQuote
Posté : 24/10/2018 7:40
andeol.evain
(@andeol-evain)
Eminent Member Team R++

Bonjour,

Pour le moment, nous ne considérons pas le format rda comme un format de stockage de dataframe (il en peut en stocker, bien entendu, mais il peut aussi stocker n'importe quoi d'autre). Il n'est donc pas géré dans l'import au même titre qu'un csv, par exemple. Peut-être le sera-t-il à l'avenir.

Il est en revanche bien possible de "charger" un rda dans la mémoire de R++. Cela se fait via Fichier/Charger l'environnement de travail. Malheureusement, comme vous allez vite le constater, un fichier ainsi chargé est accessible via la console de R++, mais pas via son écran "Gestion des données".

Ainsi, si votre fichier myFile.rda contient une dataframe df1 et que vous le charger, vous pourrez ensuite dans l'écran "Analyse" de R++ travailler sur son contenu, à l'aide de scripts et de commandes R (comme ce qui se fait déjà avec d'autres logiciels liés à R, après un appel à "load"), mais pas manipuler les données à l'aide de l'interface graphique de gestion de données. C'est un point sur lequel nous travaillons.

En attendant, il vous reste la possibilité d'extraire un csv à partir de vos données R (à l'aide de la fonction R write.csv), puis d'importer ce fichier dans R.

En espérant que cette réponse vous aura été utile,

Merci pour vos retours !

Andéol Evain

 

RépondreQuote
Posté : 25/10/2018 9:44
NJATOSOA-AMMY Fiadanana
(@fiadanana-njatosoa-ammy)
New Member Customer

OK, c'est bien clair !

Merci pour l'explication .

Fiadanana

RépondreQuote
Posté : 25/10/2018 9:59
Christophe Genolini
(@christophe-genolini)
Reputable Member Admin

On a bien conscience que ca n'est pas très pratique. On est en train de réfléchir a un moyen de simplifier cela. On pense, dans l'étape "Gestion des données" à coté du nom de la base de données ouverte, ajouter un petit "+", un peu comme celui de google chrome pour ouvrir un nouvel onglet. Ce + permettra d'ouvrir un menu déroulant qui donnera la liste des data.frame présents en mémoire. Vous pourrez alors choisir celui que vous voulez afficher.

RépondreQuote
Posté : 25/10/2018 10:37
NJATOSOA-AMMY Fiadanana
(@fiadanana-njatosoa-ammy)
New Member Customer

Je comprends très bien que r++ est encore dans un stade d'effervescence d'innovation et de recherche de simplification d'utilisation le plus poussée. Je vous remercie, et vous félicite pour tout cela. Je trouve seulement que parmi les extensions proposées, stata, sas, etc. l'extension de R devrait avoir sa place d'honneur.

 

RépondreQuote
Posté : 25/10/2018 12:52
Share:
  
En travaux

Veuillez Connexion ou Inscription