Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Gestion et manipulation des données avec R #625

Open
marie-flesch opened this issue Sep 17, 2024 · 49 comments
Open

Gestion et manipulation des données avec R #625

marie-flesch opened this issue Sep 17, 2024 · 49 comments

Comments

@marie-flesch
Copy link
Contributor

marie-flesch commented Sep 17, 2024

Programming Historian en français a reçu une proposition de traduction de la leçon "Data wrangling and management in R" de la part de Damien Belvèze (@damienbelveze). Son titre français est "Gestion et manipulation des données avec R" (celui-ci pourra changer).

La traduction a déjà été réalisée ; son suivi sera assuré par @AlexandreWa.

Politique contre le harcèlement

Vous trouverez ci-dessous les principes du Programming Historian en français qui doivent inspirer les échanges entre évaluateurs et évaluatrices, auteur(e)s, rédacteurs et rédactrices, ainsi que toute personne contribuant à nos forums publics.

Programming Historian en français tient à garantir un environnement académique ouvert à la communauté, qui offre la pleine liberté d’explorer minutieusement des idées, poser des questions, faire des suggestions ou demander des clarifications. Il fournit aussi un espace libre de toute discrimination envers les personnes contribuant au projet, indépendamment du genre, de l’orientation sexuelle, des situations d’handicap, de l’apparence physique, de la masse corporelle, de l’origine, de l’âge, de la religion ou de l’expérience technique. Nous ne tolérons aucune forme de harcèlement ou d’attaque personnelle contre les membres de la communauté. Les personnes qui violent ces règles sont susceptibles d’être expulsées de la communauté à la discrétion du conseil éditorial. Toute personne en mesure de témoigner de tels comportements ou qui en est la victime peut contacter notre médiatrice Hélène Huet. Merci de nous aider à créer un espace d’échange et de discussion sûr.

@damienbelveze
Copy link
Contributor

Bonjour, comme l'a relevé Marie Flesch (merci à elle), une variable dans les deux derniers graphiques n'avait pas été traduite (is_secular). Je l'ai traduite en français ("est laïque"). En revanche, comme cela requerrait l'usage de backticks, j'ai pensé qu'il fallait ajouter au texte une note explicative qui n'apparaît pas dans le texte original :

"Noter ici que la variable est laïque est mise entre apostrophes arrières (backtick). Cela permet à la fois de gérer le fait qu'elle occupe au lieu d'un seul deux termes séparés par une espace, ainsi que le i trema présent dans le mot "laïque", caractère qui ne fait pas partie des 128 présents dans la table ASCII et peut donc poser problème dans l'exécution de certains programmes."

La version modifiée est ici : https://damienbelveze.github.io/Gestion-et-manipulation-des-donnees-avec-R/course.html
Les sources sont là : https://github.com/damienbelveze/Gestion-et-manipulation-des-donnees-avec-R

@marie-flesch
Copy link
Contributor Author

Bonjour @damienbelveze , bonne idée l'ajout de cette note, qui peut être utile dans d'autres situations ! Et merci d'avoir mis à jour les légendes ! Si je peux ajouter deux choses pour ces figures (qui m'avait échappées à la première lecture) :

  1. Serait-il possible de modifier "collège" en "université" ? (puisque "college" = université, aux États-Unis, ce qui pourra être précisé dans la leçon pour expliquer le nom anglais de la variable). Tout au moins dans les figures, vous pourrez le faire après pour le texte, car @AlexandreWa va faire une première relecture avant le début de l'évaluation de la traduction, et vous fera ses remarques et éventuelles demandes de modification, et vous pourrez mettre le texte à jour à ce moment-là. Désolée de ne pas l'avoir signalé avant, je viens de le remarquer !
  2. Toujours dans les figures traduites en français, serait-il possible de remplacer "count" par "effectifs" sur l'axe y (ou une autre traduction que vous trouvez appropriée ?) Si c'est possible bien entendu !

@damienbelveze
Copy link
Contributor

Bonjour @marie-flesch Merci pour ces remarques.

  1. J'ai d'emblée remplacé college(s) par université(s), je n'étais pas sûr au départ qu'on était sur le même concept d'établissement. C'est réversible, si @AlexandreWa demande à revenir à l'état initial ou propose une autre traduction.
  2. Dans le code ggplot de R, par défaut et sans instruction complémentaire, c'est le mot Count qui s'affiche dans l'axe des y. J'ai rajouté une ligne (ylab) pour avoir "nombre d'établissements" en ordonnée. Là encore, si @AlexandreWa a une meilleure proposition pour nommer cet axe, qu'il n'hésite pas. Très bonne journée. DB

@marie-flesch
Copy link
Contributor Author

Merci beaucoup @damienbelveze !

@AlexandreWa
Copy link
Contributor

Bonjour @damienbelveze et merci pour votre proposition de traduction !

  1. Effectivement, il vaut mieux contextualiser la traduction et expliquer que college = université dans cette leçon traduite. D'accord pour vos modifications dans l'ensemble de la leçon.
  2. Très bien pour *nombre d'établissements", le terme est suffisamment compréhensible pour apparaître en ordonnées, c'est même plus précis que le count initial !

Je ferai une première relecture dans les prochains jours. A très vite, Alexandre W.

@charlottejmc
Copy link
Collaborator

charlottejmc commented Oct 2, 2024

Bonjour @AlexandreWa et @damienbelveze,

Vous trouverez les fichiers ici :

Vous pouvez parcourir l’aperçu de la soumission ici :


Bonjour @damienbelveze, il reste quelques petites choses à ajuster pour compléter la mise en place de la leçon :

  • There is an issue with the code block formatting when they start with ```{r echo=....[etc]: Is there perhaps a different way to format the {r echo=TRUE, include=TRUE} section, so that it does not appear on the first line after the three backticks? If this snippet is only used for Markdown formatting, we probably wouldn't even need it here. UPDATE: I've removed these stray snippets of R Markdown.

  • Could you please translate the abstract in the YAML header of the markdown file ("This tutorial explores how scholars can organize 'tidy' data, understand R packages to manipulate data, and conduct basic data analysis.")

  • I have inserted the 'liquid syntax' which we use to embed images in the text. You'll find them in the markdown file in this format:

{% include figure.html filename="en-or-data-wrangling-and-management-in-R-01.png" alt="Visual description of figure image" caption="Figure 1. Graph of California and New York population" %}

Could you please translate the figure captions (for all 4 images), as well as insert an 'alt' text in French for each image? This descriptive element enables screen readers to read the information conveyed in the images for people with visual impairments, different learning abilities, or who cannot otherwise view them, for example due to a slow internet connection. It's important to say that 'alt-text' should go further than repeating the figure captions.

We have found Amy Cesal's guide to Writing Alt Text for Data Visualization useful. This guide advises that alt-text for graphs and data visualisations should consist of the following:

alt="[Chart type] of [data type] where [reason for including chart]"

What Amy Cesal's guide achieves is prompting an author to reflect on their reasons for including the graph or visualisation. What idea does this support? What can a reader learn or understand from this visual?

The Graphs section of Diagram Center's guidance is also useful. Some key points (relevant to all graph types) we can take away from it are:

  • Briefly describe the graph and give a summary if one is immediately apparent
  • Provide any titles and axis labels
  • It is not necessary to describe the visual attributes of the graph (colour, shading, line-style etc.) unless there is an explicit need
  • Often, data shown in a graph can be converted into accessible tables

For general images, Harvard's guidance notes some useful ideas. A key point is to keep descriptions simple, and adapt them to the context and purpose for which the image is being included.

Would you feel comfortable making a first draft of the alt-text for each of the figures? This is certainly a bit time-consuming, but we believe it is very worthwhile in terms of making your translation accessible to the broadest possible audience. We would be very grateful for your support with this.

Merci ! Je reste à disposition si vous avez encore des questions ✨

@damienbelveze
Copy link
Contributor

damienbelveze commented Oct 5, 2024 via email

@charlottejmc
Copy link
Collaborator

Bonjour @damienbelveze,

Veuillez accepter nos excuses, car nous avions oublié de vous accorder le "Write access" qui vous permet d'éditer vos fichiers directement (ce que nous encourageons en effet les auteurs/traducteurs à faire).

Ma collègue Anisa vous a envoyé une invitation qui vous permettra dorénavant d'éditer directement vos fichiers dans la branche gh-pages.

Merci beaucoup pour les ajustements que vous avez faits aux alt text et captions des images dans votre PR. Cependant, je n'ai pas vu la traduction de l'abstract dans le YAML !

J'ai finalement recopié vos ajustements manuellement dans le fichier markdown original, car il y avait une erreur de syntaxe dans la PR qui générait des problèmes.

Vous pouvez maintenant aussi y naviguer directement, pour traduire l'abstract manquant !

Merci encore ✨

@damienbelveze
Copy link
Contributor

damienbelveze commented Oct 9, 2024 via email

@charlottejmc
Copy link
Collaborator

charlottejmc commented Oct 9, 2024

Bonjour @damienbelveze,

Pour clarifier : si vous acceptez l'invitation de collaboration envoyée par ma collègue Anisa (normalement reçue par email?), plus besoin d'effectuer de Pull Request sur le repo ph-submissions!

Vous pouvez éditer directement le fichier, en navigant vers https://github.com/programminghistorian/ph-submissions/blob/gh-pages/fr/en-cours/traductions/gestion-manipulation-donnees-r.md

Je vais fermer votre Pull Request pour vous laisser tenter la voie directe 😊

@damienbelveze
Copy link
Contributor

damienbelveze commented Oct 9, 2024 via email

@charlottejmc
Copy link
Collaborator

@damienbelveze, super ! Merci beaucoup pour votre patience.

@damienbelveze
Copy link
Contributor

damienbelveze commented Oct 9, 2024 via email

@anisa-hawes anisa-hawes moved this from 1 Submission to 2 Initial Edit in Active Lessons Oct 9, 2024
@anisa-hawes
Copy link
Contributor

Bonjour Damien @damienbelveze,

What's happening now?

Your translation has been moved to the next phase of our workflow which is Phase 2: Initial Edit.

In this phase, your editor Alexandre @AlexandreWa will read your translation, and provide some initial feedback. Editor will post feedback and suggestions as a comment in this issue, so that you can revise your draft in the following phase (Phase 3: Revision 1).

%%{init: { 'logLevel': 'debug', 'theme': 'dark', 'themeVariables': {
              'cScale0': '#444444', 'cScaleLabel0': '#ffffff',
              'cScale1': '#3d7c81', 'cScaleLabel1': '#ffffff',
              'cScale2': '#444444', 'cScaleLabel2': '#ffffff'
       } } }%%
timeline
Section Phase 1 <br> Submission
Who worked on this? : Publishing Assistant (@charlottejmc) 
All  Phase 1 tasks completed? : Yes
Section Phase 2 <br> Initial Edit
Who's working on this? : Editor (@AlexandreWa)  
Expected completion date? : Nov 9
Section Phase 3 <br> Revision 1
Who's responsible? : Author (@damienbelveze) 
Expected timeframe? : ~30 days after feedback is received
Loading

Note: The Mermaid diagram above may not render on GitHub mobile. Please check in via desktop when you have a moment.

@AlexandreWa
Copy link
Contributor

AlexandreWa commented Oct 14, 2024

Bonjour à toutes et à tous,

Merci @charlottejmc d'avoir intégré la leçon dans l'instance GitHub, avec tous les réglages que cela implique !

@damienbelveze, comme l'a précisé @anisa-hawes ci-dessus, je vous propose une première relecture de l'article.

D'abord, j'ai fait l'effort de me plonger dans votre traduction sans la comparer à la leçon originale. J'ai trouvé le contenu très agréable à lire et très clair. D'ailleurs, j'en ai profité pour tester les packages sur R : tout fonctionne !

Vous trouverez ci-dessous l'ensemble de mes observations, dont beaucoup ne concernent que la forme :

§3 "Objectifs de la leçon"

  • "A la fin" → "À la fin"
  • "1. comprendre comment organiser vos données [...]" → faire un choix de concordance avec les listes, en mettant ou non une majuscule (en comparaison aux listes présentes dans la partie Introduction)

§4-14 "Introduction"

  • "Notamment, nous nous fonderons sur" → "Nous nous fonderons notamment sur [...]"
  • "entêtes" → "en-têtes"
  • "nous n'auront" → "nous n'aurons"
  • "intuitive" → "intuitif"
  • "fichiers csv" → "fichiers CSV"

§15-22 "Un exemple du fonctionnement de dplyr"

  • "Etats-Unis" → "États-Unis"
  • "Etant donné" → "Étant donné"
  • "csv" → "CSV"
  • Il me semble qu'il manque la traduction de la phrase "The read_csv function takes the path of a file we want to import from as a variable so make sure that you have it set up correctly."
  • "Editer" → "Éditer"
  • "Figure 1. Vue graphique de la population de la Californie et de l’Etat de New-York" → "Figure 1. Vue graphique de la population de la Californie et de l’État de New York"
  • "Etats-Unis" → "États-Unis" (autre paragraphe)
  • "Mississipi" → "Mississippi"

§23-29 "L’opérateur Pipe"

  • "oeil" → "œil"
  • "oeuvre" → "œuvre"
  • "A l’évidence" → "À l’évidence"
  • "L’opérateur pipe fait tout cela oour vous."" → "L’opérateur pipe fait tout cela pour vous."
  • "Voici le même code mais avec [...]" → "Voici le même code, mais avec [...]"

§30-35 "Il nous faut un nouveau jeu de données"

  • "Etats-Unis" → "États-Unis"
  • "Les données de recensement qu’on a utilisées plus tôt font partie de cet échantillon." → "Les données de recensement que nous avons utilisées précédemment font partie de cet échantillon."
  • "(colleges en américains)" → "(colleges dans le monde anglophone)"
  • "oeil" → "œil"
  • "A présent" → "À présent"

§36-37 "Qu’est-ce que Dplyr ?"

Rien à signaler

§38-40 "select"

  • "la fonction select de dplyr" → "La fonction select de dplyr"

§41 "filter"

  • "18ème siècle" → "18e siècle"

§42-43 "mutate"

  • "A" → "À"

§44 "arrange"

  • "Plaçons les" → "Plaçons-les"
  • "fonction-clé" → "fonction clé"

§45 "Summarise"

  • Intitulé du paragraphe en minuscule, par souci de concordance avec ceux qui précèdent, correspondant aux noms de fonctions.
  • Terminer le paragraphe par un point.

§46-50 "Et si nous compilions ces fonctions ?"

  • "apostrophes arrières" → "apostrophes arrière". Ici, il s'agit d'un adjectif invariable.

§51 "Conclusion"

Rien à signaler

Ce message vous laisse le temps de reprendre quelques éléments de la leçon. En ce qui me concerne, pour les futures étapes du suivi, je me charge de trouver deux personnes à même de relire la leçon afin de l'évaluer en double aveugle. Je les inviterai à commenter ce ticket si elles disposent d'un compte GitHub.

A très vite,

Alexandre

@damienbelveze
Copy link
Contributor

damienbelveze commented Oct 15, 2024 via email

@anisa-hawes anisa-hawes pinned this issue Oct 16, 2024
@anisa-hawes anisa-hawes unpinned this issue Oct 16, 2024
@AlexandreWa
Copy link
Contributor

Merci @benegarbi !

Comme évoqué précédemment, je vais, dans les prochains jours, synthétiser les remarques des deux relectrices.

@AlexandreWa
Copy link
Contributor

Synthèse des remarques sur la leçon

Bonjour à toutes et à tous, je propose une synthèse des retours proposés par nos deux relectrices.

Les remarques sont triées par paragraphe. À de rares occasions, j'ai préféré omettre les propositions de reformulation qui me semblaient trop éloignées du texte original. D'ailleurs, j'ai parfois pris la liberté de fusionner certaines reformulations qui portaient sur la même phrase ou sur le même paragraphe. Merci à @benegarbi et @j-giss pour la richesse de vos remarques, tant sur le fond que sur la forme !

@damienbelveze, vous pouvez désormais apporter les modifications ci-dessous au fichier markdown. Il n'y a qu'un élément sur lequel l'avis de @marie-flesch sera nécessaire (§ 50). Si certains de mes propos ne sont pas clairs ou discutables, n'hésitez pas à le signaler.

Remarques globales

  • Mettre les noms de paquet ou de commande en italique lorsqu'ils apparaissent dans le corps du texte, comme read_CSV(), pipe, tidyverse ou dplyr.
  • Uniformiser l'utilisation des pronoms en privilégiant "Nous" à "On" et en prenant en compte l'écriture inclusive le cas échéant.

Prérequis

§ 2

  • "Cette leçon comporte quelques" → "Cette leçon nécessite quelques"
  • "au bout des" → "au bout de la leçon des"

Objectifs de la leçon

§ 3

  • Ajouter un point à la fin de chaque phrase de la liste numérotée.
  • "pour qu'elles soient ordonnées" → "pour qu'elles soient propres" (c'est le terme utilisé dans le reste de la leçon pour "tidy data")

Introduction

§ 4

  • "Les données que vous trouverez “dans la nature” sont rarement dans un format qui rend possible une analyse et vous aurez à les manipuler avant d’explorer les questions que vous souhaitez leur poser" → "Les données que vous rencontrerez "dans la nature" sont rarement présentées dans un format qui rend possible l'analyse. Vous aurez donc à les traiter avant de pouvoir explorer les questions qui vous intéressent."
  • "Cette manipulation peut prendre plus de temps que l’analyse elle-même ! → Ce traitement peut prendre plus de temps que l’analyse elle-même !"
  • "techniques de base for manipuler," → "techniques de base pour manipuler,"

§ 6 :

  • Il manque un item dans la liste numérotée. Le 4e item "Multiple types of observational units are stored in the same table." n'a pas été traduit.
  • Ajouter un point à la fin de chaque phrase de la liste numérotée

§ 7

  • "Avantage peut-être encore plus important, garder nos données dans ce format propre nous permet d’utiliser une galerie de paquets dans le “tidyverse”, qui ont été spécifiquement conçus pour fonctionner avec des données propres" → "Un avantage peut-être encore plus important est de garder nos données dans ce format propre, qui nous permet d’utiliser une galerie de paquets du “tidyverse”, spécifiquement conçus pour fonctionner avec des données bien structurées"
  • "En nous assurant que nos données en entrée et en sortie sont propres, nous n’aurons qu’un petit nombre d’outils à utiliser pour résoudre un grand nombre de questions." → "En nous assurant que nos données en entrée et en sortie sont bien structurées, nous n’aurons qu’un nombre limité d’outils à utiliser pour répondre à un grand nombre de questions."
  • "De plus, nous pouvons combiner, manipuler et scinder des jeux de données comme bon nous semble" → "De plus, nous pourrons combiner, manipuler et séparer des jeux de données comme bon nous semble"

§ 8 :

  • "nous traiterons particulièrement le paquet dplyr du tidyverse" → "nous nous intéresserons particulièrement au paquet dplyr du tidyverse"

§ 9

  • "magittr : ce paquet donne accès à l’opérateur pipe et rendre le code plus facile à lire." → "magittr : donne accès à l’opérateur pipe et rend le code plus facile à lire."

§ 10

  • "ggplot2 : ce paquet utilise la “grammaire des graphiques” pour vous permettre de donner des visualisations simples à réaliser de vos données." → "ggplot2 : utilise la “grammaire des graphiques” permettant de réaliser des visualisations simples de vos données."

§ 11

  • "readr : ce paquet met à disposition un import plus rapide et intuitif de données tabulées, comme des fichiers CSV." → "readr : met à disposition un import plus rapide et intuitif de données tabulées, comme des fichiers CSV."

§ 12

  • tibble : ce paquet nous donne accès à une nouvelle conceptualisation des tableaux de données qui seront plus simples à traiter et à imprimer." → "tibble : donne accès à une nouvelle conceptualisation des tableaux de données qui seront plus simples à traiter et à imprimer."

§ 13

  • "Si vous ne l’avez pas déjà fait, vous devriez installer et charger le “tidyverse” avant de commencer." → "Si vous ne l’avez pas déjà fait, vous devez installer et charger le “tidyverse” avant de commencer."
  • "votre système d’exploitation" → "votre système d’exploitation (Windows, Mac OS, Linux)"

§ 14

  • "Copiez le code ci-dessous dans Rstudio. Pour les exécuter, il vous faut mettre ces lignes en surbrillance et presser Ctrl+enter (ou Cmd+enter sur Mac OS)" → "Copiez le code ci-dessous dans la zone d’édition de fichiers de Rstudio. Pour l'exécuter, il faut mettre ces lignes en surbrillance et appuyer sur Ctrl+enter (ou Cmd+enter sur Mac OS)"

Un exemple du fonctionnement de dplyr

§ 16

  • "importons les données" → "importez les données"

§ 17

  • "Étant donné que les données sont présentées dans un fichier CSV" → "Comme les données sont stockées dans un fichier CSV"
  • "nous allons utiliser" → "utilisez"
  • "read_CSV()" → "read_csv()"
  • "comprise" → "incluse"

§ 18

  • "il faut s’assure" → "il faut s’assurer"
  • "introductory_state_example.CSV" → "introductory_state_example.csv"

§ 20

  • "créons une visualisation de" → "voulons visualiser la"
  • "On va utiliser dplyr pour filtrer nos données" → "Nous allons utiliser dplyr pour filtrer nos données". Le pronom "nous" est utilisé dans l'ensemble de la leçon.
  • "On va utiliser dplyr pour filtrer nos données, de telle sorte qu’elles ne contiennent que les informations relatives aux États qui nous intéressent et on va utiliser ggplot2 pour visualiser cette information" → "Nous allons utiliser dplyr pour filtrer nos données, de telle sorte qu’elles ne contiennent que les informations relatives aux États qui nous intéressent et ggplot2 pour visualiser cette information"
  • "Cet exercice n’a d’autre but que de" → "Cet exercice a pour but de"

Bloc de code entre le § 20 et le § 21

  • "Editer" → Éditer"

§ 22

  • "Comme on peut le voir" → "Comme nous pouvons le voir"
  • "a cru" → "a augmenté"
  • "comparée" → "si nous la comparons à"
  • "Cet exemple en particulier peut sembler évident, compte tenu de l’histoire des migrations aux États-Unis, mais le code en lui-même nous procure une base à partir de laquelle poser une foule de questions semblables" → "Cet exemple en particulier peut sembler évident au regard de l’histoire des migrations aux États-Unis, mais le code en lui-même nous fournit une base pour poser de nombreuses questions similaires"
  • "Par exemple, avec" → "Ainsi, avec"

§ 24

  • "dans le code et de réanalyser" → "dans le code et de visualiser"
  • Si l'on veut aller plus loin pour alléger la phrase, voici une proposition : "L'AED permet aux historiens d'identifier facilement "
  • "Pour les Historiens, l’AED nous apporte un moyen aisé de savoir quand on peut approfondir un sujet ou bien quand on doit reprendre de la hauteur, et c’est un sujet sur lequel R excelle." → "L'AED fournit aux historiens un moyen simple de déterminer quand approfondir un sujet ou quand prendre du recul, et c'est un domaine dans lequel R excelle."

L'opérateur Pipe

§ 25

  • "Avant de jeter un coup d’œil à dplyr, nous devons examiner" → "Avant d’aborder dplyr, nous devons examiner"
  • "Son nom rend hommage au peintre surréaliste René Magritte qui, dans son œuvre “La trahison des images”, a représenté une pipe célèbre en plaçant en dessous la légende “ceci n’est pas une pipe”." → "Son nom rend hommage au peintre surréaliste René Magritte, connu pour son œuvre "La trahison des images" où l'on peut voir une pipe accompagnée de la légende “ceci n’est pas une pipe”." L'adjectif "famously" se rapporte initialement à Magritte.

§ 26

  • "L’opérateur pipe nous permet de passer ce qui est à gauche du pipe comme la première variable de la fonction qui est donnée à droite." → "L’opérateur pipe nous permet déclarer ce qui est à gauche du pipe comme le premier élément de la fonction qui est indiquée à droite."
  • "Bien que cela puisse paraître étrange au premier abord, une fois que vous l’aurez appris, vous trouverez qu’il rend votre code plus lisible en vous évitant d’enchâsser vos opérations les unes dans les autres" → "Cela peut sembler étrange au premier abord, mais une fois appris, vous trouverez qu'il rend votre code plus lisible en évitant l'imbrication des opérations."
  • "Ne vous inquiétez pas si tout cela vous semble encore confus pour l’instant ; ça va s’éclairer progressivement avec des exemples." → "Ne vous inquiétez pas si tout cela vous semble encore confus pour le moment ; cela deviendra plus clair progressivement avec des exemples."

§ 27

  • "Supposons que nous ayons un intérêt à obtenir la racine carrée de la valeur pour la population de chaque État, puis d’en faire la somme et finalement la moyenne" → "Supposons que nous souhaitions calculer la racine carrée de la population de chaque État, puis en calculer la somme et enfin la moyenne."
  • "À l’évidence, cette mesure ne nous sert à rien, mais cela permet de montrer à quel point un code réalisé avec R peut rapidement devenir difficile à lire. Normalement, nous pourrions enchâsser ces opérations" → "À l’évidence, cette mesure ne nous sert à rien, mais elle permet de montrer à quel point un code réalisé avec R peut rapidement devenir difficile à lire. Normalement, nous pourrions imbriquer ces opérations"

§ 28

  • "Comme on peut le voir, avec des commandes enchâssées" → "Comme on peut le voir, l'utilisation de commandes imbriquées"

Bloc de code entre le § 28 et le § 29

  • "# "obtenir" (le 3e commentaire) → "# Obtenir" (harmonisation)

Bloc de code entre le § 29 et le § 30

  • "# assurez-vous" → "# Assurez-vous" (harmonisation)

Il nous faut un nouveau jeu de données

§ 32

  • "nous sommes en mesure de commencer à examiner et manipuler des données" → "nous sommes en mesure d’examiner et manipuler des données"

Bloc de code entre le § 33 et le § 34 :

  • "# installer" → "# Installer" (harmonisation)
  • "# charger" → "# Charger" (harmonisation)

§ 34

  • "on va particulièrement travailler avec le jeu de données early_colleges qui contient " → "nous allons surtout travailler avec un jeu de données en particulier : early_colleges, qui contient".
  • early_colleges en italiques.
  • "y jeter un coup d’œil" → "regarder"

Bloc de code entre le § 36 et le § 37

  • "<- "congregational"" → "<- "Congregational"

Qu’est-ce que Dplyr ?

§ 38

  • "met à votre disposition" → "met à disposition"

§ 39

  • "à R seul" → "au langage R de base".
  • "muter(mutate)" → l'une des relectrices propose la traduction "recoder(mutate)". À mon sens, nous pouvons utiliser l'une ou l'autre.
  • "récapituler(summarise" → l'une des relectrices propose la traduction "résumer(summarise". Je la trouve effectivement plus adéquate.
  • "le seront aussi, et ce qui est peut-être encore plus important, dplyr facilite" → "le seront aussi. Plus important encore, dplyr facilite"

select

§ 40

  • "noms originaux" → "noms à l'origine" (terme employé plus haut, à uniformiser)
  • "NA (Not Available) signifie qu’on n’a aucune donnée correspondante et qu’on pourrait vouloir visualiser nos données en soustrayant cette colonne." → "NA (Not Available) signifie qu’on n’a aucune donnée correspondante. On pourrait donc vouloir visualiser nos données en soustrayant cette colonne."
  • "le tableau de données qu'on veut manipuler" → "le tableau de données que nous voulons manipuler"
  • "comme le premier argument" → "comme premier argument"

Bloc de code entre le § 40 et le § 41

  • "## 1 Harvard Cambridge MA 1636 congregational" → "## 1 Harvard Cambridge MA 1636 Congregational"
  • "# supprime" → "# Supprimer"
  • "noms originaux" → "noms à l'origine" (ou modifier plus haut, comme signalé)

filter

§ 43

  • "la même chose que la fonction" → "une opération similaire à la fonction"
  • "choisir le nom d’une" → "choisir une"
  • "filtrer les lignes qui réalisent une certaine condition" → "sélectionner les lignes qui remplissent une certaine condition"

mutate

§ 44

  • "La commande mutate vous permet d’ajouter une commande à votre tableau de données." → "La commande mutate vous permet d’ajouter une colonne à votre tableau de données."
  • "commande “coller”" → "commande paste (coller)"

§ 45

  • Encore une fois, il faut vous rappeler que dplyr ne conserve pas les données ni ne manipule le document original." → "Rappelez-vous que dplyr ne conserve pas les données ni ne transforme le document original."

arrange

§ 46

  • "nous permet d’ordonner nos colonnes d’une autre façon" → "permet de changer l’ordre des colonnes"
  • "par ordre décroissant" → "par ordre décroissant (descending en anglais)" : suggestion pour expliciter la signification de la commande "desc" du code

Summarise

  • Titre : harmoniser avec les autres titres concernant ces fonctions : soit tout capitaliser soit enlever la majuscule à Summarise dans ce titre.
  • "Summarise() occupe une fonction ou une opération et est habituellement utilisé pour créer un tableau de données qui contient des données statistiques récapitulatives destinées à fournir des graphiques." → "Summarise() est une fonction habituellement utilisée pour créer un tableau de données statistiques récapitulatives destinées à fournir des graphiques."
  • "avant 1848" → "avant 1848."

Et si nous compilions ces fonctions ?

§ 48

  • "Maintenant que nous avons parcouru les cinq principaux verbes de dplyr" → "Maintenant que nous avons exploré les cinq verbes principaux de dplyr"
  • "Allons-y, créons un graphique en barres pour afficher le nombre d’universités laïques ou religieuses fondées avant la guerre de 1812:" → "Créons un graphique en barres pour représenter le nombre d’universités laïques ou religieuses fondées avant la guerre de 1812:"

§ 50

  • Comme le remarque Jeanne, ce paragraphe n'apparaît pas dans la leçon originale. Faut-il spécifier qu'il s'agit d'un ajout du traducteur, par souci de concordance, @marie-flesch ?
  • "Noter ici" → "Notez"
  • "Cela permet à la fois de gérer le fait qu’elle occupe au lieu d’un seul deux termes séparés par une espace, ainsi que le i trema présent dans le mot “laïque”, caractère qui ne fait pas partie des 128 présents dans la table ASCII et peut donc poser problème dans l’exécution de certains programmes." → "Cela permet à la fois de gérer le fait qu’elle occupe deux termes séparés par un espace, au lieu d’un seul, et le i trema présent dans le mot “laïque”. Ce caractère ne fait pas partie des 128 présents dans la table ASCII et peut donc poser problème dans l’exécution de certains programmes."

§ 51

  • "visualiser le nombre de colleges laïques par rapport au nombre d’universités religieuses" → "visualiser le nombre d'universités laïques par rapport au nombre d’universités religieuses"

Conclusion

§ 53

  • "trouver des outils" → "trouver des fonctions"
  • "De plus vous" → "De plus, vous"
  • "affiner vos compétences." → "améliorer vos compétences."
  • "Dans les deux cas, ce guide vous permet de disposer d’une bonne base pour aller plus loin et couvrir les problèmes courants que vous pourriez rencontrer dans la gestion de données" → "Dans les deux cas, ce guide vous fournit une base approfondir vos connaissances et de couvrir les problèmes courants que vous pourriez rencontrer dans la gestion de données." Le "de" a son importance. Dans la leçon originale, c'est le guide qui semble couvrir les problèmes plus qu'il ne permettrait de couvrir par la suite les problèmes.

@anisa-hawes anisa-hawes moved this from 4 Open Peer Review to 5 Revision 2 in Active Lessons Nov 7, 2024
@anisa-hawes
Copy link
Contributor

Bonjour Damien @damienbelveze,

What's happening now?

Your lesson has been moved to the next phase of our workflow which is Phase 5: Revision 2.

This phase is an opportunity for you to revise your draft in response to the peer reviewers' feedback.

Alexandre @AlexandreWa has summarised their suggestions, but feel free to ask questions if you are unsure.

Please make revisions via direct commits to your file: /fr/en-cours/traductions/gestion-manipulation-donnees-r.md. @charlottejmc and I are here to help if you encounter any difficulties.

When you and Alexandre are both happy with the revised draft, the Managing Editor @marie-flesch will read it through before we move forward to Phase 6: Sustainability + Accessibility.

%%{init: { 'logLevel': 'debug', 'theme': 'dark', 'themeVariables': {
              'cScale0': '#444444', 'cScaleLabel0': '#ffffff',
              'cScale1': '#3d7c81', 'cScaleLabel1': '#ffffff',
              'cScale2': '#444444', 'cScaleLabel2': '#ffffff'
       } } }%%
timeline
Section Phase 4 <br> Open Peer Review
Who worked on this? : Reviewers (@j-giss + @benegarbi)
All  Phase 4 tasks completed? : Yes
Section Phase 5 <br> Revision 2
Who's working on this? : Author (@damienbelveze)
Expected completion date? : Month 1
Section Phase 6 <br> Sustainability + Accessibility
Who's responsible? : Publishing Team
Expected timeframe? : 7~21 days
Loading

Note: The Mermaid diagram above may not render on GitHub mobile. Please check in via desktop when you have a moment.

@damienbelveze
Copy link
Contributor

damienbelveze commented Nov 20, 2024 via email

@anisa-hawes
Copy link
Contributor

Many thanks for your work on these revisions, @damienbelveze!

Next, Alexandre @AlexandreWa will read through the draft again to confirm that he's satisfied with the suggestions integrated.

After that, I'll ask the Managing Editor Marie @marie-flesch to read the translation through and share additional feedback/suggestions as necessary.

When both Alexandre and Marie are happy, we will move forward to Phase 6: Sustainability + Accessibility.

@marie-flesch
Copy link
Contributor Author

Je laisse @AlexandreWa regarder tout ça, et ensuite je fais ma relecture :)

@AlexandreWa
Copy link
Contributor

Bonjour @damienbelveze

Merci d'avoir intégré l'ensemble des propositions de nos relectrices !

J'adresse seulement à @marie-flesch un point de vigilance sur le §50 : il s'agit d'une note du traducteur. @damienbelveze a pris soin de faire apparaître une note de bas de page dans le fichier Markdown pour le préciser. Néanmoins, on ne la voit pas dans la version provisoire de la leçon déployée sur Jekyll. De même, le §50 apparaît intégralement en surbrillance dans la version provisoire.

Dernière chose, toujours pour le même paragraphe : il ne manque que le remplacement de "Noter ici" par "Notez".

Pour le reste, c'est tout bon pour moi !

Alexandre

@damienbelveze
Copy link
Contributor

damienbelveze commented Nov 22, 2024 via email

@marie-flesch
Copy link
Contributor Author

Super, je vais regarder ça la semaine prochaine ! On y est presque :)

@charlottejmc
Copy link
Collaborator

Merci @AlexandreWa, j'ai ajusté la présentation de la note du traducteur au paragraph 49.

@marie-flesch
Copy link
Contributor Author

J'ai effectué une relecture de la leçon ; j'ai ajusté le petit souci de l'item qui s'était perdu dans la mauvaise liste à puces dans l'introduction. Je me pose deux questions auxquelles peut-être @damienbelveze et @AlexandreWa vous pouvez apporter des éléments de réponses :

  • je me demande s'il est judicieux de laisser l'output intégral après le chargement du tidyverse. Cela prend beaucoup de place et il y a beaucoup d'avertissements (l'output n'est pas présent dans la leçon en anglais).
  • comme beaucoup d'anciennes leçons de PH, la leçon est très axée sur les historien·nes. Ici il s'agit d'une étude de cas en histoire, donc ça se comprend. Mais je me demande dans quelle mesure l'assertion suivante:

Malheureusement, pour les historiens, il n’y a que peu de jeux de données disponibles ; peut-être pourriez-vous contribuer à ce que cela change en diffusant vos propres données !

est vraie aujourd'hui (la leçon ayant été rédigée en 2017). Je suis pas historienne, mais il me semble qu'il existe aujourd'hui de nombreux jeux de données librement disponibles en SHS (et aussi en histoire peut-être du coup). Qu'en pensez-vous ?

@damienbelveze
Copy link
Contributor

damienbelveze commented Dec 4, 2024 via email

@marie-flesch
Copy link
Contributor Author

Bonjour Damien, merci pour votre réponse rapide ! Non je vais faire les changements, pas de souci :)

Je pense effectivement qu'il serait judicieux de modifier la phrase sur les jeux de données, on va voir ce que @AlexandreWa en pense :)

@AlexandreWa
Copy link
Contributor

Bonjour tout le monde,

@marie-flesch, tu parles bien de l'outpout situé sous le §15 ? Les informations située sous library(tidyverse) ne sont pas les plus utiles à la compréhension de la leçon. On peut insérer un "[...]" à la place.

Il est vrai que dans un contexte de science ouverte français (Loi pour une République numérique en 2016, 1er Plan national pour la science ouverte de 2018 à 2021, 2e plan de 2021 à 2024), cette assertion semble aujourd'hui datée. On peut s'écarter de la phrase d'origine pour actualiser le propos, avec quelque chose comme : "À la date à laquelle nous publions cette leçon traduite, de plus en plus de jeux de données sont disponibles pour les historien·nes ; peut-être pourriez-vous contribuer à ce que cela change en diffusant vos propres données !".

D'ailleurs, ajoute-t-on : "pour les historien·nes et chercheur·ses en SHS" ?

@marie-flesch
Copy link
Contributor Author

Je parle de l'output intitulé "Sortie", paragraphe 15, qui est très long, ne figure pas dans la version en anglais, et n'apparaitra de toute façon de la même façon dans la console de R pour les personnes qui suivent la leçon (les warnings par ex. dépendent de la version de R utilisée). Je vais simplement le supprimer, ça me parait le plus judicieux :) . Sinon oui, je vais ajouter la phrase que tu suggères ou un truc du style !

@damienbelveze
Copy link
Contributor

damienbelveze commented Dec 4, 2024 via email

@AlexandreWa
Copy link
Contributor

Entendu, merci pour vos retours rapides !

Cela me convient si on se cantonne à la formulation "pour les historien·nes". Comme il s'agit d'un traitement de données historiques, ça fait sens :)

@marie-flesch
Copy link
Contributor Author

Oui tu as tout à fait raison @AlexandreWa , j'ai oublié de souligner ça, mais effectivement il faut ajouter "pour les historien·nes et chercheur·ses en SHS". Malgré son nom, la revue est ouverte sur toutes les disciplines des SHS, et c'est important de le souligner. Je fais les modifs demain !

@marie-flesch marie-flesch moved this from 5 Revision 2 to 6 Sustainability + Accessibility in Active Lessons Dec 6, 2024
@marie-flesch
Copy link
Contributor Author

La leçon est prête pour toi @charlottejmc ! J'ai laissé les noms des paquets (packages) utilisés en italiques, parce que je ne savais pas comment les formatter... si tu as des questions sur quoi que ce soit, dis-moi !

@charlottejmc
Copy link
Collaborator

Merci @marie-flesch ! ✨

@charlottejmc
Copy link
Collaborator

charlottejmc commented Dec 6, 2024

Hello @marie-flesch,

This lesson's sustainability + accessibility checks are in progress.

  • Preview:

http://programminghistorian.github.io/ph-submissions/fr/en-cours/traductions/gestion-manipulation-donnees-r

Publisher's sustainability + accessibility actions:

  • Typesetting
  • Addition of Perma.cc links
  • Addition of alt-text for all figures
  • Check/resize images
  • Check/adjust image filenames
  • Receipt of translator's copyright agreement – Bonjour @damienbelveze, notre formulaire de déclaration de droit d'auteur est une occasion de reconnaître le droit d'auteur et de nous accorder la permission de publier la leçon. Pourriez-vous télécharger ce formulaire, le compléter et me l'envoyer par courriel (publishing.assistant [@] programminghistorian.org) ? Merci beaucoup.
  • Request DOI
  • Remove outside contributors from ph-submissions

Editorial input to YAML:

  • Translation of avatar_alt:
  • Translation of abstract:
  • Translation of author(s) bio for ph_authors.yml

Files we are preparing for transfer to Jekyll:

Promotion:

  • Prepare announcement post (using template)
  • Prepare evergreen posts – @marie-flesch could you please provide x2 posts for future promotion via our social media channels? You can add these directly to the ph-evergreens-bluesky spreadsheet that has been shared with you, reply in a comment below, or email them to me at publishing.assistant[@]programminghistorian.org.

Publisher's post-publication tasks:

  • Add lesson slug to the Annual Count of Published Lessons
  • Update the ph_data folder in the ph-contributors repository

@anisa-hawes anisa-hawes moved this from 6 Sustainability + Accessibility to 7 Publication in Active Lessons Dec 11, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
Status: 7 Publication
Development

No branches or pull requests

7 participants