-
Notifications
You must be signed in to change notification settings - Fork 0
/
Dplyr.Rmd
90 lines (72 loc) · 1.59 KB
/
Dplyr.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
---
title: "R Ladies"
author: "Fabiola"
date: "30 de agosto de 2018"
output: html_document
editor_options:
chunk_output_type: console
---
1. Leer y examinar la base.
```{r}
#setwd("~/R Ladies")
base=read.csv("test.csv")
str(base)
View(base)
attach(base)
```
Para aprovechar que la base contiene NA, recordemos cómo eliminar NAs.
```{r}
any(is.na(base))
base.2=na.omit(base)
any(is.na(base.2))
```
2. Seleccionar.
```{r}
library(tidyverse)
library(readr)
base %>%
filter(bedrooms == 2)
filter(tipovivi1 == 1) %>%
```
3. Suma y media.
```{r}
base %>%
filter(tipovivi1 == 1) %>%
summarize(total_tipovivi1 = table(tipovivi1))
```
```{r}
base %>%
filter(tipovivi1 == 1) %>%
summarize(mean_bedrooms_tipovivi1 = mean(bedrooms))
```
4. Asignar el comando a un objeto
```{r}
bed <- base %>%
filter(tipovivi1 == 1) %>%
summarize(mean_bedrooms_tipovivi1 = mean(bedrooms))
```
5. Crear una nueva variable.
Nota: Limpie todo lo anterior para no tener un error.
```{r}
base <- base %>%
unite("tipo_vivienda", c("tipovivi1", "tipovivi2","tipovivi3", "tipovivi4","tipovivi5"))
base$tipo_vivienda = as.factor(base$tipo_vivienda)
levels(base$tipo_vivienda) = c("V1", "V2", "V3","V4","V5")
base$tipo_vivienda
```
6. Ordenar el promedio de cuartos por vivienda.
```{r}
base %>%
group_by(tipo_vivienda) %>%
summarize(mean_bedrooms_viv = mean(bedrooms)) %>%
arrange(desc(mean_bedrooms_viv))
```
7. Crear base por sexo.
```{r}
base_mujeres <- base %>%
filter(female == "1")
```
```{r}
base_hombres <- base %>%
filter(male == "1")
```