You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Respostas para o formulário de sugestões de atividade da R-Ladies SP em
2022.
Importação
# URL da Google Sheets que contém as respostas# (Vinculada ao Google Forms)url<-"https://docs.google.com/spreadsheets/d/1ncSmpBt7WhrYt7rdNxQ6BoirNawrz_58jxef8_G2-v4/"# Queremos fazer a autenticação usando as chaves em cache# usando um email autorizadogooglesheets4::gs4_auth(email="[email protected]")
# Importar a forma bruta das respostasrespostas_bruto<-googlesheets4::read_sheet(url)
#> ✓ Reading from "Sugestão de atividades - R-Ladies SP (respostas)".#> ✓ Range 'Respostas ao formulário 1'.
Organização da base
# quais são as colunas que temos?
names(respostas_bruto)
#> [1] "Carimbo de data/hora" #> [2] "Quais tipos de atividade você prefere?" #> [3] "Quais temas você gostaria que fossem abordados em eventos? Escolha até 5."#> [4] "Em quais dias e horários você prefere que as atividades aconteçam?" #> [5] "Gostaria de oferecer mais alguma sugestão?" #> [6] "Você gostaria de palestrar sobre algum assunto?" #> [7] "Qual tema você gostaria de palestrar?" #> [8] "Qual é o seu nome?" #> [9] "Qual é o seu email?"respostas<-respostas_bruto|># limpar o nome das variáveis:janitor::clean_names() |># o transmute funciona como a junção de um select, rename, e mutate!dplyr::transmute(
carimbo_de_data_hora,
preferencia_atividade=quais_tipos_de_atividade_voce_prefere,
temas=quais_temas_voce_gostaria_que_fossem_abordados_em_eventos_escolha_ate_5,
preferencia_dia_horario=em_quais_dias_e_horarios_voce_prefere_que_as_atividades_acontecam,
)
# ver como ficou a basedplyr::glimpse(respostas)
#> Rows: 58#> Columns: 4#> $ carimbo_de_data_hora <dttm> 2022-01-25 08:59:37, 2022-01-25 09:19:06, 202…#> $ preferencia_atividade <chr> "Apresentação (com conteúdo expositivo), Works…#> $ temas <chr> "Manipulação de dados (pacote dplyr), Séries t…#> $ preferencia_dia_horario <chr> "Durante a semana, no período noturno", "Duran…
Temas
respostas|># selecionar apenas a coluna temadplyr::select(temas) |># separar a coluna tema, a cada vírgulatidyr::separate(temas,
into= paste0("tema_", 1:20),
sep=",",
fill="right"
) |># transformamos a base para o formato longotidyr::pivot_longer(
cols=tidyselect::everything(),
values_drop_na=TRUE,
values_to="tema"
) |># remove a coluna name, criada na etapa anteriordplyr::select(-name) |># remover os espaços extrasdplyr::mutate(tema=stringr::str_trim(tema)) |># contar quantas vezes cada tema apareceu# e ordenar de forma decrescentedplyr::count(tema, sort=TRUE) |># gerar uma tabelaknitr::kable(col.names= c("Tema", "Quantidade de respostas"))
Tema
Quantidade de respostas
Visualização de dados (pacote ggplot2)
27
Dashboards com Shiny
26
Séries temporais
26
Git e GitHub
25
Manipulação de dados (pacote dplyr)
24
Relatórios com o pacote RMarkdown
23
Mapas com R e geom_sf()
22
Modelagem Supervisionada (pacote tidymodels)
20
Arrumação de dados (pacote tidyr)
18
Tratamento de erros (pacote purrr)
18
Criação funções
17
Web Scraping
16
Introdução ao R
15
Iteração (pacote purrr)
14
Acessando APIs
11
Análise descritiva de textos
11
Modelagem de textos (NLP)
11
Apresentações com o pacote xaringan
10
Criação de pacotes
10
GitHub Actions
9
Processamento paralelo (pacote furrr)
7
Pacote data.table
6
Testes unitários (pacote testthat)
3
Dataprep com o pacote recipes
2
Ciclo de Vida de Modelos no R
1
Funções estatísticas
1
Grafos e Análise de redes sociais
1
Interpretabilidade de modelos
1
Julia
1
Tipo de atividade
# O código é similar ao código para temasrespostas|>dplyr::select(preferencia_atividade) |>tidyr::separate(preferencia_atividade, into= paste0("atividade_", 1:5), sep=",", fill="right") |>tidyr::pivot_longer(cols=tidyselect::everything(), values_drop_na=TRUE, values_to="atividade") |>dplyr::select(-name) |>dplyr::mutate(atividade=stringr::str_trim(atividade)) |>dplyr::count(atividade, sort=TRUE) |>knitr::kable(col.names= c("Atividade", "Quantidade de respostas"))
Atividade
Quantidade de respostas
Workshop (atividade que tem conteúdo expositivo e conteúdo prático)
48
Apresentação focada em como usar um pacote
39
Apresentação (com conteúdo expositivo)
28
Evento com mais de uma apresentação curta do mesmo tema
10
Mesa redonda (conversa sobre algum tema com pessoas convidadas)
8
Evento mensal com uma convidada de fora para falar sobre algum tema relacionado.
1
Dia/horário de preferência
# O código é similar ao código para temasrespostas|>dplyr::select(preferencia_dia_horario) |># Aqui rolou uma inconsistência dentre as opções de resposta,# então foi necessário padronizardplyr::mutate(
preferencia_dia_horario=stringr::str_replace_all(
preferencia_dia_horario,
"Durante a semana, no período noturno",
"Durante a semana - noite"
)
) |>tidyr::separate(
preferencia_dia_horario,
into= paste0("diahora_", 1:10), sep=",", fill="right"
) |>tidyr::pivot_longer(cols=tidyselect::everything(), values_drop_na=TRUE, values_to="diahora") |>dplyr::select(-name) |>dplyr::mutate(diahora=stringr::str_trim(diahora)) |>dplyr::count(diahora, sort=TRUE) |>knitr::kable(col.names= c("Dia e horário", "Quantidade de respostas"))