Skip to content

Latest commit

 

History

History
38 lines (27 loc) · 1.54 KB

todo.md

File metadata and controls

38 lines (27 loc) · 1.54 KB

todo.md

Melhorias e Ideias

  • Permitir criar colunas novas com calculos ou agragações ? Faz sentido só na visualização ?
  • Permitir 'Normalização' dos dados: equalização das grandezas e escalas.
  • Salvar todas as operações executadas no dataset como um script Python para ser utilizado normalmente.
  • Permitir utilizar algortitmo de clusterização para ver as contagens por grupo na aba visualização
  • Mostrar a classificação inicial da coluna como : Quantitativo (discreto/continuo) e Qualitativo; Permitir informar escalas de medição: Intervalo/Proporção e Nominal/Ordinal ?
  • Quantidade de registros duplicados (https://stackoverflow.com/questions/35584085/how-to-count-duplicate-rows-in-pandas-dataframe)
  • Permitir salvar os dataset carregados para nao precisar subir novamente
  • Permitir trabalhar em um dataset já salvo
  • Permitir salvar o resultado de trabalho de um dataset
  • Permitir salvar os datasets como parquet
  • Utilizar o https://github.com/vaexio/vaex para trabalhar com os dataframes maiores
  • Permitir utilizar Dask?Swifter?Pandaralell?Vaex?
  • Criar uma aba para fazer tabelas dinâmicas ?
  • Ver também o histograma e simetria da distribuição ?

Correções

Tab 'Columns'

  • Quando o dataframe é muito grande, demora muito para mostrar o dataframe resultante em 'Result configuration'

Tab 'Informations'

  • Quando o dado for datetime[ns] escolher melhores informações para mostrar
  • Quando o dado for boolean escolher melhores informações para mostrar

Tab 'Filter'

  • Filter date and datetime