todo.md

Melhorias e Ideias

Permitir criar colunas novas com calculos ou agragações ? Faz sentido só na visualização ?
Permitir 'Normalização' dos dados: equalização das grandezas e escalas.
Salvar todas as operações executadas no dataset como um script Python para ser utilizado normalmente.
Permitir utilizar algortitmo de clusterização para ver as contagens por grupo na aba visualização
Mostrar a classificação inicial da coluna como : Quantitativo (discreto/continuo) e Qualitativo; Permitir informar escalas de medição: Intervalo/Proporção e Nominal/Ordinal ?
Quantidade de registros duplicados (https://stackoverflow.com/questions/35584085/how-to-count-duplicate-rows-in-pandas-dataframe)
Permitir salvar os dataset carregados para nao precisar subir novamente
Permitir trabalhar em um dataset já salvo
Permitir salvar o resultado de trabalho de um dataset
Permitir salvar os datasets como parquet
Utilizar o https://github.com/vaexio/vaex para trabalhar com os dataframes maiores
Permitir utilizar Dask?Swifter?Pandaralell?Vaex?
Criar uma aba para fazer tabelas dinâmicas ?
Ver também o histograma e simetria da distribuição ?

Correções

Tab 'Columns'

Quando o dataframe é muito grande, demora muito para mostrar o dataframe resultante em 'Result configuration'

Tab 'Informations'

Quando o dado for datetime[ns] escolher melhores informações para mostrar
Quando o dado for boolean escolher melhores informações para mostrar

Tab 'Filter'

Filter date and datetime