-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
feat: cria novo campo em coluna para automatizar update em pipelines #621
Conversation
Uma solução mais coesa seria:
Observações:
|
@rdahis |
Hmm legal faz sentido. Iterando nisso, que tal então o campo |
@rdahis por mim pode ser! conseguimos implementar isso rapido? |
Seguindo no #627. |
Resumo:
Add date coverage reference: para que a gente consiga saber como descobrir a cobertura temporal da tabela apenas usando os metadados que estão no django
Detalhamento
Hoje em dia o lag de bdpro é passado hard coded no código de cada pipeline. Isso significa que para cada pipeline precisamos preencher os parametros da task de update_metadata (imagem).
Como reformulei o flow que materializa as tabelas no BQ para incluir download o csv que será dispnibilizado para o usuário, queria aproveitar e colocar essa task que atualiza os metadados junto. Assim a gente garantiria que toda vez que uma tabela fosse atualizada, os metadados também atualizariam logo em seguida.
O problema é: o único local que temos as informações necessárias para atualizar os metadados é o próprio código de pipeline, não temos em nenhum lugar no backend todas as informações necessarias para aplicar esse lag (nos dados e no backend).
Atualmente temos o seguinte campos nessa task que não tem nenhuma correspondência com o backend:
Solução proposta:
- campo chamado
date_time_range_column
oucoverage_column
sendo um menu drop down com as seguintes possibilidades:year
,quarter
,month
,date
.Evidências
labs_175.mp4