Merge branch 'main' into fix-test-camara

basedosdados · May 14, 2024 · 5891051 · 5891051
2 parents 81939c9 + 3426efd
commit 5891051
Show file tree

Hide file tree

Showing 3 changed files with 198 additions and 2 deletions.
diff --git a/.github/workflows/elementary.yaml b/.github/workflows/elementary.yaml
@@ -18,8 +18,8 @@ jobs:
           warehouse-type: bigquery
           adapter-version: 1.5.9
           profiles-yml: ${{ secrets.ELEMENTARY_PROFILES_YML }}
-          edr-command: edr report --file-path "report.html" && edr send-report --google-service-account-path
-            "/tmp/gcs_keyfile.json" --gcs-bucket-name "basedosdados" --update-bucket-website
+          edr-command: edr report --file-path "report.html" --days-back 90 && edr send-report --google-service-account-path
+            "/tmp/gcs_keyfile.json" --gcs-bucket-name "basedosdados" --update-bucket-website --days-back 90
             "true"
           bigquery-keyfile: ${{ secrets.BIGQUERY_KEYFILE }}
           gcs-keyfile: ${{ secrets.GCS_KEYFILE }}

diff --git a/.github/workflows/scripts/triggers_flow_execution.py b/.github/workflows/scripts/triggers_flow_execution.py
@@ -0,0 +1,166 @@
+from argparse import ArgumentParser
+from time import sleep
+import re
+from backend import Backend
+from utils import expand_alls, get_datasets_tables_from_modified_files
+from table_test import get_flow_run_state, get_materialization_flow_id, get_flow_status_logs
+
+if __name__ == "__main__":
+    # Start argument parser
+    arg_parser = ArgumentParser()
+
+    # Add GraphQL URL argument
+    arg_parser.add_argument(
+        "--graphql-url",
+        type=str,
+        required=True,
+        help="URL of the GraphQL endpoint.",
+    )
+
+    # Add list of modified files argument
+    arg_parser.add_argument(
+        "--dataset-id",
+        type=str,
+        required=True,
+        help="Table id",
+    )
+    arg_parser.add_argument(
+        "--table-id",
+        type=str,
+        required=False,
+        default="",
+        help="Table id",
+    )
+
+    arg_parser.add_argument(
+        "--alias",
+        type=str,
+        required=False,
+        default="False",
+        help="DBT alias",
+    )
+
+    # Add Prefect backend URL argument
+    arg_parser.add_argument(
+        "--prefect-backend-url",
+        type=str,
+        required=False,
+        default="https://prefect.basedosdados.org/api",
+        help="Prefect backend URL.",
+    )
+
+    # Add prefect base URL argument
+    arg_parser.add_argument(
+        "--prefect-base-url",
+        type=str,
+        required=False,
+        default="https://prefect.basedosdados.org",
+        help="Prefect base URL.",
+    )
+
+    # Add Prefect API token argument
+    arg_parser.add_argument(
+        "--prefect-backend-token",
+        type=str,
+        required=True,
+        help="Prefect backend token.",
+    )
+
+    # Add materialization mode argument
+    arg_parser.add_argument(
+        "--materialization-mode",
+        type=str,
+        required=False,
+        default="prod",
+        help="Materialization mode.",
+    )
+
+    # Add materialization label argument
+    arg_parser.add_argument(
+        "--materialization-label",
+        type=str,
+        required=False,
+        default="basedosdados",
+        help="Materialization label.",
+    )
+
+    # Add dbt command label argument
+    arg_parser.add_argument(
+        "--dbt-command",
+        type=str,
+        required=False,
+        default = "run",
+        help="Materialization label.",
+    )
+
+    # Get arguments
+    args = arg_parser.parse_args()
+    # Expand `__all__` tables
+    backend = Backend(args.graphql_url)
+
+    # Launch materialization flows
+    backend = Backend(args.prefect_backend_url)
+    flow_id = get_materialization_flow_id(backend, args.prefect_backend_token)
+    launched_flow_run_ids = []
+    print(
+        f"Launching materialization flow for {args.dataset_id}.{args.table_id}"
+    )
+    parameters = {
+        "dataset_id": args.dataset_id,
+        "dbt_alias": args.alias,
+        "mode": args.materialization_mode,
+        "table_id": args.table_id,
+        "dbt_command": args.dbt_command,
+        "disable_elementary": False,
+    }
+
+    mutation = """
+    mutation ($flow_id: UUID, $parameters: JSON, $label: String!) {
+        create_flow_run (input: {
+            flow_id: $flow_id,
+            parameters: $parameters,
+            labels: [$label],
+        }) {
+            id
+        }
+    }
+    """
+    variables = {
+        "flow_id": flow_id,
+        "parameters": parameters,
+        "label": args.materialization_label,
+    }
+
+    response = backend._execute_query(
+        mutation,
+        variables,
+        headers={"Authorization": f"Bearer {args.prefect_backend_token}"},
+    )
+
+    flow_run_id = response["create_flow_run"]["id"]
+    launched_flow_run_ids.append(flow_run_id)
+    flow_run_url = f"{args.prefect_base_url}/flow-run/{flow_run_id}"
+    print(f" - Materialization flow run launched: {flow_run_url}")
+
+    # Keep monitoring the launched flow runs until they are finished
+    for launched_flow_run_id in launched_flow_run_ids:
+        print(f"Monitoring flow run {launched_flow_run_id}...")
+        flow_run_state = get_flow_run_state(
+            flow_run_id=launched_flow_run_id,
+            backend=backend,
+            auth_token=args.prefect_backend_token,
+        )
+        while flow_run_state not in ["Success", "Failed", "Cancelled"]:
+            sleep(5)
+            flow_run_state = get_flow_run_state(
+                flow_run_id=launched_flow_run_id,
+                backend=backend,
+                auth_token=args.prefect_backend_token,
+            )
+        if flow_run_state != "Success":
+            raise Exception(
+                f'Flow run {launched_flow_run_id} finished with state "{flow_run_state}". '
+                f"Check the logs at {args.prefect_base_url}/flow-run/{launched_flow_run_id}"
+            )
+        else:
+            print("Congrats! Everything seems fine!")
diff --git a/.github/workflows/triggers-elementary-model.yaml b/.github/workflows/triggers-elementary-model.yaml
@@ -0,0 +1,30 @@
+---
+name: Triggers Elementary Models
+on:
+  push:
+    branches: [main, master]
+  schedule:
+    - cron: 00 23 * * 1
+  workflow_dispatch:
+
+jobs:
+  run_elementary_models:
+    name: Run elementary model
+    runs-on: ubuntu-latest
+    steps:
+      - name: Checkout
+        uses: actions/checkout@v3
+        with:
+          ref: ${{ github.head_ref }}
+      - name: Set up poetry
+        run: pipx install poetry
+      - name: Set up python
+        uses: actions/setup-python@v4
+        with:
+          cache: poetry
+          python-version: '3.9'
+      - name: Install requirements
+        run: poetry install --only=dev
+      - name: Run script to test DBT model
+        run: |-
+          poetry run python .github/workflows/scripts/triggers_flow_execution.py --dataset-id elementary --graphql-url ${{ secrets.BACKEND_GRAPHQL_URL }} --prefect-backend-token ${{ secrets.PREFECT_BACKEND_TOKEN }}