Une extension à JupyterLab qui contribue:
- Formattage de SQL
- Extraction automatique du schéma de base de données
- Complétion automatique suivant un
tab
oudot
des:- noms de tables
- alias de tables
- jointures de tables
- noms de colonnes imbriquées
- fonctions
- Surbrillance de la syntaxe:
- ligne magic
- cellule magic
- chaînes de caractères Python
IPython magic pour:
- Spark SQL
- Trino
Suivre les instructions d'installation dans CONTRIBUTING
Exemple d'usage:
%%sparksql -c -l 10 --dataframe df
<QUERY>
Parameter | Description |
---|---|
--database NAME |
Spark database to use. |
-l LIMIT --limit LIMIT |
The maximum number of rows to display. A value of zero is equivalent to --output skip |
-r all|local|none --refresh all|local|none |
Force the regeneration of the schema cache file. The local option will only update tables/views created in the local Spark context. |
-d NAME --dataframe NAME |
Capture dataframe in a local variable named NAME . |
-c --cache |
Cache dataframe. |
-e --eager |
Cache dataframe with eager load. |
-v VIEW --view VIEW |
Create or replace a temporary view named VIEW . |
-o sql|json|html|aggrid|grid|text|schema|skip|none --output sql|json|html|aggrid|grid|text|schema|skip|none |
Output format. Defaults to html. The sql option prints the SQL statement that will be executed (useful to test jinja templated statements). |
-s --show-nonprinting |
Replace none printable characters with their ascii codes (LF -> \x0a ) |
-j --jinja |
Enable Jinja templating support. |
-b --dbt |
Enable DBT templating support. |
-t LIMIT --truncate LIMIT |
Truncate output. |
-m update|complete --streaming_mode update|complete |
The mode of streaming queries. |
-x --lean-exceptions |
Shortened exceptions. Might be helpful if the exceptions reported by Spark are noisy such as with big SQL queries. |
Parameter | Description |
---|---|
-c NAME --catalog NAME |
Trino catalog to use. |
-s NAME --schema NAME |
Trino schema to use. |
-l LIMIT --limit LIMIT |
The maximum number of rows to display. A value of zero is equivalent to --output skip |
-r all|none --refresh all|none |
Force the regeneration of the schema cache file. |
-d NAME --dataframe NAME |
Capture dataframe in a local variable named NAME . |
-o sql|json|html|aggrid|grid|text|schema|skip|none --output sql|json|html|aggrid|grid|text|schema|skip|none |
Output format. Defaults to html. The sql option prints the SQL statement that will be executed (useful to test jinja templated statements). |
-s --show-nonprinting |
Replace none printable characters with their ascii codes (LF -> \x0a ). |
-j --jinja |
Enable Jinja templating support. |
-t LIMIT --truncate LIMIT |
Truncate output. |
-x STATEMENT --raw STATEMENT |
Run statement as is. Do not wrap statement with a limit. Use this option to run statement which can't be wrapped in a SELECT/LIMIT statement. For example EXPLAIN, SHOW TABLE, SHOW CATALOGS. |
Si vous pensez avoir identifié une faille de sécurité dans ce projet, veuillez envoyer un courriel à l'équipe du projet à [email protected], en détaillant le problème soupçonné et les méthodes que vous avez trouvées pour le reproduire.
Veuillez NE PAS ouvrir un problème dans le GitHub repo, car nous préférerons garder les rapports de vulnérabilités privés jusqu'à ce que nous ayons eu l'occasion de les examiner et de les résoudre.
Merci à tous les contributeurs des projets suivants: