Skip to content

Commit

Permalink
Publication folder
Browse files Browse the repository at this point in the history
  • Loading branch information
wg102 committed Oct 27, 2023
1 parent 7eddb01 commit 012c784
Show file tree
Hide file tree
Showing 12 changed files with 76 additions and 108 deletions.
12 changes: 4 additions & 8 deletions docs/en/2-Publishing/Custom.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,22 +2,18 @@

## Custom Web Apps

We can deploy anything as long as it's open source and we can put it in a Docker
container. For instance, Node.js apps, Flask or Dash apps. Etc.
We can deploy anything as long as it's open source and we can put it in a Docker container. For instance, Node.js apps, Flask or Dash apps. Etc.

![Example of a Node.js App](../images/readme/covid_ui.png)

<!-- prettier-ignore -->
!!! info "See the source code for this app"
We just push these kinds of applications through GitHub into the server.

# Setup
## Setup

## How to get your app hosted
### How to get your app hosted

If you already have a web app in a git repository then, as soon as it's
containerized, we can fork the Git repository into the StatCan GitHub repository
and point a URL to it. To update it, you'll just interact with the StatCan
GitHub repository with Pull Requests.
If you already have a web app in a git repository then, as soon as it's containerized, we can fork the Git repository into the StatCan GitHub repository and point a URL to it. To update it, you'll just interact with the StatCan GitHub repository with Pull Requests.

**Contact us if you have questions.**
25 changes: 7 additions & 18 deletions docs/en/2-Publishing/Datasette.md
Original file line number Diff line number Diff line change
@@ -1,23 +1,17 @@
# Overview

Datasette is an instant JSON API for your SQLite databases allowing you to
explore the DB and run SQL queries in a more interactive way.
Datasette is an instant JSON API for your SQLite databases allowing you to explore the DB and run SQL queries in a more interactive way.

You can find a list of example datasettes
[here](https://github.com/simonw/datasette/wiki/Datasettes).

<!-- prettier-ignore -->
!!! faq "The Datasette Ecosystem"
There are all sorts of tools for converting data to and from sqlite
[here](https://docs.datasette.io/en/stable/ecosystem.html). For example,
you can load shapefiles into sqlite, or create [Vega](https://vega.github.io/vega/)
plots from a sqlite database. SQLite works well with `R`, `Python`, and many other tools.
There are all sorts of tools for converting data to and from sqlite [here](https://docs.datasette.io/en/stable/ecosystem.html). For example, you can load shapefiles into sqlite, or create [Vega](https://vega.github.io/vega/) plots from a sqlite database. SQLite works well with `R`, `Python`, and many other tools.

## Example Datasette

Below are some screenshots from the
[global-power-plants](https://global-power-plants.datasettes.com) Datasette, you
can preview and explore the data in the browser, either with clicks or SQL
Below are some screenshots from the [global-power-plants](https://global-power-plants.datasettes.com) Datasette, you can preview and explore the data in the browser, either with clicks or SQL
queries.

![Preview Data](../images/datasette-preview.png)
Expand All @@ -35,19 +29,15 @@ You can even explore maps within the tool!

## Installing Datasette

In your Jupyter Notebook, open a terminal window and run the command
`pip3 install datasette`.
In your Jupyter Notebook, open a terminal window and run the command `pip3 install datasette`.

<center>
![Install Datasette](../images/InstallDatasette.PNG)
</center>

## Starting Datasette

To view your own database in your Jupyter Notebook, create a file called
start.sh in your project directory and copy the below code into it. Make the
file executable using `chmod +x start.sh`. Run the file with `./start.sh`.
Access the web server using the **base URL** with the port number you are using
in the below file.
To view your own database in your Jupyter Notebook, create a file called start.sh in your project directory and copy the below code into it. Make the file executable using `chmod +x start.sh`. Run the file with `./start.sh`. Access the web server using the **base URL** with the port number you are using in the below file.

**start.sh**

Expand Down Expand Up @@ -78,8 +68,7 @@ datasette $DATABASE --cors --config max_returned_rows:100000 --config sql_time_l
you will not be able to simply access it from `http://localhost:5000/` as
normally suggested in the output upon running the web-app.

To access the web server you will need to use the base URL. In your notebook
terminal, run:
To access the web server you will need to use the base URL. In your notebook terminal, run:

```python
echo https://kubeflow.covid.cloud.statcan.ca${JUPYTER_SERVER_URL:19}proxy/5000/
Expand Down
17 changes: 5 additions & 12 deletions docs/en/2-Publishing/PowerBI.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,8 +2,7 @@

## Loading data into Power BI

We do not offer a Power BI server, but you can pull your data into Power BI from
our Storage system, and use the data as a `pandas` data frame.
We do not offer a Power BI server, but you can pull your data into Power BI from our Storage system, and use the data as a `pandas` data frame.

![Power BI Dashboard](../images/powerbi_dashboard.png)

Expand All @@ -17,22 +16,16 @@ our Storage system, and use the data as a `pandas` data frame.

## Set up Power BI

Open up your Power BI system, and open up this
[Power BI quick start](https://raw.githubusercontent.com/StatCan/aaw-contrib-jupyter-notebooks/master/querySQL/power_bi_quickstart.py)
in your favourite text editor.
Open up your Power BI system, and open up this [Power BI quick start](https://raw.githubusercontent.com/StatCan/aaw-contrib-jupyter-notebooks/master/querySQL/power_bi_quickstart.py) in your favourite text editor.

You'll have to make sure that `pandas`, `boto3`, and `numpy` are installed, and
that you're using the right Conda virtual environment (if applicable).
You'll have to make sure that `pandas`, `boto3`, and `numpy` are installed, and that you're using the right Conda virtual environment (if applicable).

![Install the dependencies](../images/powerbi_cmd_prompt.png)

You'll then need to make sure that Power BI is using the correct Python
environment. This is modified from the options menu, and the exact path is
specified in the quick start guide.
You'll then need to make sure that Power BI is using the correct Python environment. This is modified from the options menu, and the exact path is specified in the quick start guide.

## Edit your python script

Then, edit your Python script to use your MinIO `ACCESS_KEY` and `SECRET_KEY`,
and then click "Get Data" and copy it in as a Python Script.
Then, edit your Python script to use your MinIO `ACCESS_KEY` and `SECRET_KEY`, and then click "Get Data" and copy it in as a Python Script.

![Run your Python Script](../images/powerbi_python.png)
4 changes: 3 additions & 1 deletion docs/en/2-Publishing/R-Shiny.md
Original file line number Diff line number Diff line change
Expand Up @@ -12,7 +12,9 @@ R-Shiny is an R package that makes it easy to build interactive web apps in R.

_Publish Professional Quality Graphics_

<center>
[![InteractiveDashboard](../images/InteractiveDashboard.PNG)](../R-Shiny/)
</center>

R Shiny is an open source web application framework that allows data scientists and analysts to create interactive, web-based dashboards and data visualizations using the R programming language. One of the main advantages of R Shiny is that it offers a straightforward way to create high-quality, interactive dashboards without the need for extensive web development expertise. With R Shiny, data scientists can leverage their R coding skills to create dynamic, data-driven web applications that can be shared easily with stakeholders.

Expand All @@ -22,7 +24,7 @@ Another advantage of R Shiny is that it supports a variety of data visualization

R Shiny is also highly extensible and can be integrated with other open source tools and platforms to build end-to-end data science workflows. With its powerful and flexible features, R Shiny is a popular choice for building data visualization dashboards for a wide range of applications, from scientific research to business analytics. Overall, R Shiny offers a powerful, customizable, and cost-effective solution for creating interactive dashboards and data visualizations.

Use **[R-Shiny](/2-Publishing/R-Shiny/)** to build interactive web apps straight from R. You can deploy your R Shiny dashboard by submitting a pull request to our [R-Dashboards GitHub repository](https://github.com/StatCan/R-dashboards).
Use **[R-Shiny](../R-Shiny/)** to build interactive web apps straight from R. You can deploy your R Shiny dashboard by submitting a pull request to our [R-Dashboards GitHub repository](https://github.com/StatCan/R-dashboards).

# R Shiny UI Editor

Expand Down
2 changes: 1 addition & 1 deletion docs/fr/2-Publication/Dash.md
Original file line number Diff line number Diff line change
Expand Up @@ -31,7 +31,7 @@ Ceci est un exemple de mise en page avec figure et curseur de

_Publier avec des logiciels fabriqués au Canada._

**[Plotly Dash](/2-Publishing/Dash/)** est une bibliothèque Python populaire qui vous permet de créer facilement des visualisations et des tableaux de bord Web interactifs. Développé par la société montréalaise Plotly, Dash a acquis la réputation d'être un outil puissant et flexible pour créer des graphiques de science des données personnalisés. Avec Dash, vous pouvez tout créer, des simples graphiques linéaires aux tableaux de bord complexes de plusieurs pages avec des widgets et des commandes interactifs. Parce qu'il repose sur des technologies open source telles que Flask, React et Plotly.js, Dash est hautement personnalisable et peut être facilement intégré à d'autres outils et workflows de science des données. Que vous soyez data scientist, analyste ou développeur, Dash peut vous aider à créer des visualisations attrayantes et informatives qui donnent vie à vos données.
**[Plotly Dash](../Dash/)** est une bibliothèque Python populaire qui vous permet de créer facilement des visualisations et des tableaux de bord Web interactifs. Développé par la société montréalaise Plotly, Dash a acquis la réputation d'être un outil puissant et flexible pour créer des graphiques de science des données personnalisés. Avec Dash, vous pouvez tout créer, des simples graphiques linéaires aux tableaux de bord complexes de plusieurs pages avec des widgets et des commandes interactifs. Parce qu'il repose sur des technologies open source telles que Flask, React et Plotly.js, Dash est hautement personnalisable et peut être facilement intégré à d'autres outils et workflows de science des données. Que vous soyez data scientist, analyste ou développeur, Dash peut vous aider à créer des visualisations attrayantes et informatives qui donnent vie à vos données.

# Commencer

Expand Down
30 changes: 15 additions & 15 deletions docs/fr/2-Publication/Datasette.md
Original file line number Diff line number Diff line change
@@ -1,8 +1,6 @@
# Aperçu

Datasette est une API JSON instantanée pour vos bases de données SQLite qui
permet d'explorer la BD et d'exécuter des requêtes SQL de manière plus
interactive.
Datasette est une API JSON instantanée pour vos bases de données SQLite qui permet d'explorer la BD et d'exécuter des requêtes SQL de manière plus interactive.

Vous pouvez trouver une liste d'exemples de datasettes
[ici](https://github.com/simonw/datasette/wiki/Datasettes).
Expand All @@ -13,30 +11,32 @@ Vous pouvez trouver une liste d'exemples de datasettes

## Exemple Datasette

Voici quelques captures d'écran du Datasette
[global-power-plants](https://global-power-plants.datasettes.com), vous pouvez
prévisualiser et explorer les données dans le navigateur, que ce soit par des
Voici quelques captures d'écran du Datasette [global-power-plants](https://global-power-plants.datasettes.com), vous pouvez prévisualiser et explorer les données dans le navigateur, que ce soit par des
clics ou des requêtes SQL.

![Prévisualisation des données](../images/datasette-preview.png)

Vous pouvez même explorer des cartes au sein de l'outil!

[Exécuter des requêtes SQL](../images/datasette-sql.png)
![Exécuter des requêtes SQL](../images/datasette-sql.png)

# Didacticiel vidéo
<!-- # Didacticiel vidéo
[![Click here for the video](../images/KubeflowVideo.PNG)](https://youtu.be/OPVfBKouBT8?t=214 "Advanced Analytics Workspace Kubeflow collaboration demo + tips and tricks")
[![Click here for the video](../images/KubeflowVideo.PNG)](https://youtu.be/OPVfBKouBT8?t=214 "Advanced Analytics Workspace Kubeflow collaboration demo + tips and tricks") -->

# Commencer

## Installation des Datasettes
## Installation de l'ensemble de données

Pour visualiser votre base de données dans votre bloc-notes Jupyter, créez le
fichier _bash_ suivant dans votre répertoire de projet, rendre le fichier
exécutable en utilisant `chmod +x start.sh` puis exécutez-le avec la commande
`./start.sh`. Accédez au serveur web en utilisant le **URL de base** avec le
numéro de port que vous utilisez dans le fichier ci-dessous.
Dans votre Jupyter Notebook, ouvrez une fenêtre de terminal et exécutez la commande `pip3 install datasette`.

<center>
![Installer l'ensemble de données](../images/InstallDatasette.PNG)
</center>

## Démarrage de l'ensemble de données

Pour afficher votre propre base de données dans votre bloc-notes Jupyter, créez un fichier appelé `start.sh` dans le répertoire de votre projet et copiez-y le code ci-dessous. Rendez le fichier exécutable en utilisant `chmod +x start.sh`. Exécutez le fichier avec `./start.sh`. Accédez au serveur Web à l'aide de l'**URL de base** avec le numéro de port que vous utilisez dans le fichier ci-dessous.

**start.sh**

Expand Down
12 changes: 6 additions & 6 deletions docs/fr/2-Publication/Overview.md
Original file line number Diff line number Diff line change
@@ -1,13 +1,13 @@
## Publication statistique

_De beaux graphismes sont importants dans la publication statistique car ils rendent les données plus accessibles et compréhensibles pour un public plus large._
_De beaux graphiques sont importants dans la publication statistique car ils rendent les données plus accessibles et compréhensibles pour un public plus large._

La publication est un aspect essentiel de la science des données et des statistiques. Il permet aux chercheurs de partager leurs découvertes avec la communauté scientifique au sens large, permettant à d'autres de s'appuyer sur leurs travaux et de faire avancer le domaine. En partageant ouvertement leurs données et leurs méthodes, les chercheurs peuvent recevoir des commentaires sur leurs travaux et s'assurer que leurs conclusions sont exactes et fiables.
La publication est un aspect essentiel de la science des données et des statistiques. Il permet aux chercheurs de partager leurs découvertes avec la communauté scientifique au sens large, permettant ainsi à dautres de sappuyer sur leurs travaux et de faire avancer le domaine. En partageant ouvertement leurs données et leurs méthodes, les chercheurs peuvent recevoir des commentaires sur leurs travaux et garantir que leurs résultats sont précis et fiables.

La publication permet aux chercheurs d'établir leur réputation et d'obtenir la reconnaissance de leurs travaux, ce qui peut aider à obtenir des financements et de futures opportunités de recherche. En outre, la publication des résultats de la recherche peut avoir des implications importantes pour les politiques publiques et la prise de décision, car les décideurs s'appuient souvent sur des preuves scientifiques pour prendre des décisions éclairées. Dans l'ensemble, la publication fait partie intégrante du processus scientifique et joue un rôle essentiel dans l'avancement des connaissances et la résolution de problèmes du monde réel.
La publication permet aux chercheurs détablir leur réputation et dobtenir la reconnaissance de leurs travaux, ce qui peut contribuer à obtenir des financements et de futures opportunités de recherche. En outre, la publication des résultats de la recherche peut avoir des implications importantes sur les politiques publiques et la prise de décision, dans la mesure où les décideurs sappuient souvent sur des preuves scientifiques pour prendre des décisions éclairées. Dans lensemble, la publication fait partie intégrante du processus scientifique et joue un rôle essentiel dans lavancement des connaissances et la résolution de problèmes du monde réel.

La publication statistique consiste à communiquer des informations statistiques à un public plus large à l'aide de diverses formes de médias, tels que des graphiques et des infographies. Avoir de beaux graphiques est important dans la publication statistique car cela rend les données plus accessibles et compréhensibles pour un public plus large. Des visualisations bien conçues peuvent aider à communiquer des concepts et des modèles statistiques complexes de manière claire et convaincante, permettant au public de saisir rapidement les principales idées et conclusions.
La publication statistique consiste à communiquer des informations statistiques à un public plus large en utilisant diverses formes de médias, tels que des tableaux, des graphiques et des infographies. Avoir de beaux graphiques est important dans la publication statistique car cela rend les données plus accessibles et compréhensibles pour un public plus large. Des visualisations bien conçues peuvent aider à communiquer des concepts et des modèles statistiques complexes de manière claire et convaincante, permettant au public de saisir rapidement les principales informations et conclusions.

De beaux graphismes peuvent améliorer l'impact global des publications statistiques, les rendant plus attrayantes et mémorables. Cela peut être particulièrement important lors de la communication d'informations importantes aux décideurs, aux acteurs ou au grand public, où la capacité à communiquer clairement et efficacement des informations basées sur les données peut être essentielle pour réussir.
De superbes graphiques peuvent améliorer limpact global des publications statistiques, les rendant plus attrayantes et mémorables. Cela peut être particulièrement important lors de la communication d'informations importantes aux décideurs, aux parties prenantes ou au grand public, où la capacité de communiquer clairement et efficacement des informations basées sur les données peut être essentielle pour réussir.

En résumé, la science des données et la publication de statistiques sont essentielles pour transformer des données complexes en informations significatives, et avoir de beaux graphiques est un aspect crucial pour communiquer efficacement ces informations à un public plus large.
En résumé, la science des données et la publication statistique sont essentielles pour transformer des données complexes en informations significatives, et disposer de superbes graphiques est un aspect crucial pour communiquer efficacement ces informations à un public plus large.
Loading

0 comments on commit 012c784

Please sign in to comment.