IA² | Línea de comandos

Línea de comandos del proyecto IA²

Stack Tecnológico

Python, versión 3.10
Fire
Spacy , versión 3.4.4

Instalación

Build

make jupyter-build

Build and run(GPU)

make jupyter-run

Build & run (CPU)

make jupyter-run-cpu

Consideraciones

El proyecto no cuenta con datasets iniciales. Para construir nuestros dataset de entrenamiento y validación iniciales se utilizó la herramienta de etiquetado Dataturks.

La línea de comandos contiene herramientas para transformar el etiquetado Dataturks a datasets soportados por Spacy. Para más información consulte el comando de ayuda de la línea de comandos.

Circuito básico de prueba

El siguiente circuito de prueba contempla los siguientes procesos:

Adaptación del dataset. Creación de Docbin (Spacy V3).
Descargar un modelo de spacy para utilizar como modelo base.
Creación de un modelo base.
Agregar entidades al pipeline de reconocimiento de nombre de entidades del modelo base.
Ejecutar el entrenamiento.

Notebooks Train

Dentro de la carpeta 01_train, se encuentran las notebooks:

01_create_data : A partir de esta notebook se transforman los datasets etiquetados provenientes de Dataturks a Dockbin.
02_train: A partir de esta notebook se realiza el entrenamiento del modelo basado en es_core_news_lg
03_create_custom_pipeline: A partir de esta notebook se agregan nuevas reglas y realiza el deploy del modelo. Pipelines que se incluyen:

EntityRuler: entity_ruler.py
EntityMatcher: entity_matcher.py
EntityCustom: entoty_custom.py

Tests

Algunos tests utilizan un modelo de spacy para realizar pruebas sobre texto plano. Por esta razón es necesario generar un archivo .env, utilizando .env.example como base. La variable TEST_MODEL_PATH del achivo .env debe contener la ruta hacia un modelo. Luego puede utilizar el siguiente comando para correr las pruebas:

make test

Licencia

GNU General Public License version 3

Contribuciones

Por favor, asegúrese de leer los lineamientos de contribución antes de realizar Pull Requests.

Name		Name	Last commit message	Last commit date
Latest commit History 320 Commits
.devcontainer		.devcontainer
.github		.github
.gitlab		.gitlab
build		build
notebooks		notebooks
public/images		public/images
resources		resources
src/ia2		src/ia2
test		test
.dockerignore		.dockerignore
.env		.env
.gitattributes		.gitattributes
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
Makefile		Makefile
NER.md		NER.md
README.md		README.md
docker-compose.yml		docker-compose.yml
example_train_config.json		example_train_config.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IA² | Línea de comandos

Línea de comandos del proyecto IA²

Stack Tecnológico

Instalación

Consideraciones

Circuito básico de prueba

Notebooks Train

Tests

Licencia

Contribuciones

About

Releases

Packages

Languages

License

RomiLanda/ia2-cli

Folders and files

Latest commit

History

Repository files navigation

IA² | Línea de comandos

Línea de comandos del proyecto IA²

Stack Tecnológico

Instalación

Consideraciones

Circuito básico de prueba

Notebooks Train

Tests

Licencia

Contribuciones

About

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages