Pruebas con AWS Textract DetectDocumentText sobre las imágenes extraídas de los documentos pdf.
https://data.controlciudadanopy.org/municipalidad/
downloadDate(%y-%MM-%dd)hashDocument(%Mon_%y).pdf
- https://boto3.amazonaws.com/v1/documentation/api/latest/index.html
- https://docs.aws.amazon.com/textract/latest/dg/detecting-document-text.html
- Realizar extracción de datos del block file basado en patrones del documento
- Analizar resultados con el modo AnalyzeDocument
- Probar el modo asíncrono
- Probar con archivo pdf de múltiples paginas
- Parsear resultados por página