-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Metawal Valid : alerte indexation thesaurus InfraSig #897
Comments
Est-ce que c'est le même problème avec "Reporting INSPIRENO" en prod eg. https://metawal.wallonie.be/geonetwork/srv/fre/catalog.search#/metadata/409969f0-8f68-4edc-8c36-047c19599794 ? |
Je n'avais jamais remarqué en prod, ça a l'air d'être la même chose oui |
En local, j'ai, dans l'index http://localhost:9200/mw-records/_doc/999ef018-235f-4a38-94c9-cc0c79da61b8 {
"string": "indexingErrorMsg-keywordNotFoundInThesaurus",
"type": "warning",
"values": {
"keyword": "Open Data",
"thesaurus": "geonetwork.thesaurus.external.theme.infraSIG"
}
}
], En XML </mri:descriptiveKeywords>
<mri:descriptiveKeywords>
<mri:MD_Keywords>
<mri:keyword>
<gco:CharacterString>Extraction_DIGNO</gco:CharacterString>
</mri:keyword>
<mri:keyword>
<gco:CharacterString>BDInfraSIGNO</gco:CharacterString>
</mri:keyword>
<mri:keyword>
<gco:CharacterString>DGO3_BDREF</gco:CharacterString>
</mri:keyword>
<mri:keyword>
<gco:CharacterString>WalOnMap</gco:CharacterString>
</mri:keyword>
<mri:keyword>
<gco:CharacterString>Open Data</gco:CharacterString>
</mri:keyword>
<mri:keyword>
<gco:CharacterString>PanierTelechargementGeoportail</gco:CharacterString>
</mri:keyword>
<mri:keyword>
<gco:CharacterString>Reporting INSPIRENO</gco:CharacterString>
</mri:keyword>
<mri:type>
<mri:MD_KeywordTypeCode codeList="http://standards.iso.org/iso/19115/resources/Codelists/cat/codelists.xml#MD_KeywordTypeCode" codeListValue="theme" />
</mri:type>
<mri:thesaurusName>
<cit:CI_Citation>
<cit:title>
<gcx:Anchor xlink:href="https://metawal.wallonie.be/thesaurus/infrasig">Mots-clés InfraSIG</gcx:Anchor>
</cit:title>
<cit:date> Lors de l'indexation, la requête faite sur le thésaurus
Mais dans le thésaurus <rdf:Description rdf:about="https://metawal.wallonie.be/thesaurus/infrasig/Opendata">
<skos:prefLabel xml:lang="fr">Open data</skos:prefLabel>
</rdf:Description>
Donc j'aurai tendance à dire que c'est un problème de différentes versions du datadir (qui contient les thésaurus) dans les environnements. On peut déjà tester en valid de :
Ensuite on regarde les alertes restantes et mettre à jour les thésuarus dans github pour qu'on utilise les mêmes versions. |
Merci Francois pour l'explication. Ok pour moi je test ça demain matin. |
J'ai corrigé en VALID, cela me semble correct. |
Ca semble ok pour InfraSIG. Je suppose qu'on doit faire pareil pour |
Merci Marceau, voilà c'est fait. Je vois encore 65 Warnings, je regarde ça demain. |
Encore en valid : https://metawal.valid.wallonie.be/geonetwork/srv/fre/admin.console#/dashboard On peut regarder ensemble l'opération à faire ? |
Sans avoir regardé en détail, je dirais qu'on ajoute ça pour le classer dans le bon élément de l'index pour le Géoportail nouvelle version. |
Je propose de mettre à jour la règle dans le harvester avec: {
"condition": "count(./mdb:distributionInfo/mrd:MD_Distribution/mrd:transferOptions/mrd:MD_DigitalTransferOptions/mrd:onLine[cit:CI_OnlineResource/cit:linkage/gco:CharacterString[contains(.,'https://geoportail.wallonie.be/walonmap')]]) > 0 and count(./mdb:distributionInfo/mrd:MD_Distribution/mrd:transferOptions/mrd:MD_DigitalTransferOptions/mrd:onLine[cit:CI_OnlineResource/cit:applicationProfile]) < 1",
"xpath": "/mdb:MD_Metadata/mdb:distributionInfo/mrd:MD_Distribution/mrd:transferOptions/mrd:MD_DigitalTransferOptions/mrd:onLine[cit:CI_OnlineResource/cit:linkage/gco:CharacterString[contains(.,'https://geoportail.wallonie.be/walonmap')]]/cit:CI_OnlineResource",
"value": "<gn_add><cit:applicationProfile xmlns:cit=\"http://standards.iso.org/iso/19115/-3/cit/2.0\" xmlns:gco=\"http://standards.iso.org/iso/19115/-3/gco/1.0\"><gco:CharacterString>mw-gp-wom</gco:CharacterString></cit:applicationProfile></gn_add>"
} |
A vérifier, mais la règle dans le harvester ne sera plus nécessaire si on fait les modifications directement sur les fiches en prod |
59 erreurs restantes sur temp Dans les fiches Quelques avertissements qui reviennent souvent: pour infraSIG
autres thésaurus
|
J'ai fait un alignement des environnement en ce qui concerne les thésaurus ce matin... |
Les erreurs sont présentes en metawal-temp. Donc ça ne vaut pas la peine de les corriger puisque le contenu sera écrasé par le contenu de metawal.wallonie. Le filtre sur les erreurs est quand même bien pratique pour batcher les corrections ! |
Oui en fait c'est lié aux messages qui sont maintenant multilingues. Donc dans l'index, le champ erreur contient la même clé de base (ie. mot clé introuvable) et ensuite on a des variables qui indiquent quel mot clé. "indexingErrorMsg": [
{
"string": "indexingErrorMsg-keywordNotFoundInThesaurus",
"type": "warning",
"values": {
"keyword": "Open Data",
"thesaurus": "geonetwork.thesaurus.external.theme.infraSIG"
}
}
], Mais pas dans le même champ. Je vais voir si on peut faire une aggrégation sur les 2. |
Caractéristique du champ "indexingErrorMsg": {
"properties": {
"string": {
"type": "keyword"
},
"type": {
"type": "keyword"
},
"values": {
"type": "nested",
"properties": {
"keyword": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"record": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"schema": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"thesaurus": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
}
}
}
}
}, Une aggrgéation de type GET gn-records/_search
{
"aggs": {
"indexingErrorMsg": {
"terms": {
"field": "indexingErrorMsg.values.keyword.keyword"
}
}
},
"size": 0
} ne fonctionne pas. On pourrait faire: GET gn-records/_search
{
"aggs": {
"indexingErrorKeyword": {
"nested": {
"path": "indexingErrorMsg.values"
},
"aggs": {
"thesaurus": {
"terms": {
"field": "indexingErrorMsg.values.thesaurus.keyword"
},
"aggs": {
"keywords": {
"terms": {
"field": "indexingErrorMsg.values.keyword.keyword"
}
}
}
}
}
}
},
"size": 0
} mais on ne supporte pas le rendu des aggrégations de ce type (sur nested field + sub aggs) |
~ 750 fiches ont une alerte indiquant que le mot clé "Open Data" n'est pas dans le thesaurus InfraSig
Modifier la fiche corrige l'alerte (et le mot clé reste bien présent...)
Idem pour des mots clé HVD, mais là je suppose que je dois ré-intégrer le thesaurus ?
The text was updated successfully, but these errors were encountered: