-
Notifications
You must be signed in to change notification settings - Fork 1
Suchmaschinenoptimierung
In standardisierten Geodateninfrastrukturen (wie z.B. GDI-DE, INSPIRE) sind Geo-Metadatendaten grundsätzlich nur über sehr spezielle Anwendungen auffindbar. Diese werden i.d.R. als Geodatenkataloge bezeichnet. Zwar gibt es ein - mehr oder weniger - einheitlich abgestimmtes Datenmodell (ISO-19115), sowie Encoding (ISO-19139), jedoch werden diese meist nur zum Austausch von Metadaten zwischen verschiedenen Katalogen verwendet.
Außerhalb der Infrastrukturen ist ihr Nutzwert sehr gering. Das liegt zum einen an der Komplexität, zum anderen auch an dem eingeschränkten Funktionsumfang der verwendeten Austauschschnittstelle (CSW 2.0.2). Nutzer haben in den Geoportalen und Geodatenkatalogen grundsätzlich die Möglichkeit nach Daten zu suchen und diese in gewissem Umfang auch direkt zu nutzen. Die in den Oberflächen angeboteten Suchfunktionen basieren i.d.R. auf eigenständigen Suchmaschinen (meist auf Basis von SOLR oder ElasticSearch), die eine umfangreiche Indizierung der vorhandenen Geo-Metadaten ermöglichen.
Bei den Infrastrukturen handelt es sich also um abgeschlossene Systeme für eine spezielle Community, deren Content für allgemeine Suchmaschinenbetreiber nicht besonders interessant ist. Um die Auffindbarkeit von Informationen in Suchmaschinen wie z.B. Google zu erreichen, werden s.g. SEO-Technologien eingesetzt (https://de.wikipedia.org/wiki/Suchmaschinenoptimierung). Es gibt verschiedene Möglichkeiten die eigenen Informationen für Suchmaschinenbetreiber verständlich bzw. auswertbar zu machen. Ein erster Schritt ist zur Optimierung ist i.d.R. die Anpassung der HTML-Repräsentation der jeweiligen Ressourcen (Onpage-Optimierung).
Neben der Indizierung von HTML-Seiten unterstützt bspw. Google schon länger die Suche nach Datensätzen: https://datasetsearch.research.google.com/help Hier werden sowohl das Markup von Schema.org (https://schema.org), als auch Strukturen im DCAT-Format unterstützt. Diese Informationen werden automatisch extrahiert und ausgewertet.
Um Geo-Metadaten auch über Suchmaschinen finden zu können, werden schon seit 2015 schema.org Informationen in Form der vereinfachten RDFa-Lite-Syntax (https://de.wikipedia.org/wiki/RDFa) in die HTML-Repräsentationen folgender Geo-Ressourcen integriert:
- dataset,
- layer,
- featuretype,
- wms,
- wfs,
- wmc
- Layer Metadaten im HTML-Format: https://www.geoportal.rlp.de/mapbender/php/mod_showMetadata.php?languageCode=de&resource=layer&layout=tabs&id=61680
- Auswertung über schema.org Validator: https://validator.schema.org/#url=https%3A%2F%2Fwww.geoportal.rlp.de%2Fmapbender%2Fphp%2Fmod_showMetadata.php%3FlanguageCode%3Dde%26resource%3Dlayer%26layout%3Dtabs%26id%3D61680
Das Anzeigetool für ISO-19139 Geo-Metadaten (dataset und service) erlaubt, neben der Aufkösung der Daten-Service-Kopplung, auch die Abfrage einer GeoDCAT-Repräsentation unter Nutzung von Content-Negotiation (https://de.wikipedia.org/wiki/Content_Negotiation). Die technische Grundlage für die Transformation bildet das von einer europäischen Arbeitsgruppe speziell für INSPIRE-Metadaten erstellte XSLT-Script (https://github.com/SEMICeu/iso-19139-to-dcat-ap). In der HTML-Variante des Anzeigetools werden ebenfalls schema.org Informationen integriert. Dieses Tool wird auch zur Anzeige von Geo-Metadaten aus anderen Katalogen (GDI-DE / INSPIRE) genutzt. Es kann sein, dass in der Google-Trefferanzeige die HTML-Variante des Anzeigetools höher gerankt ist, als die originären-Metadaten dieser verantwortlichen Institutionen.
- Metadatenanzeige eines Datensatzes aus dem GDK-DE im HTML-Format: https://www.geoportal.rlp.de/mapbender/php/mod_exportIso19139.php?url=https%3A%2F%2Fgdk.gdi-de.org%2Fgeonetwork%2Fsrv%2Fger%2Fcsw%3Frequest%3DGetRecordById%26service%3DCSW%26version%3D2.0.2%26Id%3D36bf5960-db7c-46cc-842c-f8a0df847e97%26ElementSetName%3Dfull%26OUTPUTSCHEMA%3Dhttp%3A%2F%2Fwww.isotc211.org%2F2005%2Fgmd&resolveCoupledResources=true
- Transformation in GeoDCAT: https://www.geoportal.rlp.de/mapbender/php/mod_exportIso19139.php?url=https%3A%2F%2Fgdk.gdi-de.org%2Fgeonetwork%2Fsrv%2Fger%2Fcsw%3Frequest%3DGetRecordById%26service%3DCSW%26version%3D2.0.2%26Id%3D36bf5960-db7c-46cc-842c-f8a0df847e97%26ElementSetName%3Dfull%26OUTPUTSCHEMA%3Dhttp%3A%2F%2Fwww.isotc211.org%2F2005%2Fgmd&resolveCoupledResources=true&outputFormat=rdf
- Auswertung über schema.org Validator: https://www.geoportal.rlp.de/mapbender/php/mod_exportIso19139.php?url=https%3A%2F%2Fgdk.gdi-de.org%2Fgeonetwork%2Fsrv%2Fger%2Fcsw%3Frequest%3DGetRecordById%26service%3DCSW%26version%3D2.0.2%26Id%3D36bf5960-db7c-46cc-842c-f8a0df847e97%26ElementSetName%3Dfull%26OUTPUTSCHEMA%3Dhttp%3A%2F%2Fwww.isotc211.org%2F2005%2Fgmd&resolveCoupledResources=true
Mit der Einführung der OGC-API-Feature Interfaces im Jahr 2019, werden semantische Informationen auch über die HTML-Version der jeweiligen Landing-Page publiziert (entprechen den alten WxS Capabilities). Dies führt dazu, dass die Landing-Pages direkt von Google indiziert und in der Trefferliste aufgeführt werden. Eine Auswertung der Google Trefferliste zeigt aber auch, dass Google sogar collections indiziert, obwohl diese selbst bisher über keine weitere semantischen Annotationen verfügen.
- Landing Page HTML: https://www.geoportal.rlp.de/spatial-objects/557
- Auswertung über schema.org Validator: https://validator.schema.org/#url=https%3A%2F%2Fwww.geoportal.rlp.de%2Fspatial-objects%2F557
- HTML-Repräsentation eines einzelnen Objektes: https://www.geoportal.rlp.de/spatial-objects/557/collections/gdi-rp:bplan_polygon/items/bplan_polygon.4790?f=html
- JSON-LD Context: https://www.geoportal.rlp.de/mapbender/geoportal/json/context/metadata_bplan.jsonld
- Auswertung des Objektes über schema.org Validator: https://validator.schema.org/#url=https%3A%2F%2Fwww.geoportal.rlp.de%2Fspatial-objects%2F557%2Fcollections%2Fgdi-rp%3Abplan_polygon%2Fitems%2Fbplan_polygon.4790%3Ff%3Dhtml