Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Export CSV with names from BGT #248

Open
PanderMusubi opened this issue Apr 27, 2018 · 6 comments
Open

Export CSV with names from BGT #248

PanderMusubi opened this issue Apr 27, 2018 · 6 comments

Comments

@PanderMusubi
Copy link
Collaborator

Siminal export as for BAG address as found in https://github.com/nlextract/NLExtract/tree/master/bag/test for names in BGT. On the resulting CSV, #247 can be developed.

@ivoknutsel
Copy link

The only texts in the BGT are in the openbareruimtelabel-s (ORL's). The text should be identical to the text of the corresponding BAG openbareruimte.

Current (as in not historical) texts can be found with :

select tekst, openbareruimtetype,bronhouder,lokaalid, identificatiebagopr
from openbareruimtelabel 
where eindregistratie is null
group by tekst, openbareruimtetype, bronhouder,lokaalid, identificatiebagopr
order by tekst;

openbareruimtetype is the type of public space. The allowed values are listed in the file 20140401_IMGEO-2.1-domeinwaardenlijsten.rdf
bronhouder is the registering organisation. The current organisations are listed on https://www.kadaster.nl/bgt-documentatie in the link "BGT Bronhoudercodes per 1-1-2018".
lokaalid is the uniqiue identification of the BGT object.
identificatiebagopr is the identification of the corresponding BAG object.

@fsteggink
Copy link
Member

Er komen toch ook wel andersoortige namen in voor, nl. buurt (315/279), stadsdeel (3/3), waterschap (0/0) en wijk (52/49). Tussen haakjes het aantal features gevolgd door het aantal keer dat de naam gevuld is. Ook functioneelgebied en openbareruimte (niet label!) hebben een kolom 'naam', maar die is niet gevuld. Echter, vanwege deze beperkte aantallen en vanwege het feit dat bijv. de CBS wijken en buurten dataset leidend is v.w.b. wijk- en buurtinformatie, zou ik ervoor willen pleiten om dit issue gewoon af te sluiten.

@PanderMusubi
Copy link
Collaborator Author

Toch hebben we interesse in deze namen, al zijn het er maar klein aantal. Op die manier kunnen we nagaan of de spellingcontrole ze ook ondersteunt of er misschien fouten in zitten. Onlangs gesproken met mensen van Kadaster en ze verwelkomen extra analyses en terugmelding op BAG (en andere collecties).

Is het ontbreken van een naam eigenlijk iets om terug te melden?

@fsteggink
Copy link
Member

Je bent van harte welkom om een PR in te dienen. Ik ga hier zelf geen tijd aan besteden.

@fsteggink
Copy link
Member

Of het ontbreken van een naam iets is om terug te melden: in principe zou je alles wat de BGT raakt kunnen terugmelden, maar de vraag is of bronhouders deze zaken op gaan pakken. Het is net alsof je besluit om bomen terug te gaan melden bij een bronhouder die heeft besloten om geen bomen in de BGT op te nemen.

@PanderMusubi
Copy link
Collaborator Author

Haha, natuurlijk alleen wat relevant is om terug te melden. Soms gaat het over typefouten of spelfouten. Ik pak deze op.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

4 participants