Geodata A/S har fått masse velfortjent skryt for sin applikasjon som viser statistikk over trafikkulykker. Vi er selvsagt hemningsløst overbegeistret over at andre lager kule løsninger basert på de datasettene vi forvalter og gjør åpent tilgjengelig i vårt api.
Vårt motto: Åpne data er bra — åpne api’er er fantastisk!
Men — vi må dessverre også helle litt malurt i begeret: Tallene avviker en del fra den offisielle fasiten i NVDB, av flere grunner:
- Løsningen bruker et datauttrekk fra en tid tilbake. Når det skjer endringer i NVDB vil geodata-løsningen ikke fange opp disse — i hvert fall inntil Geodata lager oppdateringsrutiner for å fange opp alle endringer. (Med bruk av NVDB api’ets søkefunksjon og parameteren «endretdato» bør det være en smal sak)
- Geodata har filtrert ut en del ulykker der kvaliteten på koordinater og/eller egenskapsverdier var mangelfull. (Ja, vi vil svært gjerne ha NVDB ID på disse, slik at vi kan rette dem).
- Muligens er det også andre grunner til avvik…? Det kan ikke vi svare på.
Geodata har lovet å oppdatere sin «disclaimer» med riktig beskrivelse av datagrunnlaget… Vi venter i spenning!
Men i hvert fall – nå vet du hvorfor søk i vegkart eller NVDB api’et ikke gir identisk svar med Geodata sin løsning. Og hvorfor statistikken derfra må brukes med en viss varsomhet, i hvert fall inntil videre.
Har dette noe å si? Er ikke dette meningsløst flisespikkeri?
Tja… det spørs helt på hva man skal bruke dataene til. Jeg vil nok tro at Geodata sin webapplikasjon jevnt over viser et sannferdig bilde av ulykkesdata, fordeling og historikk. Jevnt burde avvikene i forhold til fasiten i NVDB være få og små (men vi har ikke sjekket det.) Til utforsking, «data drilling» og for å få et bilde av ulykkesfordeling i rom og tid — og gjerne filtrert på kjøretøy, skadegrad etc — så er applikasjonen et fantastisk verktøy! Men hvis man trenger offisielle tall og statistikk så bør man vite at denne løsningen ikke stemmer 100% med fasiten.