Nodabase.net

Hvad er Danmark værd?

Description

Oplysningerne om ejendomsvurdering, ejerforhold og adresser er allerede i dag offentligt tilgængelige på tinglysning.dk ved at søge på en adresse eller en matrikel. Det nye er, at DR’s Undersøgende Databaseredaktion har samlet oplysningerne i en form, der gør det muligt for redaktionen at analysere ejendoms-oplysninger på tværs af datasættet frem for alene at foretage enkeltopslag. Den omfattende database har ikke blot ført til en række analyser af ejendomsvurderinger og værdien af mursten i kommunerne. Redaktionen har også – med assistance fra DR Nyheders Erhvervs & Økonomi redaktion – iværksat undersøgelser af eksempelvis udenlandske ejendomsselskaber, den danske adels værdier og antallet rockerborge på landsplan. Undersøgelser, der alene er mulige at gennemføre, fordi journalisterne kan krydstjekke oplysninger på ejerforhold, områder, brancher eller postnumre – frem for at køre enkeltopslag på adresser.

Origin

Hvor meget er Danmarks ejendomme egentlig værd? Hvad er Danmarks dyreste byggeri? Hvem ejer egentlig landets største værdier i form af mursten? Det var jagten på svar til disse spørgsmål, der i efteråret 2016 satte DR Nyheders Undersøgende Databaseredaktion i gang med det største og mest komplicerede datascrabing-projekt siden vi blev etableret i 2013.

Data

Redaktionen har efter mange benspænd været nødt til at programmere et særligt program, der kunne indsamle data fra 48 servere hos Tinglysningen med oplysninger om ejendomme. Data blev hentet ned i en krypteret database i DR Byen, hvor redaktionen kunne krydskøre oplysningerne med henblik på at give ny, unik viden om ejerforhold og værdi af samtlige danske ejendomme. Kopien af Tinglysningen fylder 26 millioner rækker i en krypteret database. Databasen indeholder oplysninger om 3,5 millioner ejerforhold, 4,7 millioner kreditorer og 3,5 millioner matrikler samt 7,9 millioner servitutter. Oplysningerne er indhentet i perioden 30. august 2016 – 20. oktober 2016. Se evt. mere om metoden her: http://www.dr.dk/etik-og-rettelser/transparens/databaseredaktionen-saadan-hentede-vi-26-millioner-dataraekker-fra

Resources

Projektet har kørt sideløbende med mange andre opgaver på redaktionen, så det er svært at estimere præcis hvor mange ressourcer der er brugt. Et forsigtigt bud er 1 programmør, en grafiker og 2-3 journalister i cirka 2 måneder.

Impact

Det har været muligt at give et mere præcist udgangspunkt for debat om det danske ejendomsmarked. Det er ikke et projekt, der har væltet ministre – og det har aldrig været intentionen – men det er blevet muligt at få et fuldstændigt og præcist billede af status i forhold til danske ejendomme. Redaktionen har med afsæt i det omfattende datamateriale afsløret eller vist læserne, at nye regler fører til milliongevinst for de adelige godsejere i Danmark, at små ø-kommuner lever godt af sommerhuse, der stiger i værdi, at ejendomsvurderingerne rammer forkert på tværs af landet, at flere udlændinge opkøber danske ejendomme, hvor rockerne har slået sig ned rundt om i landet og hvilke ejendomme i landet, der er de dyreste.

Obstacles

Der er flere benspænd i processen.

Det største benspænd er, at Tinglysnings offentlige database har grænse på antal forespørgsler, der kan laves per ip-adresse (unik adresse på internettet) per dag.
De andre benspænd var lange svartider, nedbrud på bestemte forespørgsler og kapacitet på Tinglysningens servere. For at minimere risikoen for overbelastning af Tinglysningens servere valgte vi at køre to servere af gangen per time. Uden ip-begrænsningen ville én server være rigeligt. Men her oprettede vi 48 virtuelle servere hos en cloud-udbyder – samt en no-sql-database og en key-value-store.

Derudover har der været de sædvanlige, journalistiske benspænd med centrale kilder med moderat lyst til at udtale sig, hvad enten det er ejere af rockerborge, udenlandske investorer eller godsejere.

Go to case website
Built on WordPress by Smart Media AS