Antallet af anbragte pr kommune er omvendt proportionalt med skattegrundlaget

Af Mikael Hertig.
Gæsteforsker, cand. scient. pol.
Guest researcher, M of Sci. pol

Efterladt dreng med bamse

Forladt dreng med bamse

Abstract

Until now. the  causal relatun between local government  wealth and administrative removals from jome in Denmark has not been inverstigated. Denmark is administratively organized with 98 municipalitue/local governments with an average size of 60. 000 inhabitants.

It is comonly anticipated that the relation might have a suppression og repressive character. This simple research affirms that and proves that this relation explains 20 % of the removals.

 

Sammenfatning

De såkaldt “rige kommuner” anbringer væsentligt færre børn, og de “fattige kommuner”  anbringer flere.-
Det er selvfølgelig en alvorlig belastning for de fattige kommuners økonomi,.
Sammenhængen mellem beskatningsgrundlag  og andelen af anbragte børn i aldersgruppen 0-19 viser, at beskæatningsgrundlaget forklarer 20 % af hele variartionen. Det ligger indenfor det forventede niveau.

 

Det er forventeligt,. men aldrig bevist, at der er en sammenhæng mellem kommiunernes skattegrundlag og antallet af anbrragte per 0-19-årig. Det er bare ikke hidtil dokumenteret videnskabeligt. Denne artikel viser, at sammenhængen er klar nok.

 

Metode

Der er indhentet data fra Danmarks Statistik og fra Indenrigsministeriets Nøgletal.
Nogle små økommuner : Læsø, Samsø og  Fanø har ikke leveret data.  Data fremgår af nilagsfilen.
Derefter er det lavet en lineær regressionsanalyse.
For god ordens skyld er konfidensinterval efter sædvane anført. Men da datasættet er komplet, er der ikke tale om nogen stikprøve.

Afhandling

Det er formentlig en udbredt antagelse,  at “socialt udsatte”, som de lavere sociale lag ofte omtales i embedsværket,

Analaysen viser en omvendt proportionalitet mellem skattegrundlag og anbringelser. Ved anbringelser forstås her både “frivillige anbringelser” og “tvangsanbringels således, at jo flere rige borgere der bor i en kommune, des færre børn anbringes udenfor hjemmet.

Der er nu opåvist en sådan sammenhæng, som kan bidrage til at forjklare anbringelser med 20 % af samtlige anbragte.
Det væsen tlige her er, at der er tale om en ikke-juridisk, men en slag social sammenhæng

Srtiklen kan ses som et præliminært elelemt til yderligere undersøfgelser.

 

 

 


Teknisk beskrivelse

Regressionsmodellen har formen:
Y = 28,5876 – 0,00007933 × X

  • Hældningen (-0,00007933): Denne negative værdi betyder, at når X stiger med 1 enhed, falder Y i gennemsnit med ca. 0,00007933 enheder. Der er altså en negativ lineær sammenhæng mellem X og Y.

  • Afskæringen (28,5876): Når X = 0, forventes Y at være omkring 28,59. Den har dog sjældent selvstændig fortolkning, hvis X ikke realistisk kan være 0.


Statistisk betydning

  • P-værdi for hældningen: 5,17E-06
    Denne værdi er væsentligt under 0,05. Det betyder, at hældningen er statistisk signifikant — der er altså overbevisende evidens for en reel sammenhæng mellem X og Y.

  • t-statistik for hældningen: -4,84
    Et stort absolut t-tal (typisk >2) indikerer signifikans. Det bekræfter, at hældningen er signifikant forskellig fra nul.

  • 95% konfidensinterval for hældningen: [-0,0001119 ; -0,0000468]
    Hele intervallet ligger under nul, hvilket igen understøtter en negativ lineær sammenhæng.


Modelstyrke og forklaringskraft

  • R² = 0,203
    Modellen forklarer ca. 20,3% af variationen i Y. Det betyder, at X kun delvist kan forklare variationen — der er derfor andre faktorer, der påvirker Y.

  • Just. R² = 0,194
    Den justerede R² tager højde for antal variable. Da der kun er én uafhængig variabel, er forskellen lille, men den viser det samme: moderat forklaringsstyrke.

  • Standardafvigelse (Se): 5,91
    Residualernes standardafvigelse viser, hvor meget observationerne typisk afviger fra regressionslinjen.


ANOVA og modeltest

ANOVA-tabellen angiver:

  • F = 23,44

  • Signifikans F = 5,17E-06

Da Signifikans F ligger langt under 0,05, er modellen som helhed signifikant. Det betyder, at regressionslinjen forklarer en signifikant del af variationen i Y i forhold til blot at bruge gennemsnittet.


Samlet vurdering

  • Der er en signifikant negativ sammenhæng mellem X og Y.

  • Modellen forklarer dog relativt lidt af variationen (kun 20%).

  • Residualerne (forskellene mellem forudsagte og faktiske værdier) varierer en del, hvilket tyder på støj eller at modellen kunne forbedres.


Vil du have, at jeg også hjælper med at vurdere de enkelte observationer og residualer (f.eks. for at identificere outliers eller mønstre i fejlene)?

Outliers er selvfølgelige, fordi observationerne kommer fra danske kommujner. Fx vil Købwnhavn ligge fjernt fra alle andre. Kommunerne er jo forskellige.

X (årsag) er kommunens beskatningsgrundlag (“rigedom, målt på skattebetaling” of
Y (virkning) er antal anbragte 0-19 årig per 0-19-årig indbygger
Hypotesen i min artikel var, at der formentlig ville være en sådan negativ sammenhæng, blandet med andre årsager

Det giver rigtig god mening i din kontekst – og din fortolkning hænger fint sammen med, hvad regressionsanalysen viser.


Tolkning i lyset af kommunedata

Når X er kommunens beskatningsgrundlag (et udtryk for velstand), og Y er andel af anbragte børn og unge (0-19 år), peger din negative hældning på en meningsfuld sammenhæng:

  • Kommuner med højt beskatningsgrundlag (altså “rige” kommuner) har færre anbringelser pr. barn.

  • Kommuner med lavt beskatningsgrundlag har flere anbringelser pr. barn.

Det stemmer godt overens med din hypotese, at velstand og sociale problemer hænger omvendt sammen.


Outliers og variation

Som du selv bemærker, er outliers her forventelige, fordi danske kommuner varierer meget i både størrelse, befolkningssammensætning og socioøkonomisk struktur. For eksempel:

  • København og Frederiksberg vil typisk afvige, fordi de har stort befolkningstal, særlige sociale udfordringer samt et uforholdsmæssigt højt skattegrundlag.

  • Små kommuner med færre indbyggere får naturligt større udsving i andele, fordi enkeltstående tilfælde påvirker procenterne kraftigt.

  • Kommuner som Lolland, Bornholm eller Langeland kan ofte ligge som ekstreme værdier på den “socialt belastede” side.

Outliers i denne sammenhæng er derfor ikke fejl, men afspejlinger af virkelige strukturelle forskelle. Det gør R² på 0,20 både realistisk og rimeligt tolket i kommunal kontekst – du fanger en generel tendens, men ikke hele forklaringen.


Mulige næste skridt

Hvis du fortsætter arbejdet, kan du overveje:

  • At supplere modellen med yderligere forklarende variable, fx uddannelsesniveau, andel af enlige forsørgere, beskæftigelsesgrad eller socialt indeks.

  • At teste, om København og Frederiksberg har uforholdsmæssig stor indflydelse på hældningen (influensanalyse, Cook’s distance).

  • At anvende log-transformation af X og/eller Y, hvis du mistænker en skæv fordeling eller ikke-lineær relation.


Vil du have, at jeg hjælper med at formulere en skriftlig tolkning af resultaterne, som du kan indsætte direkte i din artikel (på fx et videnskabeligt eller journalistisk sprog)?

Prøv som supplemenmt at teste,. om København og Lolland påvirker hældningen specielt

For at teste om København og Lolland påvirker hældningen i din regressionsmodel signifikant, kan du anvende en influenceanalyse, specifikt ved at se på Cook’s distance for disse kommuner.


Fremgangsmåde:

  1. Beregn Cook’s distance for hver kommune.
    Cook’s distance måler, hvor meget hver enkelt observation (kommune) påvirker regressionsresultatet.

  2. Identificer påvirkede kommuner:
    Særligt kan man anvende en regel om, at observationer hvor Cook’s distance er større end 4/n (hvor n er antallet af observationer) betragtes som potentielle påvirkere.
    Alternativt kan man bruge en absolut værdi, fx D > 1, men for store datasæt er 4/n mere konservativt.

  3. Vurder København og Lolland:

    • Hvis disse kommuner har høj Cook’s distance (over threshold), kan det tyde på, at de påvirker hældningen i høj grad — altså “outliers” eller “indflydelsesrige observationer”.

    • Hvis de ligger under threshold, er deres påvirkning relativt lille.


Hvad kan jeg gøre nu?

  • For uddybning kan jeg beregne Cook’s distance for dine data, specifikt for København og Lolland.

  • Hvis du ønsker, kan jeg hjælpe med at lave den tekniske beregning eller guide til, hvordan du kan tjekke dette i dine regressionsværktøjer (fx R eller Python).

Vil du have, at jeg straks laver den analyse, baseret på dine data (eller en vejledning i, hvordan du kan gøre det selv)?

Det at der ikke er tale om en stikprøve, men at data dækker næsten alle danske kommuner (med manglende værdier kun for tre små ø-kommuner), betyder at du i princippet har den komplette population for analysen, og at der derfor ikke er statistisk usikkerhed relateret til stikprøveudtagning i traditionel forstand.

Men de små ø-kommuner kan have særlige karakteristika, som gør deres data anderledes og potentielt kan bryde med de generelle mønstre i resten af kommunerne. Det er også derfor, forskere og analyser ofte udelader disse (fx Læsø, Fanø, Samsø, Ærø) pga. deres størrelse og særlige strukturelle forhold, som kan medføre store udsving og påvirke analyseresultater.

Så:

  • Din analyse repræsenterer hele populationen af kommuner, så modelresultater skal tolkes som faktiske sammenhænge i denne population og ikke kun som estimerede sammenhænge i en stikprøve.

  • Det betyder til gengæld, at modelleresultater ikke har stikprøvebaseret konfidensinterval i egentlig forstand, men konfidensintervaller og p-værdier kan stadig bruges som måder til at vurdere modelstabilitet og præcision.

  • De manglende værdier for ø-kommunerne kan ikke stort påvirke dine resultater, men det kan overvejes at teste, om de udgør såkaldte outliers eller influencere pga. deres lille størrelse, som vi snakkede om med outlieranalyse.

Dette er et almindeligt forhold i kommunale data, hvor der ofte arbejdes med hele populationer, dog med stor forskellighed i kommunernes karakteristika og størrelse.

 

BILAG

Læs alle data og beregninger i denne fil

KommunaleSkattegrundlagioganbringelserudenforhjemmet

Post navigation

Leave a Reply

Your email address will not be published. Required fields are marked *