Metoder for metadatakvalitet

Gjennom arbeidet med «Livssyklusprosess for definisjon og vedlikehold av begrepssystemer», SERES og informasjonsforvaltning i etatene, erfarte vi at begrepssystemene ofte blir store, de endres og må være i henhold til strenge regler for å være godt egnet til bruk. Bruk vil både være av personer i en etat som skal kunne forstå et og et begrep eller IT-systemer og portaler for elektronisk innrapportering som eksempelvis Altinn. Både avsender systemer til Altinn, Altinn og etatssystemer som tar imot data fra Altinn benytter begreper og begrepsmodeller.

Skal en kunne si noe om datakvalitet må man ha noe å måle kvalitet i forhold til. Det ble laget et sett av kvalitetsregler som burde gjelde for selve begrepssystemet. Vi etablerte et rammeverk hvor disse kvalitetsregler ble strukturert og delt bl.a. i regler for det enkelte begrep og regler for sammenhenger mellom begreper.

Høsten 2010 forelå det SKD modeller i begrepssystemene OR-etat og SERES. SERES modellene skulle brukes som dokumentasjon på at SERES kunne generere samme type XSD’er (XML modeller) som OR-etat. Utvalget av modeller vi brukte var SERES versjonen av SKD sine Altinn modeller. Semicolon laget en teknisk pilot som sjekket om disse SERES-modellen var i henhold til de nevnte kvalitetsreglene.

Kvalitetsreglene er supplement til regler som er håndhevet gjennom bruk av UML og SERES. Det ble funnet en del brudd på reglene og det ble diskutert om det var reglene som var feil eller om det var modellen som var feil. Vi konkluderte med at reglene med mindre endringer burde gjelde som kvalitetskriterier for begrepssystemer. Dette arbeidet er dokumentert i paperet «A data quality framework applied to e-government metadata: A prerequsite to establish governance of interoperable e-services.”

Med Skatteetatens modell som allerede bestod av over 80 000 noder, var behovet for automatisering av kvalitetskontroll stort. Behovet for å kunne analysere avhengigheter mellom begreper kom tydelig frem. Ved å etablere verktøystøtte for visualisering fikk vi frem nye muligheter. Vi hadde gjennom arbeidet erfart at det var mange regler på sammenhenger mellom begreper som ville være nyttig å jobbe mer med. Disse avhengighetene var vanskelig å lage tydelige logiske regler for. Vi valgte å jobbe med visualisering av grafen for å kunne hjelpe brukere å forstå sammenhengene, samt hjelpe dem å se etter mønstre som kunne danne grunnlag for nye logiske regler. Sett fra et informasjonsforvaltningsperspektiv og basert på livssyklusprosessen var det viktig å forstå konsekvensen av å endre et begrep, legge til et nytt, slette, hvordan vil endring påvirke andre begreper. Og hvordan vil historiske og gjeldende data, IT-systemer og rutiner bli påvirket av endringer i begrepsmodellen. Ved bruk av metoder og verktøy fra fagområder som grafteori med tilhørende open source verktøy for rettede grafer, sosiale nettverk og 3D grafer skapte vi nye muligheter for forvaltning og kvalitetssikring av begrepssystemer. Erfaringene fra dette arbeidet ble presentert i paperet «Visualization of Complex Relations in E-Government Knowledge Taxonomies.»

Siden dette arbeidet ble gjennomført har arbeidet med begreper og begrepsmodeller fått økt oppmerksomheten. Noen eksempler er:

  • DIFI har levert følgende innen metadataområdet de siste par årene:
  • SKD har etablert en egen gruppe som jobber med Generisk Metamodell Skatt, som består av ca 6 årsverk (2013).
  • NAV har pågående arbeid på begrepsmodeller i forbindelse med sitt moderniseringsprogram
  • SSB har lansert sin Nye SSB, hvor SSBs metadatasatsning kommer godt frem
  • SERES og Altinn er organisert som en organisasjon hos Brønnøysundregistrene for å sikre at metadata og metadataforvaltning knyttes tettere til tjenesteutvikling i Altinn.

Per i 2013 er det flere etater som er i gang med å etablere sine forvaltningsregimer for begrepsmodeller. Semicolons leveranser «Livssyklusprosess for definisjon og vedlikehold av begrepssystemer» og papers som beskriver rammeverk for metadatakvalitet gir gode innspill til både enkeltetater, DIFI og offentlige felleskomponenter.

This entry was posted in Resultater. Bookmark the permalink.

Comments are closed.