Imputering
Imputering Er en statistisk metode som brukes for å beregne manglende verdier. Verdier kan være savnet eller av så lav kvalitet at de ikke kan brukes.[1] Man setter da inn verdier som antas å ligge nære den virkelige verdien basert på statistisk undersøkelse av andre med lignende verdier. Dette gjør man for å utligne skjevheter i resultatene[2] og for å kunne sammenligne på tvers av databaser. Det første av de kommersielle selskapene som begynte å bruke imputasjon i forbindelse med DNA var selskapet DNA.land, dette gjorde at de kunne sammenligne resultater på tvers av selskaper, da knyttet til å identifisere sykdomsrelaterte gener. Mens Myheritage var det første selskapet som brukte denne teknologien for å beregne treff med andre testere.[3] Myheritage skriver selv at der ikke alle verdiene er lest, brukes imputasjon, som de beskriver slik: det kan sammenlignes med å lese en setning der noen bokstaver mangler, men utfra sammenhengen kan vi likevel forstå hvilke bokstaver som mangler.[4] Det vil altså si at man utfra sammenligningsgrunnlaget gjetter på hvilke verdier som mangler.
Diskusjonsfora, nyhetsgrupper
Referanser
Litteratur
- Zhang, Li-Chun: Empirisk imputering-En ny metode for å behandle tilfeldig partielt frafall, Notat: SSB, 1998.
Eksterne lenker
- Imputera – att ersätta saknade värden
- Frafall og imputering
- DNA-explained (blogg): Concepts-Imputations
- Myheritage: Grunnleggende om DNA, kapittel 4: En ordliste