Imputering
Imputering Er en statistisk metode som brukes for å beregne manglende verdier. Verdier kan være savnet eller av så lav kvalitet at de ikke kan brukes.[1] Man setter da inn verdier som antas å ligge nære den virkelige verdien basert på statistisk undersøkelse av andre med lignende verdier. Dett gjør man for å utligne skjevheter i resultatene[2] og for å kunne sammenligne på tvers av databaser. Det første av de kommersielle selskapene som begynte å bruke imputasjon i forbindelse med DNA var selskapet DNA.land, dette gjorde at de kunne sammenligne resultater på tvers av selskaper, da knyttet til å identifisere sykdomsrelaterte gener. Mens Myheritage var det første selskapet som brukte denne teknologien for å beregne treff med andre testere.[3] Myheritage skriver selv at der ikke alle verdiene er lest, brukes imputasjon, som de beskriver slik: det kan sammenlignes med å lese en setning der noen bokstaver mangler, men utfra sammenhengen kan vi likevel forstå hvilke bokstaver som mangler.<Store oppdateringer i Myheritage DNA-matching. Det vil altså si at man utfra sammenligningsgrunnlaget gjetter på hvilke verdier som mangler.
Diskusjonsfora, nyhetsgrupper
Referanser
- ↑ [Imputera – att ersätta saknade värden http://www.scb.se/hitta-statistik/artiklar/2017/Imputera--att-ersatta-saknade-varden/]
- ↑ Frafall og imputering
- ↑ Concepts-Imputations
Litteratur
- Zhang, Li-Chun: [https://www.ssb.no/a/histstat/not/not_9846.pdf Empirisk imputering
En ny metode for å behandle tilfeldig partielt frafall], Notat: SSB, 1998.
Eksterne lenker
- Imputera – att ersätta saknade värden
- Frafall og imputering
- DNA-explained (blogg): Concepts-Imputations
- Myheritage: Grunnleggende om DNA, kapittel 4: En ordliste