Imputering: Forskjell mellom sideversjoner
Ingen redigeringsforklaring |
|||
(2 mellomliggende versjoner av 2 brukere er ikke vist) | |||
Linje 1: | Linje 1: | ||
'''Imputering''' | '''Imputering''' er en statistisk metode som brukes for å beregne manglende verdier. Verdier kan være savnet eller av så lav kvalitet at de ikke kan brukes.<ref> [http://www.scb.se/hitta-statistik/artiklar/2017/Imputera--att-ersatta-saknade-varden/ ''Imputera – att ersätta saknade värden''] </ref> Man setter da inn verdier som antas å ligge nære den virkelige verdien basert på statistisk undersøkelse av andre med lignende verdier. Dette gjør man for å utligne skjevheter i resultatene<ref> [https://www.ssb.no/forskning/statistiske-metoder-og-standarder/frafall-og-imputering ''Frafall og imputering''] </ref> og for å kunne sammenligne på tvers av databaser. Det første av de kommersielle selskapene som begynte å bruke imputasjon i forbindelse med DNA var selskapet DNA.land, dette gjorde at de kunne sammenligne resultater på tvers av selskaper, da knyttet til å identifisere sykdomsrelaterte gener. Mens Myheritage var det første selskapet som brukte denne teknologien for å beregne treff med andre testere.<ref> [https://dna-explained.com/2017/09/05/concepts-imputation/ ''Concepts-Imputations''] </ref> Myheritage skriver selv at der ikke alle verdiene er lest, brukes imputasjon, som de beskriver slik: det kan sammenlignes med å lese en setning der noen bokstaver mangler, men utfra sammenhengen kan vi likevel forstå hvilke bokstaver som mangler.<ref>[https://blog.myheritage.no/2018/01/store-oppdateringer-i-myheritage-dna-matching/ Store oppdateringer i Myheritage DNA-matching.]</ref> Det vil altså si at man utfra sammenligningsgrunnlaget gjetter på hvilke verdier som mangler. | ||
==Diskusjonsfora, nyhetsgrupper== | ==Diskusjonsfora, nyhetsgrupper== | ||
==Referanser== | ==Referanser== | ||
{{Referanser| }} | |||
==Litteratur== | ==Litteratur== | ||
Linje 10: | Linje 10: | ||
==Eksterne lenker== | ==Eksterne lenker== | ||
* [http://www.scb.se/hitta-statistik/artiklar/2017/Imputera--att-ersatta-saknade-varden/ ''Imputera – att ersätta saknade värden'' ] | * [http://www.scb.se/hitta-statistik/artiklar/2017/Imputera--att-ersatta-saknade-varden/ ''Imputera – att ersätta saknade värden'' ] | ||
* [https://www.ssb.no/forskning/statistiske-metoder-og-standarder/frafall-og-imputering ''Frafall og imputering''] | * [https://www.ssb.no/forskning/statistiske-metoder-og-standarder/frafall-og-imputering ''Frafall og imputering''] |
Siste sideversjon per 28. okt. 2023 kl. 17:55
Imputering er en statistisk metode som brukes for å beregne manglende verdier. Verdier kan være savnet eller av så lav kvalitet at de ikke kan brukes.[1] Man setter da inn verdier som antas å ligge nære den virkelige verdien basert på statistisk undersøkelse av andre med lignende verdier. Dette gjør man for å utligne skjevheter i resultatene[2] og for å kunne sammenligne på tvers av databaser. Det første av de kommersielle selskapene som begynte å bruke imputasjon i forbindelse med DNA var selskapet DNA.land, dette gjorde at de kunne sammenligne resultater på tvers av selskaper, da knyttet til å identifisere sykdomsrelaterte gener. Mens Myheritage var det første selskapet som brukte denne teknologien for å beregne treff med andre testere.[3] Myheritage skriver selv at der ikke alle verdiene er lest, brukes imputasjon, som de beskriver slik: det kan sammenlignes med å lese en setning der noen bokstaver mangler, men utfra sammenhengen kan vi likevel forstå hvilke bokstaver som mangler.[4] Det vil altså si at man utfra sammenligningsgrunnlaget gjetter på hvilke verdier som mangler.
Diskusjonsfora, nyhetsgrupper
Referanser
Litteratur
- Zhang, Li-Chun: Empirisk imputering-En ny metode for å behandle tilfeldig partielt frafall, Notat: SSB, 1998.
Eksterne lenker
- Imputera – att ersätta saknade värden
- Frafall og imputering
- DNA-explained (blogg): Concepts-Imputations
- Myheritage: Grunnleggende om DNA, kapittel 4: En ordliste