Konsensussekvens

Den konsensus-sekvensen er den sekvens av nukleotider eller aminosyrer som totalt avviker minst fra et gitt sett av tilsvarende mønster sekvenser. Den nøyaktige naturen til denne sekvensen kan variere avhengig av valg av avstand , for eksempel Hamming eller Levenshtein avstand .

Opprettelsen av en konsensus-sekvens er vanligvis basert på antagelsen om at de gitte sekvensene har en felles evolusjonær opprinnelse eller representerer et sekvensmotiv med en spesifikk biologisk oppgave, hvor det ofte kan være nyttig å formulere tvetydige konsensus-sekvenser.

Når det gjelder nukleinsyrer, kan basesymbolene i nukleinsyrenomenklaturen brukes til dette, dvs. i tillegg til de entydige basesymbolene A, C, G, T, U også, for eksempel R for enhver purinbase , Y for hvilken som helst pyrimidinbase eller N for hvilket som helst nukleotid.

Som regel opprettes konsensussekvenser heuristisk fra en multipel sekvensjustering (MSA). I det enkleste tilfellet er det elementet inkludert i konsensus-sekvensen som forekommer hyppigst i den tilsvarende kolonnen i MSA.

litteratur