Mønstergjenkjenning

Mønstergjenkjenning ( Mønstergjenkjenning ) er evnen til å gjenkjenne et sett med dataregelmessigheter, repetisjoner, likheter eller regelmessigheter. Denne funksjonen ved høyere kognitive systemer er undersøkt for menneskelig oppfatning av kognitive vitenskaper som perseptuell psykologi , mens det for maskiner er forsket på av datavitenskap .

Typiske eksempler for utallige bruksområder er talegjenkjenning , tekstgjenkjenning og ansiktsgjenkjenning , oppgaver som menneskelig oppfatning gjør kontinuerlig og åpenbart uanstrengt. Imidlertid er den elementære evnen til klassifisering også hjørnesteinen i konseptdannelse , abstraksjon og (induktiv) tenkning og dermed til slutt intelligens , slik at mønstergjenkjenning også er av sentral betydning for mer generelle områder som kunstig intelligens eller datautvinning .

Mønstergjenkjenning hos mennesker

Denne evnen bringer orden i den opprinnelig kaotiske strømmen av sensorisk oppfatning . Det aller best studerte var mønstergjenkjenning i visuell oppfatning . Deres viktigste oppgave er identifisering (og påfølgende klassifisering) av objekter i omverdenen (se gjenkjenning av objekter ).

I perseptuell psykologi skilles det mellom to hovedtilnærminger for å forklare mønstergjenkjenning: " malteoriene " og " funksjonsteoriene ". Malteoriene antar at oppfattede objekter sammenlignes med objekter som allerede er lagret i langtidshukommelsen , mens funksjonsteoriene er basert på antagelsen om at oppfattede objekter blir analysert og identifisert ut fra deres "komponenter". To av de mest omfattende teoriene om egenskaper er "Computational Theory" av David Marr og teorien om de geometriske elementene ("Geons") av Irving Biederman .

Mønstergjenkjenning innen informatikk

Informatikk studerer prosesser som automatisk klassifiserer målte signaler i kategorier. Det sentrale poenget er anerkjennelse av mønstre , karakteristikkene som er felles for alle ting i en kategori, og som skiller dem fra innholdet i andre kategorier. Mønstergjenkjenningsprosesser gjør det mulig for datamaskiner, roboter og andre maskiner å behandle mindre presise signaler fra et naturlig miljø i stedet for presise innganger.

Den første systematiske forskningstilnærmingen til mønstergjenkjenning dukket opp på midten av 1950-tallet med et ønske om å sortere postleveranser med maskin i stedet for for hånd. I løpet av tiden dukket de tre nåværende gruppene av mønstergjenkjenningsprosesser opp med syntaktisk , statistisk og strukturell mønstergjenkjenning. Utnyttelsen av støttevektormaskiner og kunstige nevrale nettverk ble sett på som gjennombrudd på slutten av 1980-tallet. Selv om mange av dagens standardprosedyrer ble oppdaget veldig tidlig, ble de bare egnet for daglig bruk etter betydelige metodiske forbedringer og den generelle økningen i ytelsen til kommersielt tilgjengelige datamaskiner.

nærmer seg

I dag er det tre grunnleggende tilnærminger til mønstergjenkjenning: Syntaktisk, statistisk og strukturell mønstergjenkjenning. Selv om de er basert på forskjellige ideer, anerkjenner man fellestrekk som går så langt at en metode for en gruppe kan overføres til en metode for den andre gruppen uten betydelig innsats. Av de tre tilnærmingene er syntaktisk mønstergjenkjenning den eldste, den statistiske den mest brukte og den strukturelle den mest lovende for fremtiden.

Syntaktisk

Målet med syntaktisk mønstergjenkjenning er å beskrive ting ved å følge symboler på en slik måte at gjenstander i samme kategori har samme beskrivelser. Hvis du vil skille epler fra bananer, kan du introdusere symboler for rød (R) og gul (G) så vel som for langstrakt (L) og sfærisk (K); alle epler vil da bli beskrevet av symbolrekkefølgen RK og alle bananer med ordet GL. I dette tilfellet presenterer problemet med mønstergjenkjenning seg som et søk etter en formell grammatikk , dvs. etter et sett med symboler og regler for å kombinere dem. Siden en klar tilordning mellom funksjon og symbol vanligvis ikke er lett mulig, brukes metoder for sannsynlighetsberegning her. For eksempel kommer farger i utallige nyanser, men du må skille nøyaktig mellom rød og gul. Når det gjelder komplekse problemer, blir det faktiske problemet bare forsinket i stedet for å bli løst, og det er derfor denne tilnærmingen får liten oppmerksomhet og bare brukes til veldig klare oppgaver.

Statistisk sett

De fleste av dagens standardmetoder faller inn i dette området, spesielt støttevektormaskiner og kunstige nevrale nettverk nevnt ovenfor . Målet her er å bestemme sannsynligheten for at et objekt tilhører den ene eller den andre kategorien og til slutt å sortere den i kategorien med høyest sannsynlighet. I stedet for å evaluere funksjoner etter ferdige regler, måles de ganske enkelt her som numeriske verdier og oppsummeres i en såkalt funksjonsvektor . En matematisk funksjon tilordner så tydelig en kategori til alle tenkelige funksjonsvektorer. Den store styrken med disse metodene er at de kan brukes på nesten alle fagområder, og det kreves ingen dypere kunnskap om innbyrdes forhold.

Strukturelt

Strukturell mønstergjenkjenning kombinerer ulike syntaktiske og / eller statistiske prosesser til en enkelt ny prosess. Et typisk eksempel er ansiktsgjenkjenning, der forskjellige klassifiseringsmetoder brukes for forskjellige deler av ansiktet, for eksempel øyne og nese, som hver eneste sier om kroppsdelen det søkes etter er tilstede eller ikke. Overordnede strukturelle prosedyrer som Bayesian-nettverk kombinerer disse individuelle resultatene og bruker dem til å beregne det samlede resultatet, kategoritilhørigheten. Den grunnleggende funksjonen anerkjennelse er overlatt til generelle statistiske prosedyrer, mens høyere nivå inferens prosedyrer skaffe spesiell kunnskap om fagområdet. Strukturelle prosedyrer brukes spesielt til svært komplekse spørsmål som datamaskinstøttet deteksjon , datamaskinstøttet medisinsk diagnose.

Undertrinn for mønstergjenkjenning

En mønstergjenkjenningsprosess kan deles inn i flere deltrinn, som starter med anskaffelsen og til slutt en bestemt klassifisering. Under anskaffelsen registreres og digitaliseres data eller signaler ved hjelp av sensorer . Mønstre er hentet fra de fleste analoge signalene , som kan representeres matematisk i vektorer , såkalte funksjonsvektorer og matriser . Forbehandling foregår for å redusere data og forbedre kvaliteten . Ved ekstraksjon av funksjoner blir mønstrene i funksjonsutvinning transformert til et funksjonsrom. Dimensjonen til funksjonsrommet, der mønstrene nå er representert som punkter, er begrenset til de essensielle funksjonene under funksjonsreduksjonen . Det siste nøkkeltrinnet er klassifiseringen etter en klassifikator , som tildeler egenskapene til forskjellige klasser . Den klassifisering metode kan være basert på en læringsprosess ved hjelp av en prøve .

Skjematisk struktur av et mønstergjenkjenningssystem

Fange

Se også : signalbehandling , måling , digitalisering og måleteknologi

Forbehandling

For å kunne gjenkjenne mønstre bedre, foregår forbehandling ofte. Fjerning eller reduksjon av uønskede eller irrelevante signalkomponenter fører ikke til en reduksjon i dataene som skal behandles; dette skjer bare når funksjonen er hentet ut. Mulige forbehandlingsmetoder inkluderer signalgjennomsnitt , anvendelse av en terskelverdi og normalisering. De ønskede resultatene av forbehandlingen er reduksjon av støy og kartlegging til et jevnt verdiområde.

Funksjonsekstraksjon

Etter at mønsteret er forbedret ved forbehandling, kan forskjellige funksjoner oppnås fra signalet. Som regel gjøres dette empirisk i henhold til prosedyrer oppnådd gjennom intuisjon og erfaring, da det er få rent analytiske prosedyrer (f.eks. Automatisk funksjonssyntese). Hvilke funksjoner som er essensielle, avhenger av den aktuelle applikasjonen. Funksjonene kan bestå av symboler eller symbolkjeder eller kan fås fra forskjellige skaleringsnivåer ved hjelp av statistiske metoder . I den numeriske prosessen skilles det mellom prosesser i det opprinnelige området og prosesser i spektralområdet . Mulige funksjoner er for eksempel

Ved å bruke transformasjoner som den diskrete Fourier-transformasjonen (DFT) og den diskrete cosinustransformasjonen (DCT), kan de originale signalverdiene bringes inn i et mer håndterbart funksjonsrom. Grensene mellom metoder for funksjonsutvinning og funksjonsreduksjon er flytende. Siden det er ønskelig å få så få funksjoner som mulig, men derfor desto mer meningsfylt, kan forhold som kovarians og korrelasjonskoeffisienten mellom flere funksjoner tas i betraktning. Funksjoner kan dekorreleres med Karhunen-Loève-transformasjonen ( transformasjon av hovedaksen).

Funksjonsreduksjon

For å redusere karakteristikkene til de som er essensielle for klassifiseringen, kontrolleres hvilke egenskaper som er relevante for klasseseparasjonen og hvilke som kan utelates. Metoder for funksjonsreduksjon er variansanalysen , der det blir sjekket om en eller flere funksjoner kan skilles, og den diskriminerende analysen , der minst mulig separerbare ikke-elementære funksjoner dannes ved å kombinere elementære trekk.

Klassifisering

Det siste og essensielle trinnet med mønstergjenkjenning er klassifiseringen av funksjonene i klasser. Det er forskjellige klassifiseringsmetoder for dette formålet .

Levende vesener bruker for det meste nevrale nettverk for å gjenkjenne mønstre i signalene til sansene våre . Denne tilnærmingen blir analysert og imitert i bionikk . Den neuro informatikk har vist at nevralt nettverk er mulig læring og anerkjennelse av komplekse mønstre, skjer også i den ovenfor vist vei uten først en regel abstraksjon.

Etter klassifiseringen av mønsteret kan det forsøkes å tolke mønsteret. Dette er gjenstand for mønsteranalysen . I bildebehandling kan klassifiseringen av bilder følges av det som kalles bildegjenkjenning , dvs. bare gjenkjenning av objekter i et bilde uten å tolke eller analysere forholdet mellom disse objektene.

Se også

litteratur

  • Richard O. Duda, Peter E. Hart, David G. Stork: Mønsterklassifisering . Wiley, New York 2001, ISBN 0-471-05669-3 .
  • J. Schuermann: Mønsterklassifisering - Et enhetlig syn på statistiske og nevrale tilnærminger . Wiley, New York 1996, ISBN 0-471-13534-8 .
  • K. Fukunaga: Anerkjennelse av statistisk mønster . Academic Press, New York 1991, ISBN 0-12-269851-7 .
  • M. Eysenck , M. Keane: Kognitiv psykologi . Psychology Press, Hove, 2000.
  • H. Niemann: Klassifisering av mønstre . Springer, Berlin 1983, ISBN 3-540-12642-2 . ( online ).
  • Christopher M. Bishop: Mønstergjenkjenning og maskinlæring . Springer, Berlin 2006, ISBN 0-387-31073-8 . ( online ).
  • Monique Pavel: Grunnleggende om mønstergjenkjenning . 2. utgave. Dekker, New York 1993, ISBN 0-824-78883-4 .

weblenker

Individuelle bevis

  1. ^ E. Bruce Goldstein: Perseptuell psykologi . Spektrum Akademischer Verlag, Heidelberg 2002, ISBN 3-8274-1083-5