Word (teoretisk informatikk)

I teoretisk informatikk er et ord en endelig sekvens av symboler i et alfabet . I motsetning til den naturlige språkbetydningen av ord , som alltid har en uavhengig betydning, har et ord i teoretisk informatikk ingen språklig betydning. Det er bare et nytt begrep for en streng .

Ord eller ord er elementene i et formelt språk . De er derfor viktige for matematisk modellering , for teorien om programmeringsspråk , for beregbarhetsteori og andre områder av teoretisk informatikk.

definisjon

Det skal være et gitt alfabet og et naturlig tall fra settet med naturlige tall, inkludert null ( ). Et ord av lengde er en endelig sekvens med for alle .

Lengden på et ord er angitt som; antall ganger tegnet vises i ordet med . Et spesialord er det tomme ordet , som ikke består av noe symbol (har lengden 0) og vanligvis er representert med den greske bokstaven ( epsilon ) (som også finnes av og til). Settet med alle ord som kan dannes fra et alfabet er kløveraske og positivt omslag over dette alfabetet. Dette er den usammenhengende unionen

.

De ikke-tomme ordene er deretter følgelig den 'positive konvolutten'

.

Den forenklede notasjonen brukes ofte til å indikere et ord , men dette er bare mulig hvis alfabetet som brukes, tillater at symbolene som brukes, blir tildelt tydelig. Denne korte stavemåten kan ikke brukes med alfabetet , for eksempel fordi stavemåten ikke tydelig angir om ordet , eller er ment.

Ord med lengde kan forstås slik:

  • som endelige sekvenser (sekvens) - siden tupler kan forstås som sekvenser med endelig lengde
  • som elementer i det foldede kartesiske produktet - siden tupler også kan forstås på den måten

Eksempler

La det være alfabetet med latinske bokstaver og . Da er ordene og eksemplene på ord over og et ord er over . Du kan se det og er.

Operasjoner på ord

Sammenkobling

Den sammenkobling eller kjeden er en kombinasjon av to ord for å danne et nytt ord som er opprettet ved å forbinde de to symbolsekvensene. Sammenkoblingen av de to ordene og over et alfabet er indikert med eller og er definert av:

I henhold til definisjonen av ordet og med og for alle og . I følge definisjonen ovenfor er det et prefiks og et suffiks av ordet opprettet av sammenkoblingen . Lengden på et sammenkoblet ord tilsvarer summen av lengden på de enkelte (delvise) ordene. Så for hvert ord og :

,

og for den absolutte hyppigheten av et tegn :

.

Det nøytrale elementet i sammenkoblingen er det tomme ordet, siden det for ethvert ord gjelder at:

Siden sammenkoblingen også er assosiativ , utgjør trippelen en monoid fra settet med alle ord over ethvert alfabet , kombinasjonen av sammenkoblingen og det tomme ordet som et nøytralt element . Assosiativitet betyr at parenteser lett kan utelates:

I kontrast er ikke sammenkoblingen kommutativ ; H. ikke for alle ord, og det er sant . For eksempel:

makt

Den 'te kraft av et ord er definert som fold sammenkjeding av dette ord med seg Definisjonen av strømmen er vanligvis gitt rekursivt.:

   (for )

For eksempel:

I henhold til definisjonen av sammenkobling er lengden på -th kraften til et ord lik produktet av og lengden på :

,

og for den absolutte frekvensen til hvert tegn :

speilbilde

Den speiling eller omvendt av et ord resultater fra skriftlig bakover. Så hvis det er, så er den endelige sekvensen med og for alle . Så lengden på et ord er lik lengden på refleksjonen:

For eksempel gjelder følgende ord:

Det motsatte av et ord kan også defineres ved hjelp av strukturell induksjon over strukturen til det aktuelle ordet. For dette formålet definerer man det motsatte av det tomme ordet som det tomme ordet i induksjonsbegynnelsen. I induksjonstrinnet er det motsatte av et ord sammensatt av et delvis ord og et symbol definert som sammenkoblingen av symbolet med det motsatte av det delvise ordet:

Induksjonsstart:

Induksjonstrinn:

Slik kan det motsatte av et ord utledes trinnvis:

Et ord som , som er identisk med refleksjonen, kalles et palindrom . Matematisk sett dette speil-symmetriske ord enn de faste refleksjonspunktene R sett.

Prefiks, infiks og suffiks

infix

Et infiks er et tillegg i et ord. Hver endelig delsekvens av påfølgende symboler for et ord kalles et infiks eller delvis ord av ordet . Et infiks av et gitt ord er derfor hvert ord som det er (minst) ett for , som gjelder det på den ene siden og på den andre siden for hvert . I følge dette er et ord infiks av et ord hvis og bare hvis det holder at det er minst ett ord og ett ord fra Kleens konvolutt over alfabetet , slik at :

er infiks av

Hvis ordet med et infiks av ord , og , men ikke ordene , eller det tomme ordet . På mange dataspråk brukes det engelske ordet substring for Infix .

Spesielt er det tomme ordet et infiks av et hvilket som helst ord, og hvert ord er et infix av seg selv. Et infix av et ord som ikke er identisk med dette kalles et reelt infix .

prefiks

Et prefiks er et tillegg til begynnelsen av et ord. Et prefiks av et ord er derfor hvert infiks , som gjelder det og for hvert . Følgelig er prefikset for ordet hvis og bare hvis det er minst en fra Kleens konvolutt over alfabetet det ble generert fra, slik at :

er prefiks av

For prefikser er også hvert ord et prefiks for seg selv, og det tomme ordet er et prefiks for ethvert ord. Et prefiks av et ord som ikke er identisk med det kalles et ekte prefiks .

eksempel

Vær , dette er de virkelige prefiksene for :

  • .

suffiks

Et suffiks , også kalt postfiks, er et tillegg til slutten av et ord. I henhold til definisjonen av infikset er et suffiks av et ord hvert delord som det er ett for , som det er på den ene siden og for hver på den andre . Følgelig er et ord et suffiks av et ord med hvis og bare hvis det er minst ett slikt som er:

er suffiks av

Som med prefikser og infikser, gjelder det samme for suffikser at det tomme ordet er et suffiks av ethvert ord, og ethvert ord er alltid et suffiks av seg selv. Et suffiks av et ord som ikke er det samme som det kalles et ekte suffiks .

eksempel

Vær , dette er de virkelige suffiksene for :

  • .

litteratur

  • John E. Hopcroft , Jeffry D. Ullman : Introduksjon til automatteori, formelle språk og kompleksitetsteori . 3. korrigert utgave. Addison-Wesley, Bonn et al. 1994, ISBN 3-89319-744-3 ( International Computer Library ).
  • Katrin Erk, Lutz Priese: Teoretisk informatikk. En omfattende introduksjon . 2. utvidet utgave. Springer-Verlag, Berlin et al. 2002, ISBN 3-540-42624-8 , pp. 27-28 ( Springer lærebok ).
  • Gottfried Vossen, Kurt-Ulrich Witt: Grunnkurs i teoretisk informatikk. En applikasjonsorientert introduksjon - for studenter på alle datavitenskapskurs . 4. forbedret og forstørret utgave. Vieweg, Wiesbaden 2006, ISBN 3-8348-0153-4 , s. 15 ( online ).

Notater og individuelle referanser

  1. Begge flertallsformene er vanlige, jfr. B. dtv-Atlas zur Mathematik , bind I, ISBN 3-423-03007-0 , s. 245 versus Bauer, Goos: Informatik. Bind I, ISBN 3-540-06332-3 , s. 28.
  2. Klaus Reinhardt: Prioriterte betalingsautomater og synkronisering av halvsporsspråk , Fakultet for informatikk ved Universitetet i Stuttgart; PhD-avhandling 1994 (PDF; 509 KB)
  3. Is Dette er .
  4. Yuri L. Ershov, Eugenii A. Palyutin: Matematisk Logikk . Oversatt fra russisk av Vladimir Shokurov. Revidert fra den russiske utgaven 1979. Mir Publishers, Moskva 1984, s. 16 ( mirtitles.org ).
  5. ^ Definisjon av tuple og dens synonymer: Encyclopedia of Mathematics: Tuple
  6. Refleksjonen av et ord med lengden n er en spesiell selvinvers permutasjon
    .
    Refleksjonen av vilkårlig lange ord er da foreningen

weblenker