Stavekontroll

Skjermvisning (for manuell korrigering)

Stavekontroll refererer til programvarebaserte prosedyrer for å rette stave- eller skrivefeil i elektronisk tilgjengelige tekster. Formål med bruken er de klassiske kontorprogrammene , de tidligere brukte tekstbehandlingsprogrammene og skrivemaskiner med elektroniske skjermer, som tillater utskrift etter at hele teksten er fullført. Databaser , nettredaktører , e-postklienter , direktemeldinger , søkemotorer og mange andre programmer er nå også utstyrt med integrerte stavekontroller. Språkfeil er enten uthevet i farger og kan rettes manuelt fra spesifikke forslag eller korrigeres automatisk. ( Autokorreksjon )

Stavekontroll tidligere

Frem til 1990-tallet ble stavekontroll ofte implementert ved hjelp av enkle ordlister som den skrevne teksten ble sammenlignet med. Dette krever ikke komplekse algoritmer som ville ha krevd for mye datatid i de første dagene av datamaskinen. Ulempene er mange. På den ene siden blir sammensatte ord generelt gjenkjent som feil, med mindre de også er i ordlisten. Ord med prefikser og suffikser , partikler osv. Må også være i ordlisten for ikke å bli markert som feil. Det begrensede minnet krevde kompromisser; vanlige komposisjoner ble tatt i betraktning, sjeldne ikke. Imidlertid er andre ord, som sammensatte substantiver uten bindestrek, feil klassifisert som riktige.

Stavekontroll i dag

Med økende datakraft på dagens datamaskiner er bedre stavekontroller mulig, ofte til og med ved kontroll av grammatikk og orddeling .

Stavefeil

  • Anerkjennelse av bokstavsekvenser (inkludert strenger , Eng. Strings ) som ikke er vokabularet til det nåværende språket hører hjemme. Eksempler på ordet Fehler : Feler (utelatelse), Fehle t (erstatning), Fehl w er (innsetting), Feh el r (utveksling)
→ Denne saken kan rettes på relativt enkle måter. Korreksjonen programmet sammentegnstrenger som ikke finnes i ordlisten med ordbok oppføringer og velger de som forslag til løsninger som er mest lik den feilaktige tegnstreng (ordet). Den redigering avstand (også Levenshtein avstand ) mellom den feilaktige sekvensen og den foreslåtte korreksjons er minimal, noe som betyr at den feilaktige ord kan overføres til den foreslåtte korreksjons med så få forandringer som mulig.

Et annet eksempel:

  • Feil ord: Libe ; i leksikonet: kjærlighet , kropp . Levenshtein distanser: for kjærlighet : 1 (en utelatelse), for kropp : 2 (to utvekslinger) → første forslag til korreksjon: kjærlighet

Hvis den automatiske stavekontrollen antyder et galt ord, og dette blir vedtatt, snakker man om Cupertino-effekten .

Grammatiske feil

  • Anerkjennelse av ord som eksisterer, men som fører til en grammatisk feil når de brukes . Eksempel: Lag din gjestebok .
→ Denne saken kan ikke bli funnet av en ren, ordrelatert stavekontroll, men den kan bli funnet ved en grammatisk sjekk av setningen, siden her brukes en maskulin besittelsesartikkel ("dein en ") på en kastrering ("bok" ).

Semantiske feil

  • Ord som eksisterer, men som er i feil sammenheng. Eksempel: Hammeren spiser gress.
→ Denne saken blir ikke funnet av de to første korrigerende tiltakene. En semantisk test av teksten ville være nødvendig her; en funksjonalitet som ikke er tilgjengelig i konvensjonelle tekstbehandlingsprogrammer.

Forbindelser

Vanskeligheter oppstår også, spesielt med tyske tekster, på grunn av sammensatte ord . For ikke å la frekvensen av feil erklært som feil uttrykk bli for høy, godtar moderne staveprogrammer også komposisjoner som ikke er i standardordbøker (f.eks. "Bildungsmisere"). En ulempe ved denne metoden er at noen ganger semantisk meningsløse komposisjoner (f.eks. "Forgrunn", "hudmeldinger") ikke lenger vises som feil.

Se også

  • Ispell (International spell): Standard programvare for stavekontroll under Unix
  • GNU Aspell (Ispell-etterfølger): Gratis stavekontrollprogramvare for Unix-lignende systemer og Windows
  • Hunspell : Gratis og plattformuavhengig programvare for stavekontroll
  • LanguageTool : programvare for å kontrollere staving og grammatikk for flere språk