Evaluering

Evaluering eller evaluering , fra det latinske valere “sterk, verdt å være”, betyr riktig og profesjonell etterforskning og vurdering .

oversikt

Evaluering forstås vanligvis å bety vurdering eller vurdering av prosjekter , prosesser og funksjonelle enheter (f.eks. Enheter, objekter) så vel som: organisasjonsenheter . Kontekst, struktur, prosess, innsats og resultat kan inkluderes. Generelt kan en evaluering også forstås som den grunnleggende undersøkelsen av hvorvidt og i hvilken grad noe synes å være passende for å oppfylle et ønsket formål. I språklig bruk brukes evaluering, undersøkelse og analyse også synonymt i betydningen av et inventar uten noen spesiell formålsorientering.

Evalueringsområdet er for eksempel utdanning , sosialt arbeid , administrasjon , økonomi eller politisk rådgivning . For en evaluering blir data metodisk samlet inn og systematisk dokumentert for å gjøre etterforskningen, prosedyren og resultatene forståelige og verifiserbare. Standardprosedyrer for intern og ekstern datainnsamling er avhør , observasjon, overvåking , test , spørreskjema og materialanalyse. Evalueringen utføres ved å sammenligne de bestemte faktiske verdiene med tidligere eksplisitt definerte, operasjonaliserte og begrunnede målverdier på grunnlag av definerte indikatorer. Evaluering må oppfylle visse “kvalitetskriterier”: i tillegg til de grunnleggende kravene til nytte og objektivitet , er dette pålitelighet , validitet , økonomi og standardisering .

Evaluering fungerer som en retrospektiv kontroll av effektivitet, framsynt kontroll og forståelse av situasjoner og prosesser. På grunnlag av evalueringsdataene kan undersøkte prosesser justeres og optimaliseres. Avhengig av tidspunktet for distribusjon, skilles det mellom følgende typer evalueringer:

Forventende eller potensiell evaluering
Dette skjer før et tiltak.
Formativ evaluering
Den formative eller prosess-medfølgende evalueringen blir utført under et tiltak. Tiltaket undersøkes med jevne mellomrom og midlertidige resultater samles inn for å gjennomføre det best mulig og for å justere det i tilfelle uønsket utvikling. Disse nye tiltakene kan i sin tur evalueres. I tillegg er det en del av den formative evalueringen muligheten for å motta subjektive inntrykk fra de berørte (uten tilbakevirkende forvrengninger).
Summativ evaluering
En summativ evaluering er en evaluering som evaluerer resultatene, dvs. som finner sted etter at et tiltak er fullført. Dette gjør det mulig å oppsummere effektiviteten til et tiltak. Dette kan forholde seg til design, implementering, effektivitet og effektivitet.

Med forskningsevalueringen kombineres søken etter empirisk verifiserbarhet, men den undersøker spesifikke enkeltsaker og praktiske.

Ordopprinnelse

Ordet evaluering ble først brukt på fransk på 1800-tallet , og også på engelsk på begynnelsen av 1900-tallet . I USA har den vært i bruk i moderne termer siden 1930-tallet (siden Eight Years Study 1933–1941 av Ralph W. Tyler et al.). Tylers atferdskonsept ble kritisert og endret etter Sputnik-sjokket i 1957 i utdanningsreformen som fulgte. I Tyskland ble det engelske ordet evaluering tatt ut fra denne amerikanske tradisjonen på slutten av 1960-tallet; En samling oversettelser av engelskspråklige publikasjoner av Christoph Wulf var viktig for dette . en. i sammenheng med læreplanforskning . Ordet som betyr "evaluering" ble opprinnelig innsnevret til evaluering av spesielt utdanningsinstitusjoner (læreplanutvikling siden 1930-tallet). I mellomtiden, som i USA i lang tid, blir andre områder av sosial aktivitet også "evaluert" i Tyskland.

Avgrensning

I følge Balzer skiller faglig gjennomførte evalueringer seg fra hverdagsvurderinger i følgende kriterier:

  • knyttet til klart definert emne
  • utført av eksperter
  • Evaluering basert på nøyaktig definerte og avslørte kriterier (evaluering / vurderingskriterier)
  • Innhenting av informasjon gjennom empirisk datainnsamling
  • Systematisk evaluering av informasjon basert på visse regler

Balzer skiller ut: “Evaluering er en prosess ... der et evalueringsobjekt evalueres i henhold til tidligere definerte mål og kriterier som eksplisitt er relatert til fakta og begrunnet. Dette gjøres ved hjelp av samfunnsvitenskapelige metoder av mennesker som er spesielt kvalifiserte for dette. Produktet av en evalueringsprosess består i tilbakemelding av brukbare resultater i form av beskrivelser, velbegrunnede tolkninger og anbefalinger til så mange involverte og berørte som mulig for å optimalisere gjenstanden for evalueringen og støtte fremtidig handling. "

Den vurderingen av personer eller institusjoner som er knyttet til (ofte negative) sanksjoner må skilles fra vurderingen av tiltak som blir undersøkt for sin effektivitet og kan bli referert til som evaluering i sann forstand. En første undersøkelse gjennomføres på grunnlag av en målavtale, og det planlegges deretter tiltak som målene skal oppnås med. Deretter må det utvikles måleinstrumenter / vurderingskriterier som man kan sjekke om tiltakene har ført til suksess . Muligens etter midlertidige undersøkelser under gjennomføringen blir tiltakets suksess sjekket i en endelig undersøkelse for å lage nye målavtaler og for å komme inn i syklusen på nytt. De berørte bør bli deltakere, slik at prosessen kjører i samsvar og ikke bestemmes av utenlandske interesser og uklare kriterier.

Modeller

Det er i hovedsak tre forskjellige retninger i evalueringen:

Metodorientert

  • Målrettet evaluering ( Ralph W. Tyler )
  • Metodisk syn ( Donald T. Campbell )
  • Evaluerende forskning (EA Suchman)
  • Kausal generalisering (T. Cook)
  • Teoridrevet evaluering (H.-T. Chen)
  • Evaluering som kunst (LJ Cronbach)

Fordel-orientert

  • CIPP-modell (DL Stufflebeam)
  • Evalueringsforskning, politisk kontekst og opplysning (CH Weiss)
  • Utnyttelsesfokusert evaluering (MQ Patton)
  • De fire nivåene ( Donald Kirkpatrick )
  • Empowerment Evaluation (D. Fettermann)

Evalueringsorientert

  • Verdsettelse (M. Scriven)
  • Responsiv evaluering (RE-innsats)
  • 4. generasjon - konstruktivistisk evaluering (Guba og Lincoln)
  • Motstandsevaluering (Owens & Wolf)
  • Connoisseurship Model (EW Eisner)

Metoder

Bortz & Döring skiller mellom tre typer metoder:

Beskriver befolkningen

De "tillater en vurdering av fordelingen og bakgrunnen for en situasjon og letter definisjonen av målpopulasjonen."

Utforskende

De “tjener til å utforske intervensjonsprosesser og deres effekter. De tar sikte på formulering eller spesifisering av effekthypoteser og hjelper til med å identifisere og operasjonalisere de relevante variablene. "

Hypotesetesting

De "tester innflytelsen fra den undersøkte intervensjonen på meningsfullt operasjonaliserte virkningskriterier."

I 1976, i anledning en prøve på høyskolenivå i Nordrhein-Westfalen, formulerte Andreas Gruschka det som siden har blitt inkludert i manualene: "Kvalitetskriteriene for evalueringen er ikke lenger først og fremst gyldighet, pålitelighet og objektivitet, men kommunikasjon, intervensjon , åpenhet og relevans. "

Metoder for datainnsamling og databehandling er:

Områder

Viktige bruksområder er f.eks. B.

Kvalitetsstyring

Evaluering har lenge vært en integrert del av kvalitetsstyring ( TQM , ISO 9000 , 2Q, Q2E). I EFQM-modellen er evaluering z. B. kreves for å registrere resultatene (av arbeidet) med kunder, ansatte og samfunnet. Evaluering fungerer her som et tilbakemeldingselement for proseskontroll i sammenheng med organisasjons- og kvalitetsutvikling. Det blir sjekket om inngrepene faktisk gir de ønskede resultatene eller effektene (årsak-virkning-forhold). Både subjektive data om oppfatningen av de berørte, dvs. ansatte og kunder, samt objektive ytelsesindikatorer som kan registreres internt i selskapet blir registrert.

I tillegg til evaluering av resultatene, krever EFQM-modellen også direkte evaluering av prosesser, intervensjoner og tiltak innen ledelse , strategi og personell. Det er her selvevalueringsmetoden brukes til å evaluere og til slutt forbedre prosessene. Bedriftens ledere og ansatte evaluerer seg selv, sine team og deres organisasjon ut fra spesifiserte kriterier. For å gjøre dette bruker du de mest objektive, pålitelige og gyldige instrumentene og metodene som er spesielt utviklet for kvalitetsstyring (QM). Anbefalinger for tiltak og endringstiltak er utledet på grunnlag av data, vurderinger og innhentet bevis.

Både selv- og eksterne evalueringer kan suppleres med benchmarking og dermed gjøres mer meningsfylte. Data fra andre sammenlignbare organisasjoner fungerer som målestokk. De gir standarder for å evaluere og tolke egne verdier og dermed ens egen situasjon. Ideelt sett kan konkret kontakt med de beste i bransjen også muliggjøre felles læring.

I tillegg til disse rent interne evalueringene er det sertifisering og eksterne evalueringer -zwecken påkrevd: eksterne uavhengige revisorer evaluerer organisasjonen ved hjelp av de samme kriteriene og gir sin stemme fra. De tradisjonelle tilnærmingene til EFQM eller ISO9000 er for det meste basert på veldig lineære årsak og virkning-modeller. Eksempler på andre tilnærminger er for eksempel de cybernetiske tilnærmingene til Fredmund Malik .

utdanning

Som et pedagogisk eller andragogisk teknisk begrep, betyr evaluering "metodisk registrering og berettiget evaluering av prosesser og resultater for bedre forståelse og utforming av et praktisk tiltak innen utdanning gjennom effektivitetskontroll, kontroll og refleksjon." Emnet for evaluering kan inkluderer prosesser og resultater fra Microdidactics så vel som macrodidactics . Videre kan hele programmer evalueres.

miljø

Så langt har miljøvern ikke vært et av de sentrale anvendelsesområdene i evalueringen verken i USA eller i Europa. Med noen få unntak er samfunnsvitenskapelige studier for å evaluere miljøproblemer ganske sjeldne, spesielt innen energiforbruk, støybeskyttelse og avfallsproduksjon, selv innenfor rammen av større politiske programmer.

En grunn er absolutt å se på den relativt lave anerkjennelsen av samfunnsvitenskapen som et kompetent kontaktpunkt i miljøspørsmål, som bare endret seg fundamentalt på 1990-tallet med tanke på manglende suksess i tiltak for å øke miljøbevisstheten. Etter at formelen miljøutdanning skaper miljøbevissthet og miljøbevissthet fører til en tilsvarende atferd ble tilbakevist av et stort antall samfunnsvitenskapelige studier og viktigheten av sosiale faktorer for miljømessig relevant individuell atferd ble påpekt, begynte miljødiskusjonen å åpne for sosiale vitenskapelige spørsmål og i økende grad forlatt synspunktet om at miljøproblemer kan løses utelukkende gjennom tekniske løsninger.

For øyeblikket er etterspørselen etter miljøevalueringer veldig bestemt av offentlige kunder. Kontraktene gjelder primært evaluering av politiske programmer eller individuelle prosjekter. Spesielt i internasjonale organisasjoner kan tendenser til utvikling av kvalitetskrav identifiseres, som er ment å forberede innføringen av miljøevalueringer som en standard prosedyre i gjennomføringen av politiske prosedyrer. I Tyskland, på føderalt og statsnivå, har de politiske myndighetene i beste fall tatt de første skrittene i denne retningen. På grunn av den store betydningen av evalueringer i by- og arealplanlegging, er det nødvendig å etablere samfunnsvitenskapelige miljøevalueringer ved å integrere dem i eksisterende, mer teknisk orienterte (planleggings) prosesser som f.eks. B. Det er enda mer sannsynlig at det forventes at miljøkonsekvensanalysen blir på regionalt og kommunalt nivå. I motsetning til dette er den private etterspørselen etter miljøvurderinger fra bedrifter så vel som foreninger og sivilsamfunnsorganisasjoner fortsatt veldig lav. Til tross for utviklingen av miljøledelsessystemer (f.eks. EMAS), har det ennå ikke vært mulig å integrere funnene fra samfunnsvitenskapelig evaluering i kvalitetsstyringssystemene til selskapene.

På tilbudssiden dominerer i det minste noen statsfinansierte forskningsinstitutter markedet. Imidlertid er det ingen institutter som spesialiserer seg utelukkende i å gjennomføre miljøvurderinger. Utviklingen ved Senter for evaluering ved Saarland University og Center for Sustainable Management (CSM) ved Lüneburg University går lengst her .

Selv i private konsultasjoner har bare noen få fokusert sine aktiviteter på samfunnsvitenskapelige miljøevalueringer. Eksempler som skal nevnes her er Institute for Social-Ecological Research (ISOE) og Institute for Ecological Economic Research (IÖW). I tillegg har etablerte miljøvitenskapelige institutter som Wuppertal Institute , Öko-Institut i Freiburg eller IFEU Institute i Heidelberg utvidet sine tilbud i retning av samfunnsvitenskapelig forskning, men uten å se dette som et primært forretningsområde og uten å gjennomføre tilsvarende utviklingsarbeid. Med tanke på de økende kravene som følger av begrepet "bærekraftig utvikling" for innføring av passende tiltak, kan det forventes en ekspansiv utvikling av evalueringsmarkedet og en progressiv profesjonalisering av tilbudet også i miljøsektoren, til tross for den vanskelige utgangsposisjonen.

Internasjonalt utviklingssamarbeid

Evalueringer i utviklingssamarbeidet har lang tradisjon. Fokuset er på evaluering av prosjekter og programmer.

Den uttalte evalueringskulturen innen utviklingssamarbeid skyldes hovedsakelig at midlene som brukes i prosjekter og programmer alltid måtte og må rettferdiggjøres overfor giverne.

Evalueringsmetoder i utviklingssamarbeidet er også sterkt formet av internasjonale avtaler, særlig tusenårsdeklarasjonen og Paris-deklarasjonen. Den såkalte ”harmoniseringen” som et generelt prinsipp for utviklingssamarbeid gjenspeiles for eksempel i kravet om felles evalueringer av aktørene. I Tyskland har statlige organisasjoner forpliktet seg til "enhetlig utviklingssamarbeid" og streber også etter en enhetlig tilnærming til evalueringer. Partnerland påtar seg i økende grad rollene til klienten og gjennomføringen av evalueringen.

Når det gjelder evalueringsobjektene, skifter fokus mer og mer fra evaluering av produksjonen som bevis på ytelse til å evaluere effektene (utfall og virkninger) av prosjekter og programmer innen utviklingssamarbeid. Man jobber med effektkjeder og sofistikerte evalueringsdesign, for eksempel B. den logiske rammematrisen ("Logframe").

Tradisjonelle evalueringskonsepter og metoder basert på lineære kausalitetsmodeller blir i økende grad stilt spørsmål ved og suppleret eller til og med undertrykt av cybernetiske tilnærminger. En utvikling som ligner den som for tiden foregår innen organisasjonsutvikling og evaluering. I tillegg til søket etter innovative (selv-) evalueringsmetoder (f.eks. Læringsspiral), fremstår (videre) utvikling av vitenskapelig funderte konsepter som grunnlag for evaluering - som f.eks. B. tjenestekvaliteten eller livskvalitetskonseptet - som spesielt viktig. Sammenlignet med andre næringer, som f.eks I utviklingssamarbeid, for eksempel utdanning eller helse- og sosialtjenester , finner relativt lite vitenskapelig kunnskap (evidensbase) vei inn i evalueringen.

Organisasjoner

På det internasjonale området har organisasjoner som FN , EU , OECD , IMF , GIZ etc. sine egne evalueringsavdelinger, som i tillegg til å håndtere spesifikke spørsmål, også samler inn, utvikler og behandler generelle standarder og metoder.

I det tyskspråklige området er det German Evaluation Society, DeGeVal. Den har mange metodiske og sektorielle arbeidsgrupper og utsteder standarder, anbefalinger og retningslinjer for planlegging og gjennomføring av evalueringer. Flertallet av medlemmene kommer fra Tyskland og Østerrike. I tillegg er forskningsorganisasjoner som Senter for evaluering i Saarland eller proEval i Østerrike involvert i å profesjonalisere emnet for evaluering.

Se også

litteratur

  • Lars Balzer: Hvordan blir evalueringsprosjekter vellykkede? - En integrerende teoretisk tilnærming og en empirisk studie av evalueringsprosessen. Verlag Empirische Pädagogik, Landau 2005, ISBN 3-937333-24-X .
  • Wolfgang Beywl: Om videreutvikling av evalueringsmetoden. Grunnlag, oppfatning og anvendelse av en modell for responsiv evaluering. Peter Lang, Frankfurt am Main 1984.
  • Jürgen Bortz, Nicola Döring: Forskningsmetoder og evaluering for human- og samfunnsvitere. 4. utgave. Springer, Berlin 2006.
  • H. Kromrey: Evaluering - et komplekst konsept. Konsept og metode for evaluering og evalueringsforskning. Anbefalinger for praksis. Samfunnsvitenskap og profesjonell praksis 24 (2001), 105–129.
  • M. Ruep, G. Keller: Skoleevaluering . Frankfurt am Main 2007.
  • James R. Sanders: Handbook of Evaluation Standards. Standardene til "Joint Committee on Standards for Educational Evaluation", oversatt av W. Beywl og T. Widmer, 3. utgave, Wiesbaden 2006.
  • Reinhard Stockmann (red.): Håndbok for evaluering. En praktisk guide til handling. Waxmann, Münster og andre 2007.
  • H. Wottawa, H. Thierau: Evaluering av lærebok. 2. utgave. Hans Huber, Bern 1998.
  • H. Wottawa: Evaluering. I: A. Krapp, B. Weidenmann (red.): Pedagogisk psykologi. Beltz, Weinheim 2001, s. 649-674.

weblenker

Commons : Evaluering  - samling av bilder, videoer og lydfiler
Wiktionary: Evaluering  - forklaringer av betydninger, ordets opprinnelse, synonymer, oversettelser

Individuelle bevis

  1. ^ Evaluering - Duden , Bibliographisches Institut ; 2017
  2. Lars Balzer, Andreas Frey, Peter Nenniger: Hva er og hvordan fungerer evalueringsarbeid? Empirisk pedagogikk, Journal on Theory and Practice of Educational Research (1999), 13 (4), 393–413 [1]
  3. K. Götz: For evaluering av profesjonell opplæring. Deutscher Studienverlag, Weinheim; 1993
  4. Markus Pospeschill: Empiriske metoder i psykologi . teip 4010 . UTB, München 2013, ISBN 978-3-8252-4010-3 .
  5. Se Craig Kridel, Robert V. Bullough: Stories of the Eight-Year Study. State University of New York Press, New York 2007; Peter Hlebowitsh: Ralph W. Tyler (1902-1994) . Bidrag til testing og læreplanutvikling, rådgivende rolle, i: Education Encyclopedia, StateUniversity.com.
  6. Christoph Wulf (red.): Evaluering . Beskrivelse og evaluering av leksjoner, læreplaner og skoleprøver. Utdannelse i naturvitenskap og praksis 18, Piper, München 1972 ( innholdsfortegnelse ).
  7. a b L. Balzer: Hvordan blir evalueringsprosjekter vellykkede? - En integrerende teoretisk tilnærming og en empirisk studie av evalueringsprosessen. Empirical Pedagogy Publishing House, Landau 2005.
  8. ^ Marvin C. Alkin, Christina A. Christie: An Evaluation Theory Tree. I: Marvin C. Alkin (red.): Evalueringsrøtter. Spore teoretikernes synspunkter og påvirkninger . Thousand Oaks: Sage 2004, s. 12-65.
  9. Bortz & Döring 2005, s. 118.
  10. Andreas Gruschka (red.): Et skoleeksperiment blir sjekket . Evalueringsdesignet for høyskolenivå NW som et begrep aksjonsorientert ledsagende forskning, Kronberg 1976, s. 142–151; ofte sitert eller omformulert, f.eks. B. Bortz & Döring 2006 eller Reinhard Stockmann: Evaluering i Tyskland. I: Ders. (Red.): Evalueringsforskning : Grunnleggende og utvalgte forskningsfelt, Waxmann, Münster 3. A. 2006, s. 15–46, her s. 23.
  11. ↑ Gi en omfattende oversikt over det tyskspråklige området: Widmer, Thomas / Beywl, Wolfgang / Fabian, Carlo (red.) (2009): Evaluering. En systematisk manual. Wiesbaden: VS Verlag.
  12. ^ Jost Reischmann: Evaluering av videreutdanning . Gjør læringssuksess målbar, grunnleggende om videreutdanningshjelpemidler, Luchterhand, Neuwied 2003, s. 18; Augsburg 2. A. 2006.