(ingen samanheng mellom dei to. ikkje tiltenkt, iallefall.)

idag: wikipresentasjon. særs samanfallande prosjekt frå dei to gruppene. konklusjon: studentar har like behov, og ein studentwiki vil naturlegvis ta utgangspunkt i desse – difor vil studentwikiar gjerne innehalde same element. det vart diskutert om wikiane våre verkeleg kunne kallast wiki sidan me insisterte på å kunna moderera innlegg – noko som strir med wiki-konseptet – noko av det grunnleggjande med ein wiki er at han er open for alle.

i wikidelen vart Vygotsky framheva nok ei gong – det er av di han med si Zone of proximal development legg vekt på at læring skjer i samhandling med andre, og slik samhandling kan ein rekna med å treffa borti i wikiarbeidet.

så var det korpuslingvistikken.
det gjekk hysterisk fort i svingane her, då me fekk gårsdagen sitt to timar lange føredrag på ein time.
korpus: samling av autentisk språkmateriale, skriftleg, muntleg og/eller kroppsspråk. materialet er spesielt tilrettelagt for språkvitskaplege undersøkjingar. i samband med denne tilretteleggjinga er sjølvsagt tekstkoding ekstremt viktig, for at ein kan undersøkja det ein vil i språkmaterialet. tilretteleggjinga gjer at ein korpus skil seg frå det me kallar eit arkiv, som gjerne er meir å forstå som eit slags bibliotek, der materialet er samla, men ikkje tilrettelagt for undersøkjingar. døme på arkiv: Ibsen-arkivet – alt Ibsen har skrive.

korpusbaserte metodar sitt mål er å testa ei språkhypotese opp mot det som faktisk kjem føre i språket. døme på språkhypotese: «kva for ord er dei mest brukte i norske avisene?»
– det gjev seg sjølv at det lyt mykje koding til, då ein korpus kan undersøkjast ut frå forskjellige kontekstar, som sosiologisk, grammatisk, leksikografisk und so weiter. korpusen må vera koda for alt dette og endå meir i utgangspunktet, ein legg ikkje på den kodinga ein treng etterkvart.

så vart me spurde, på eit tidspunkt i timen, kor mange av orda i ein tekst som kom føre berre ei gong i teksten? me trudde «få» «ikkje mange, nei» «kanskje 13%?» og liknande. men det er 50% av orda. så der fekk me tilbakevist språkhypotesa vår så det song etter. i vår tilfeldig valte skjønnlitterære tekst på 50 000 ord, som eg ikkje hugsar namnet på, men som me nytta i ordfrekvensundersøkjingssamanheng, utgjorde dei 15 mest frekvente (= mest brukte) orda 25% av heile teksten.

Advertisements