Emner: LING123 Språk og data - Vår 2024
Studiepoeng
15.0Studiepoeng, omfang
15
Studienivå (studiesyklus)
Bachelor
Fulltid/deltid
-
Undervisningsspråk
Norsk, engelsk ved behov
Undervisningssemester
Vår
Undervisningsstad
Bergen
Mål og innhald
Emnet tek føre seg det formelle grunnlaget for beskriving av språk og datamaskinelle metodar for behandling av språk. Målet er å sette studentar i stand til å tenke på ein matematisk presis måte når dei karakteriserer eit språk, og å bruke dataverktøy og programmering for å prosessere tekst.
Emnet gjev ei innføring i formelle metodar i lingvistikken. Emnet gjev også ei innføring i digital koding av tekst, i elektroniske språkressursar (spesielt korpus), programmering (i t.d. Python som programmeringsspråk), språkprosessering og språkteknologiske bruksområde. Dette emnet eignar seg for studentar i lingvistikk, språkstudier, informatikk, informasjonsvitenskap, kunstig intelligens og kognisjonsvitskap.
Læringsutbyte
Kunnskapar
Kandidaten kan...
- dele opp ein komputasjonell prosess i mindre deler gjennom algoritmisk tenkning;
- forklare algoritmer og dataprogram for grunnleggjande behandling av digitale språkdata, t.d. tokenisering, n-gram, frekvensar og anna manipulering av tekst og tabellar;
- attgje og gjere greie for viktige eigenskapar av formelle språk, automatar og grammatikkar;
Ferdigheiter
Kandidaten kan...
- skrive og teste enkle dataprogram for grunnleggjande behandling av digitale språkdata, t.d. tokenisering, n-gram, frekvensar og anna manipulering og visualisering av tekst og tabellar;
- skrive og forklare regulære uttrykk for søk og erstatning i tekst;
- innhente tekst og annan informasjon fra verdsveven inn i dataprogram;
- gjennomføre viktige resonnement om formelle språk, automatar og grammatikkar.
Generell kompetanse
Kandidaten kan...
- kritisk vurdere bruk av digitale data og dataverktøy i lingvistikken;
- bruke tekstkorpus som empirisk materiale i lingvistiske problemstillingar;
- bruke korrekte matematiske formuleringar.
Krav til forkunnskapar
Ingen
Tilrådde forkunnskapar
EXFAC00SK eller tilsvarande.
Studiepoengsreduksjon
INFO132 (5 stp.), DATA110 (5 stp.), INF100 (5 stp.), INF620 (5 stp.), DIGI111 (2,5 stp.).
Krav til studierett
Emnet er ope for alle med studierett ved Universitetet i Bergen.
Arbeids- og undervisningsformer
Forelesingar (omkring 26 timar pr semester), sjølvstudium og øving, inkl. programmering på datamaskin.
Om det melder seg færre enn fem studentar til eit emne kan instituttet innføre redusert undervisning, jamfør instituttet sine retningsliner for dette på Mitt UiB. På emne der dette kan verte aktuelt vil studentane få informasjon om dette ved semesterstart, og før fristen for semesterregistrering 1. februar / 1. september.
Obligatorisk undervisningsaktivitet
Studenten skal levere to obligatoriske oppgåver, som må gjerast og godkjennast i undervisningssemesteret. Obligatorisk undervisningsaktivitet må vere godkjent før ein kan ta eksamen i emnet.
Vurderingsformer
Skriftleg skuleeksamen på 3 timar.
Eksamensoppgåva vil bli gitt på undervisningsspråket i emnet.
Eksamenssvaret kan leverast på norsk, svensk, dansk eller engelsk.
Hjelpemiddel til eksamen
Ingen hjelpemiddel er tillatne.
Karakterskala
A-F
Vurderingssemester
Vår.
Litteraturliste
Pensum består hovudsakleg av beskrivingar av formelle og datamaskinelle metodar, bl.a. instrukser og eksempler på programmering, ca. 400 sider.
Emneevaluering
Evaluering av tilbodet vert gjennomført i tråd med UiBs kvalitetssikringssystem.
Programansvarleg
Programstyret for språkvitskap, Institutt for lingvistiske, litterære og estetiske studium
Emneansvarleg
Programstyret for språkvitskap, Institutt for lingvistiske, litterære og estetiske studium
Administrativt ansvarleg
Programstyret for språkvitskap, Institutt for lingvistiske, litterære og estetiske studium
Kontaktinformasjon
E-post: studieveileder@lle.uib.no/studierettleiar@lle.uib.no