 |
|
 |
|
|
Spørg på dansk, få svar på svensk
|
Nordisk Netordbog vil gøre det muligt at søge
på tværs i de nordiske sprog
Af Ivar Christensen, ivar@christensen.net,
redaktør af Norsk
Ordboksamling
Når du søger efter information på svensk eller norsk
på nettet, kan en del ord skabe misforståelser.
At
"computer" hedder "pc" på norsk og "dator" på svensk, er
velkendt, men hvad med "brugergrænseflade"? Man forsøger
at ræsonnere og tror, det måske hedder
"brukargränsflate", men nej! Det hedder
"användargränssnitt" på svensk.
En svensker, som siger,
at barnet er i barnhagen, mener, at det er i kravlegården,
mens en nordmand tror, der er tale om en vuggestue.
Og nordmanden,
som købte en rolig hund fra Sverige, fik en livlig hund. En
"lathund" er derimod en
svensk brugsanvisning.
Man kan nok forstå en tekst på et andet nordisk sprog,
når man først har fundet frem til den; så ser man af
sammenhængen, hvad det betyder. Men skal man taste det
pågældende ord ind på sin
søgemaskine/sökmotor, går det ofte galt. Man skelner
her mellem aktiv og passiv
sprogforståelse. Resultatet bliver let, at man i stedet
søger på engelsk. Og det er synd, for mange informationer
på svenske og norske netsider kommer da ikke til danskernes
kundskab.
Nu er der hjælp på vej.
Nordisk
Råd
Med penge fra Nordisk Råd er et initiativ endelig iværksat
for at samle alle (et par mellomstore
og flest små) netordbøger for de nordiske sprog ude
på nettet og lave en fælles søgemaskine, som
dækker dansk, svensk, norsk og desuden også finsk og
engelsk.
Endnu er kun fællesordbogen Tvärslå
lagt ud. Senere vil man lancere søgemaskinen
Tvärsök (ingen URL endnu men omtalt her). Med den
vil man få hits på andre
sprog, når man søger på et dansk ord. En
ambition er at oversætte selve netstedet, man får op,
til dansk også. Men her er man afhængig af en automatisk
oversættermaskine dansk < > andre sprog.
Tvärslå
og Tvärsök danner tilsammen
projektet Nordisk
Netordbog, der er ved at blive sat i søen af en flok
samarbejdende forskere fra Danmark, Sverige, Norge, Finland og
Island. Ordbogen
vil blive tilbudt brugerne gratis.
Slå op
Fællesordbogen Tvärslå
har
indtil videre kun 17
netordbøger af forskellig kvalitet og
omfang, de fleste har ret få opslagsord.
Det er de samme små netordbøger, man bruger -- som ligger
derude i forvejen. Men OK, det er jo nemmere og hurtigere at
søge på ét sted; så må man
håbe, at det bliver bedre udbygget efterhånden.
Den
største ordbog er engelsk > svensk Lexin med 48.397 ord. Klik
på oversigtens
enkelte ordbøger for at få oplysning om hver ordbogs antal
ord. Af en eller anden grund er ikke medtaget den danske
Lexin, som har 7.000 danske ord, der oversættes til svensk.
Søg
Arbejdet med søgeprocesserne er placeret i delprojektet Tvärsök,
der ledes af docent Hercules
Dalianis ved Kungliga Tekniska
högskolan. Han arbejder også
for firmaet Euroling, hvis
søgemaskine SiteSeeker
danner fundament for Tvärsök-projektet og skal holde styr
på de mange hits på de små netordbøger.
Nordisk Ministerråd har bevilget 2,5
mio SEK til projektet, som bl.a. er begrundet i, at man ønsker
at
styrke de nordiske sprogs stilling i forhold til engelsk og at
fremme en
internordisk sprogforståelse. Norsk språkråd var med
til at udarbejde projektplan og kravsspecifikation. Mere i
pressemeddelelsen
fra Nordisk Ministerråd.
Nordiske navne?
Navnene Tvärslå og Tvärsök virker næppe
naturlige for en
dansker, så man må håbe, at de bliver døbt om
til mere genkendelige navne. Hvorfor ikke lancere et navn, som er det
samme overalt?
Hvad med at bruge Tværslå og
Tværsøg på dansk og Tverrslå og
Tverrsøk på norsk?
På islandsk og færøsk og
grønlandsk og finsk bliver det -- nej, det tør jeg ikke
engang tænke på!
Så her har vi allerede forvirringen.
Apropos sprog så skal man være opmærksom på, at
når sprogfolk taler om leksikon, mener man ikke en
encyklopædi, men en ordbank, en samling af
ord, en stor ordbog -- fx i citatet "I delprosjektet Tverrslå
utvikler vi en tverrspråklig nettordbok der både
menneskelige og maskinelle brukere skal kunne slå opp i alle
leksikon som er gjort tilgjenglige i prosjektet. Tverrsøk
anroper Tverrslå for å ekspandere søkestrengen til
andre språk." fra Universitetet i
Bergens forskergruppe
for sprogteknologi).
Eksempler
For at finde ud af præcist, hvad "tvär" hedder på
dansk,
måtte jeg arbejde en smule. Man kan tage det som eksempel
på, hvor besværlige tingene er i dag.
Som nordmand ville jeg
tro, "tvär" kunne passe med "tver", men
hvor tjekker jeg det?
Jeg forsøger med at skrive ”tver” på
Ordbogen.com og få ordet oversat fra dansk til
engelsk. Det giver ingen hits. Men Ordbogen.com er så
professionel, at den tager hensyn til, at mange skriver forkert.
Så
den giver andre forslag, et af dem er "tvær".
For en sikkerheds
skyld tjekker jeg de dansk-danske netordbøger og forstår,
at det nok hedder "tvær" på dansk. Den Danske Online Ordbog tilbyder
så mange alternativer,
at ordet "tvær" forsvandt for mig i
mængden, mens Retskrivningsordbogens
valg af
muligheder
var mere informativ.
Lad os teste Tvärslå
en smule. Jeg forsøger med sætningen
- Vad
kul at fika och äta mjukglass i liggstolen.
Jeg taster "mjukglas" (dvs softice) -- nej, det blev jo 0
hits! Det skal
være "mjukglass" -- med to s'er. Hvorfor kommer der så
ikke en meddelelse, hvor der står: Du mente måske
"mjukglass"? Men en sådan meddelelse kommer ikke frem. Nuvel,
Tvärslå er åbenbart ikke helt færdig endnu.
Så forsøger vi "fika" og får frem "drikke kaffe"; vi
går den anden vej og taster "drikke kaffe" og
får "fika" som hit på det -- så der er det i orden.
Når man så taster "kul", får man hele fire sider
med lister over alle mulige varianter af ordet, hele 55 hits. Hit nr
22 er det rigtigste, dvs det betyder jo ikke sjov eller skæg,
det er jo det engelske ordet "cool" -- så svaret er ikke helt
korrekt.
Flere tests underbygger fornemmelsen af, at ordbogsmaterialet er for
tyndt -- der er slet og ret for få ord i de ordlister og
ordbøger, man benytter sig af.
Om man dog bare kunne få samlet:
Da ville
man være nået langt.
Og det ville vi, fordi vi her har at gøre med seriøse
ordbøger, der rummer tilpas mange opslagsord til at gøre
nytte i søgninger. Desuden har de nordiske regeringer, som nu
lancerer Nordisk Netordbog, i forvejen
direkte eller indirekte finansieret flere af disse seriøse og
meget gode
netordbøger. Så er det ærgerligt, at man ikke kan
bruge dem nu, da indsatsen gælder de nordiske sprogs position i
forhold til engelsk.
Ordets
stamme
At en søgemaskine foreslår andre stavemåder er uhyre
vigtigt. For brugere af fx Google betragtes
det nærmest som en selvfølge.
Tvärsök-projektet har ambitioner
om at få det med i Nordisk Netordbog. Som Hercules
Dalianis skriver, er der en meget stor fejlprocent på
de søgeord, folk skriver, dels pga ortografisk usikkerhed,
dels pga hurtigheden. Bedre bliver det ikke, når man er usikker
på et andet sprog.
Teknologien bag søgemaskinen er afgørende her; man kan
bruge et såkaldt stemmer-program for at finde stammen i ordet,
hvorpå man linker til andre hits med samme stamme. Læs om
stemmer på
Wikipedia.
Kun få
på markedet
Brugere af de nordiske sprog kan uden tvivl få stor
fornøjelse af programmer som Tvärslå og
Tvärsök, for
efterspørgslen er langtfra dækket i dag. Der findes kun
fire programmer, som automatisk oversætter mellem de
skandinaviske sprog. Og kvaliteten er meget varieret, både
sprogfagligt og
datateknisk. To programmer er betalingstjenester (Tolken 99 og Tradusa), og to (TranslationWizard beta
og Foreignword)
er gratis -- men dårlige.
Så når Tvärslå og Tvärsök bliver fuldt
ud
operative, og SiteSeeker-teknologien er blevet implementeret -- med
andre ord
når Nordisk Netordbog er klar -- vil Nordisk
Ministerråd være godt på vej til at kunne tilbyde en
korrektion af dagens engelske dominans på netsøgning.
Læs mere
- Marianne Skovlunds program
på DR P1
om Nordisk Netordbog, sendt 28. juli 2006, bl.a.med interview med
Hercules
Dalianis.
- Liste
over 'falske venner', dvs ord der betyder noget andet, end man
tror /(svensk Wikipedia).
- Jamen,
det er da nemt at forstå! -- mere om falske venner
på folkeskolen.dk.
- TV-program om skandinavisk mesterskap i
språkforståelse
i serien ”Typisk norsk” sendt 21. april 2005 på NRK 1 med Petter
Schjerven. Læs
om programmet, se
programmet.
Bemærk:
Vi prøver at linke præcist. Men konsekvensen kan af og til
være, at brugerne møder et dødt link, fordi stoffet
siden er blevet flyttet til en ny plads på netstedet. Så
må I prøve at lede lidt på stedet.
|
 |
|
|
|
 |