e J o u r
FORSIDE
RIS, ROS, TIPS
MAILLISTE
ARKIV

Om eJour

Spørg på dansk, få svar på svensk

Nordisk Netordbog vil gøre det muligt at søge på tværs i de nordiske sprog

Af Ivar Christensen, ivar@christensen.net, redaktør af Norsk Ordboksamling


Når du søger efter information på svensk eller norsk på nettet, kan en del ord skabe misforståelser.

At "computer" hedder "pc" på norsk og "dator" på svensk, er velkendt, men hvad med "brugergrænseflade"? Man forsøger at ræsonnere og tror, det måske hedder "brukargränsflate", men nej! Det hedder "användargränssnitt" på svensk.

En svensker, som siger, at barnet er i barnhagen, mener, at det er i kravlegården, mens en nordmand tror, der er tale om en vuggestue.

Og nordmanden, som købte en rolig hund fra Sverige, fik en livlig hund. En "lathund" er derimod en svensk brugsanvisning.

Man kan nok forstå en tekst på et andet nordisk sprog, når man først har fundet frem til den; så ser man af sammenhængen, hvad det betyder. Men skal man taste det pågældende ord ind på sin søgemaskine/sökmotor, går det ofte galt. Man skelner her mellem aktiv og passiv sprogforståelse. Resultatet bliver let, at man i stedet søger på engelsk. Og det er synd, for mange informationer på svenske og norske netsider kommer da ikke til danskernes kundskab.

Nu er der hjælp på vej.

Nordisk Råd

Med penge fra Nordisk Råd er et initiativ endelig iværksat for at samle alle (et par mellomstore og flest små) netordbøger for de nordiske sprog ude på nettet og lave en fælles søgemaskine, som dækker dansk, svensk, norsk og desuden også finsk og engelsk.

Endnu er kun fællesordbogen Tvärslå lagt ud. Senere vil man lancere søgemaskinen Tvärsök (ingen URL endnu men omtalt her). Med den vil man få hits på andre sprog, når man søger på et dansk ord. En ambition er at oversætte selve netstedet, man får op, til dansk også. Men her er man afhængig af en automatisk oversættermaskine dansk < > andre sprog.

Tvärslå og Tvärsök danner tilsammen projektet Nordisk Netordbog, der er ved at blive sat i søen af en flok samarbejdende forskere fra Danmark, Sverige, Norge, Finland og Island. Ordbogen vil blive tilbudt brugerne gratis.

Slå op

Fællesordbogen Tvärslå har indtil videre kun 17 netordbøger af forskellig kvalitet og omfang, de fleste har ret få opslagsord.

Det er de samme små netordbøger, man bruger -- som ligger derude i forvejen. Men OK, det er jo nemmere og hurtigere at søge på ét sted; så må man håbe, at det bliver bedre udbygget efterhånden.

Den største ordbog er engelsk > svensk Lexin med 48.397 ord. Klik på oversigtens enkelte ordbøger for at få oplysning om hver ordbogs antal ord. Af en eller anden grund er ikke medtaget den danske Lexin, som har 7.000 danske ord, der oversættes til svensk.

Søg

Arbejdet med søgeprocesserne er placeret i delprojektet Tvärsök, der ledes af docent Hercules Dalianis ved Kungliga Tekniska högskolan. Han arbejder også for firmaet Euroling, hvis søgemaskine SiteSeeker danner fundament for Tvärsök-projektet og skal holde styr på de mange hits på de små netordbøger.

Nordisk Ministerråd har bevilget 2,5 mio SEK til projektet, som bl.a. er begrundet i, at man ønsker at styrke de nordiske sprogs stilling i forhold til engelsk og at fremme en internordisk sprogforståelse. Norsk språkråd var med til at udarbejde projektplan og kravsspecifikation. Mere i pressemeddelelsen fra Nordisk Ministerråd.

Nordiske navne?

Navnene Tvärslå og Tvärsök virker næppe naturlige for en dansker, så man må håbe, at de bliver døbt om til mere genkendelige navne. Hvorfor ikke lancere et navn, som er det samme overalt?

Hvad med at bruge Tværslå og Tværsøg på dansk og Tverrslå og Tverrsøk på norsk?

På islandsk og færøsk og grønlandsk og finsk bliver det -- nej, det tør jeg ikke engang tænke på! 

Så her har vi allerede forvirringen.

Apropos sprog så skal man være opmærksom på, at når sprogfolk taler om leksikon, mener man ikke en encyklopædi, men en ordbank, en samling af ord, en stor ordbog -- fx i citatet "I delprosjektet Tverrslå utvikler vi en tverrspråklig nettordbok der både menneskelige og maskinelle brukere skal kunne slå opp i alle leksikon som er gjort tilgjenglige i prosjektet. Tverrsøk anroper Tverrslå for å ekspandere søkestrengen til andre språk." fra Universitetet i Bergens forskergruppe for sprogteknologi).

Eksempler

For at finde ud af præcist, hvad "tvär" hedder på dansk, måtte jeg arbejde en smule. Man kan tage det som eksempel på, hvor besværlige tingene er i dag.

Som nordmand ville jeg tro, "tvär" kunne passe med "tver", men hvor tjekker jeg det?

Jeg forsøger med at skrive ”tver” på Ordbogen.com og få ordet oversat fra dansk til engelsk. Det giver ingen hits. Men Ordbogen.com er så professionel, at den tager hensyn til, at mange skriver forkert. Så den giver andre forslag, et af dem er "tvær".

For en sikkerheds skyld tjekker jeg de dansk-danske netordbøger og forstår, at det nok hedder "tvær" på dansk. Den Danske Online Ordbog tilbyder så mange alternativer, at ordet "tvær" forsvandt for mig i mængden, mens Retskrivningsordbogens valg af muligheder var mere informativ.

Lad os teste Tvärslå en smule. Jeg forsøger med sætningen
  • Vad kul at fika och äta mjukglass i liggstolen.
Jeg taster "mjukglas" (dvs softice) --  nej, det blev jo 0 hits! Det skal være "mjukglass" -- med to s'er. Hvorfor kommer der så ikke en meddelelse, hvor der står: Du mente måske "mjukglass"? Men en sådan meddelelse kommer ikke frem. Nuvel, Tvärslå er åbenbart ikke helt færdig endnu.

Så forsøger vi "fika" og får frem "drikke kaffe"; vi går den anden vej og taster "drikke kaffe" og får "fika" som hit på det -- så der er det i orden.

Når man så taster "kul", får man hele fire sider med lister over alle mulige varianter af ordet, hele 55 hits. Hit nr 22 er det rigtigste, dvs det betyder jo ikke sjov eller skæg, det er jo det engelske ordet "cool" -- så svaret er ikke helt korrekt.

Flere tests underbygger fornemmelsen af, at ordbogsmaterialet er for tyndt -- der er slet og ret for få ord i de ordlister og ordbøger, man benytter sig af.

Om man dog bare kunne få samlet:
 Da ville man være nået langt.

Og det ville vi, fordi vi her har at gøre med seriøse ordbøger, der rummer tilpas mange opslagsord til at gøre nytte i søgninger. Desuden har de nordiske regeringer, som nu lancerer Nordisk Netordbog, i forvejen direkte eller indirekte finansieret flere af disse seriøse og meget gode netordbøger. Så er det ærgerligt, at man ikke kan bruge dem nu, da indsatsen gælder de nordiske sprogs position i forhold til engelsk.

Ordets stamme

At en søgemaskine foreslår andre stavemåder er uhyre vigtigt. For brugere af fx Google betragtes det nærmest som en selvfølge.

Tvärsök-projektet har ambitioner om at få det med i Nordisk Netordbog. Som Hercules Dalianis skriver, er der en meget stor fejlprocent på de søgeord, folk skriver, dels pga ortografisk usikkerhed, dels pga hurtigheden. Bedre bliver det ikke, når man er usikker på et andet sprog.

Teknologien bag søgemaskinen er afgørende her; man kan bruge et såkaldt stemmer-program for at finde stammen i ordet, hvorpå man linker til andre hits med samme stamme. Læs om stemmer på Wikipedia.
 
Kun få på markedet

Brugere af de nordiske sprog kan uden tvivl få stor fornøjelse af programmer som Tvärslå og Tvärsök, for efterspørgslen er langtfra dækket i dag. Der findes kun fire programmer, som automatisk oversætter mellem de skandinaviske sprog. Og kvaliteten er meget varieret, både sprogfagligt og datateknisk. To programmer er betalingstjenester (Tolken 99 og Tradusa), og to (TranslationWizard beta og Foreignword) er gratis -- men dårlige.

Så når Tvärslå og Tvärsök bliver fuldt ud operative, og SiteSeeker-teknologien er blevet implementeret -- med andre ord når Nordisk Netordbog er klar -- vil Nordisk Ministerråd være godt på vej til at kunne tilbyde en korrektion af dagens engelske dominans på netsøgning.

Læs mere
  • Marianne Skovlunds program på DR P1 om Nordisk Netordbog, sendt 28. juli 2006, bl.a.med interview med Hercules Dalianis.
  • Liste over 'falske venner', dvs ord der betyder noget andet, end man tror /(svensk Wikipedia).
  • Jamen, det er da nemt at forstå! -- mere om falske venner på folkeskolen.dk.
  • TV-program om skandinavisk mesterskap i språkforståelse i serien ”Typisk norsk” sendt 21. april 2005 på NRK 1 med Petter Schjerven. Læs om programmet, se programmet.

Bemærk:
Vi prøver at linke præcist. Men konsekvensen kan af og til være, at brugerne møder et dødt link, fordi stoffet siden er blevet flyttet til en ny plads på netstedet. Så må I prøve at lede lidt på stedet.

Nr 57 september 06
Kontakt eJour, hnk@djh.dk