e J o u r
FORSIDE
KONTAKT OS
MAILLISTE
ARKIV

Om eJour

Med tankens hast

Ny søgemaskine til journalister kan måske ændre den måde, vi tænker søgning på

Af Steffen Fog, steffenfog@mail.djh.dk, studerende på Danmarks Journalisthøjskole


Søgemaskinerne er kærkomne hjælpere for journalister med fem-minutter-før-deadline sved på panden.

Men endnu er søgemaskinernes 'klogskab' begrænset. Og det gælder både dem på nettet og dem, der baserer sig på en (nyheds)-database. Det tager for lang tid at forklare dem, hvad man mener, og hvad man søger. Teknologien fatter simpelthen ikke, hvor man vil hen, og stadig må man bruge sin hjernes regnekraft og intelligens for at kompensere for computernes og søgemaskinernes manglende ditto.

Men fornylig er maskinerne kommet et lille skridt nærmere at kunne matche den hvirvelvindsagtige hast, hvormed vores tanke flyver. Og ikke tilfældigt hedder det lille københavnske it-firma bag det ny skridt Speed of Mind.

Et klogt system

Firmaet har lavet en programmering og en teknologi, der udvider brugerens muligheder for ikke bare at bestemme, hvad der bliver søgt efter, men også hvordan.

Teknisk direktør i tomandsfirmaet og idémanden bag den ny søge-algoritme Thomas Rask Thomsen forklarer:

"I traditionelle søgemaskiner som fx Google er indekseringskriterierne statiske, dvs. de er de samme hver gang, de redigeres, og ændres ikke. Hos os er indekseringskriterierne dynamiske og kan redigeres af brugeren fra gang til gang, også under en aktuel søgning."

Firmaet har netop indgået en aftale med Danmarks Journalisthøjskole (DJH) om at lægge teknologien ud i en portal under navnet MediePort, så studerende, kursister og lærere på skolen kan forsøge sig med søgemetoden. Aftalen betyder, at skolen slipper for at betale licens til Speed of Mind mod at levere evalueringer og testresultater tilbage til firmaet.

Det indhold, der kan søges i, er en begrænset database af nyheder fra Ritzau (tekst) og Nordfoto/Scanpix (fotos). Leveret gennem Speed of Mind's søgemaskine.

Når man går ind på DJHs MediePort for at forsøge sig, er det første vindue, der møder en, en søgelinje, som man kender det fra andre søgesteder. Ikke noget nyt dér. Ved siden af er et par af de kendte funktioner fra søgemaskiner (trunkering, and/or osv.), men også et par ny.

For det første er MediePort udstyret med en funktion, der muliggør fonetisk søgning (på dansk), hvis man ikke lige kan huske, hvordan søgeordet staves. Maskinen finder rask væk alt om fx Bårnholm.

Ved siden af ligger funktionen, der kan gemme søgninger -- praktisk hvis man er igennem et længere researcharbejde og lige skal finde tilbage til noget, man fandt forleden. I tillæg sørger maskinen for at opdatere den gamle søgning med ny data, hvis der er kommet nogen siden seneste besøg.

Nøglen: nøgleord

Den sidste funktion, hos DJH kaldet ‘nøgleord’, er den egentlige nyskabelse ved Speed of Mind's produkt. Thomas Rask Thomsen forklarer:

"Generelt adskiller vores indekseringssystem sig ved sin hurtighed og ved at være et ‘klogt’ system - altså det her med, at det nemmere forstår, hvor det er, brugeren vil hen. Bag funktionen ‘nøgleord’ ligger en evne i vores system til at tage en vilkårlig tekst og lynhurtigt scanne, hvad essensen af teksten er. Og det resultat kan man så bruge i en ny søgning."

Thomas Rask Thomsens forklaring dækker over, at brugeren kan bruge et søgeresultat som udgangspunkt til at redigere maskinens indekseringskriterier, som så ændres og opdateres med det samme, men kun for den specifikke bruger. Hvis man fx ved en simpel søgning har fundet noget om regionskommunen på Bornholm og skønner, at en bestemt nyhed i listen af søgeresultater har ramt plet i forhold til det, man søger, vælger man blot denne tekst ud og fortæller computeren, at det var netop sådan noget, man søger. Derpå vil maskinen finde tekster, der ligner.

Bag denne funktion ligger en indviklet tal-analyse og indeksering af teksterne i den begrænsede database, baseret på statistik og sandsynlighed, hvor alle ord vægtes efter et kompliceret system, men Thomas Rask Thomsen prøver alligevel:

"Med den her funktion er brugeren i stand til mere præcist at ramme en bestemt tekst-fortolkning. Vi har lavet en funktion, der fortæller, hvorvidt et dokument er relevant i forhold til de indtastede søgekriterier. Det gør maskinen ved at give en række indikatorer for egenskaber ved dokumentet, som enten kan betyde, at dokumentet er relevant eller irrelevant. Procentsatserne er et udtryk for forholdet mellem, hvor hyppigt et ord forekommer i databasens nyheder generelt og for, hvor hyppigt de forekommer i teksten specifikt."

Og det, der så gør funktionen yderligere unik ifølge Rask Thomsen, er brugerens mulighed for at redigere disse indikatorer og denne rangering af ordene.

Perspektiver

De forretningsmæssige perspektiver og drømme for Speed of Mind er mange og store. Egentlig havde tomandsfirmaets Rask Thomsen og Henrik Karkov slet ikke tænkt på mediebranchen. Men da de fik kontakt til CCI Europe (hovedsæde i Århus), der leverer it-systemer til aviser verden over, fik de øjnene op for, at deres værktøj kan være nyttigt for mediefolk.

De to er overbevist om, at de her har leveret et redskab, som kan effektivisere journalisters søgninger. De peger på, at netop funktionen, hvor man kan klikke på en nyhed og fortælle computeren, at den nyhed er et eksempel på det, man søger, understøtter menneskets natur om, at vi er bedst til at udtrykke, hvad vi mener, gennem eksempler.

Og i forlængelse heraf eksemplificerer de:

"Vi tilbyder muligheden for, at brugeren danner sine egne kategorier. På et bibliotek i den virkelige verden står bøgerne jo ordnet efter et system, bibliotekaren har bestemt, og de står ordnet ens, hver gang man besøger biblioteket. Vores system svarer til, at bøgerne og hylderne står anderledes efter hvert besøg, fordi brugeren får lov at redigere i indekserings-kriterierne. Det lyder enkelt, men teknisk er det kompliceret at få til at virke."


Bemærk:
Vi prøver at linke præcist. Men konsekvensen kan af og til være, at brugerne møder et dødt link, fordi stoffet siden er blevet flyttet til en ny plads på netstedet. Så må I prøve at lede lidt på stedet.

Nr. 29 november 2003
Kontakt eJour, hnk@djh.dk