 |
|
 |
|
Ny søgemaskine til journalister kan måske ændre den
måde, vi tænker søgning på
Af Steffen Fog, steffenfog@mail.djh.dk,
studerende på Danmarks
Journalisthøjskole
Søgemaskinerne er kærkomne hjælpere for journalister
med fem-minutter-før-deadline sved på panden.
Men endnu er søgemaskinernes 'klogskab' begrænset. Og det
gælder både dem på nettet og dem, der baserer sig
på en (nyheds)-database. Det tager for lang tid at forklare dem,
hvad man mener, og hvad man søger. Teknologien fatter simpelthen
ikke, hvor man vil hen, og stadig må man bruge sin hjernes
regnekraft og intelligens for at kompensere for computernes og
søgemaskinernes manglende ditto.
Men fornylig er maskinerne kommet et lille skridt nærmere at
kunne matche den hvirvelvindsagtige hast, hvormed vores tanke flyver.
Og ikke tilfældigt hedder det lille københavnske it-firma
bag det ny skridt
Speed of Mind.
Et klogt
system
Firmaet har lavet en programmering og en teknologi, der udvider
brugerens muligheder for ikke bare at bestemme, hvad der bliver
søgt efter, men også hvordan.
Teknisk direktør i tomandsfirmaet og idémanden bag den ny
søge-algoritme Thomas Rask Thomsen forklarer:
"I traditionelle søgemaskiner som fx Google er
indekseringskriterierne statiske, dvs. de er de samme hver gang, de
redigeres, og ændres ikke. Hos os er indekseringskriterierne
dynamiske og kan redigeres af brugeren fra gang til gang, også
under en aktuel søgning."
Firmaet har netop indgået en aftale med Danmarks
Journalisthøjskole (DJH) om at lægge teknologien ud i en
portal under navnet MediePort,
så studerende,
kursister og lærere på skolen kan forsøge sig med
søgemetoden. Aftalen betyder, at skolen slipper for at
betale licens til Speed of Mind mod at levere evalueringer og
testresultater tilbage til firmaet.
Det indhold, der kan søges i, er en begrænset database af
nyheder fra Ritzau (tekst) og Nordfoto/Scanpix (fotos). Leveret gennem
Speed of Mind's søgemaskine.
Når man går ind på DJHs MediePort for at
forsøge sig, er det første vindue, der møder en,
en søgelinje, som man kender det fra andre
søgesteder. Ikke noget nyt dér. Ved siden af er
et par af de kendte funktioner fra søgemaskiner
(trunkering, and/or osv.), men også et par ny.
For det første er MediePort udstyret med en funktion, der
muliggør fonetisk søgning (på dansk), hvis man ikke
lige kan huske, hvordan søgeordet staves. Maskinen finder rask
væk alt om fx Bårnholm.
Ved siden af ligger funktionen, der kan gemme søgninger --
praktisk hvis man er igennem et længere researcharbejde og lige
skal finde tilbage til noget, man fandt forleden. I tillæg
sørger maskinen for at opdatere den gamle søgning med ny
data, hvis der er kommet nogen siden seneste
besøg.
Nøglen:
nøgleord
Den sidste funktion, hos DJH kaldet
‘nøgleord’, er den egentlige nyskabelse ved Speed of Mind's
produkt. Thomas Rask Thomsen forklarer:
"Generelt adskiller vores indekseringssystem sig ved sin hurtighed og
ved at være et ‘klogt’ system - altså det her med, at det
nemmere forstår, hvor det er, brugeren vil hen. Bag funktionen
‘nøgleord’ ligger en evne i vores system til at tage en
vilkårlig tekst og lynhurtigt scanne, hvad essensen af teksten
er. Og det resultat kan man så bruge i en ny søgning."
Thomas Rask Thomsens forklaring dækker over, at brugeren kan
bruge et søgeresultat som udgangspunkt til at redigere maskinens
indekseringskriterier, som så ændres og opdateres med det
samme, men kun for den specifikke bruger. Hvis man fx ved en simpel
søgning har fundet noget om regionskommunen på Bornholm og
skønner, at en bestemt nyhed i listen af søgeresultater
har ramt plet i forhold til det, man søger, vælger man
blot denne tekst ud og fortæller computeren, at det var netop
sådan noget, man søger. Derpå vil maskinen finde
tekster, der ligner.
Bag denne funktion ligger en indviklet tal-analyse og indeksering af
teksterne i den begrænsede database, baseret på statistik
og sandsynlighed, hvor alle ord vægtes efter et kompliceret
system, men Thomas Rask Thomsen prøver alligevel:
"Med den her funktion er brugeren i stand til mere præcist
at ramme en bestemt tekst-fortolkning. Vi har lavet en funktion, der
fortæller, hvorvidt et dokument er relevant i forhold til de
indtastede søgekriterier. Det gør maskinen ved at give en
række indikatorer for egenskaber ved dokumentet, som enten kan
betyde, at dokumentet er relevant eller irrelevant. Procentsatserne er
et udtryk for forholdet mellem, hvor hyppigt et ord forekommer i
databasens nyheder generelt og for, hvor hyppigt de forekommer i
teksten specifikt."
Og det, der så gør funktionen yderligere unik
ifølge Rask Thomsen, er brugerens mulighed for at redigere disse
indikatorer og denne rangering af ordene.
Perspektiver
De forretningsmæssige perspektiver og drømme for Speed of
Mind er mange og store. Egentlig havde tomandsfirmaets Rask Thomsen og
Henrik Karkov slet ikke tænkt på mediebranchen. Men da de
fik kontakt til CCI Europe
(hovedsæde i
Århus), der leverer it-systemer til aviser verden over, fik de
øjnene op for, at deres værktøj kan være
nyttigt for
mediefolk.
De to er overbevist om, at de her har leveret et redskab, som kan
effektivisere journalisters søgninger. De peger på, at
netop funktionen, hvor man kan klikke
på en nyhed og fortælle computeren, at den nyhed er et
eksempel på det, man søger, understøtter menneskets
natur om, at vi er bedst til at udtrykke, hvad vi mener, gennem
eksempler.
Og i forlængelse heraf eksemplificerer de:
"Vi tilbyder muligheden for, at brugeren danner sine egne
kategorier. På et bibliotek i den virkelige verden står
bøgerne jo ordnet efter et system, bibliotekaren har bestemt, og
de står ordnet ens, hver gang man besøger biblioteket.
Vores system svarer til, at bøgerne og hylderne står
anderledes efter hvert besøg, fordi
brugeren får lov at redigere i indekserings-kriterierne. Det
lyder enkelt, men teknisk er det kompliceret at få til at virke."
Bemærk:
Vi prøver at linke præcist. Men konsekvensen kan af og til
være, at brugerne møder et dødt link, fordi stoffet
siden er blevet flyttet til en ny plads på netstedet. Så
må I prøve at lede lidt på stedet.
|
 |
|
|
|
 |