e J o u r
FORSIDE
RIS, ROS, TIPS
MAILLISTE
ARKIV

Om eJour

Søg og du skal finde

Det har taget søgemaskinen 10 år at nå side nr 1.000.000.000.000

Af Lars Møller Hansen, lxh@dr.dk, medlem af eJours redaktionsgruppe


Hvad gjorde I egentlig dengang før internettet og Google?!

Det er et spørgsmål, jeg ofte stiller mine 'ældre' kolleger, når de over frokosten, en øl eller lignende fortæller om journalistiske bedrifter eller anekdoter, som går mere end 10-15 år tilbage.

Det kan lyde lidt arrogant, for som journalist udfører man nu engang sit arbejde med de redskaber, man har, men for en yngre journalist (28 år), der er vokset op med nettet og Google, er det svært at forestille sig en journalistisk hverdag uden disse værktøjer.

Tips til søgning

Faktisk er Google blevet uundværlig i det daglige arbejde, når jeg skal søge efter dokumenter, virksomheder, personer mm. Ofte oplever jeg, at Google giver bedre svar på søgninger end virksomhedernes egne søgemuligheder.

Google anses i dag som den største søgemaskine på nettet. Den blev oprettet i 1998 af to ph.d.-studerende ved Stanford University. De navngav søgemaskinen efter tallet googol, som er et af de største tal, der har et navn. Navnet skal lede tankerne hen på det enorme antal hjemmesider, Google holder styr på.

Men som så mange andre søgemaskiner giver Google mulighed for at indsnævre søgningen, så man ikke føler, man søger ud i det blå.
En billion indekserede netsider

En anden god mulighed for at begrænse sin søgning er gennem Google Indeks. Her er netsiderne samlet i kategorier efter emne som fx erhverv, nyheder og sport. Hvert emne har så flere underkategorier, som indsnævrer søgningen yderligere.

25. juli kunne Google meddele, at Google Indeks har rundet en billion indekserede netsider -- det vil sige et 1-tal efterfulgt af 12 nuller! Og det er vel at mærke en billion unikke sider.

I 1998 havde det første Google Indeks 26 millioner netsider, i 2000 rundede man en milliard sider, og nu er en ny milepæl på en billion altså nået.

Og hvordan finder Google så alle disse sider:

"We start at a set of well-connected initial pages and follow each of their links to new pages. Then we follow the links on those new pages to even more pages and so on, until we have a huge list of links. In fact, we found even more than 1 trillion individual links, but not all of them lead to unique web pages. Many pages have multiple URLs with exactly the same content or URLs that are auto-generated copies of each other. Even after removing those exact duplicates, we saw a trillion unique URLs, and the number of individual web pages out there is growing by several billion pages per day," fortæller software-udviklerne Jesse Alpert og Nissan Hajaj på Googles officielle blog.

Hvad søger vi efter?

I august er der kommet endnu en søgemulighed, Google Insights for Search, der giver et indblik i, hvad folk over hele verden søger efter netop nu. Statistikken har en geografisk opdeling, så det er muligt at se, hvad der hitter i bestemte byer og dele af Danmark.

Søgefunktionen kan fx bruges af virksomheder, som vil se, hvilke produkter der søges på i bestemte områder.

Men den vil også kunne bruges af journalister, som kan finde data til anderledes historier: Hvor i landet interesserer man sig fx mest for CO2/klimadebatten? Hvad er det, folk bekymrer sig om og søger svar på?

Nordjyske journalister kan her også blive forsikret om, at Paris Hilton ikke er en person, de behøver at ofre lige så stor opmærksomhed, som deres københavnske kolleger har måttet mobilisere. Interessen har været uens ud over landet. Hvis man har en Google-konto, kan man tilmed se de konkrete statistik-tal.

Cuil, en ny Google?

Selv om der i dag findes flere søgemaskiner som alternativer til Google, så har Google opbygget en meget stærk position. Men den position prøver en ny søgemaskine nu at rokke ved. Navnet er Cuil (udtales "cool"), som blev lanceret 28. juli af en gruppe tidligere Google-ansatte.

De mener at have skabt en søgemaskine, der er bedre end Googles:

"The Web continues to grow at a fantastic rate and other search engines are unable to keep up with it. Our significant breakthroughs in search technology have enabled us to index much more of the Internet, placing nearly the entire Web at the fingertips of every user. In addition, Cuil presents searchers with content-based results, not just popular ones, providing different and more insightful answers that illustrate the vastness and the variety of the Web," siger Tom Costello adm. direktør og medstifter af Cuil i en pressemeddelse i forbindelse med lanceringen.

Om Cuil virkelig er bedre, større og mere relevant end Google, må fremtiden vise. Et par test her i starten tyder på, at der er et stykke vej endnu:
  • TechCrunch: Google Beats Cuil Hands Down In Size And Relevance, But That Isn’t The Whole Story
  • DinSide fra norske Aller: En umulig oppgave?
  • Internetsøgning af bibliotekar Erik Høy: Cuil -- cool?

Bemærk:
Vi prøver at linke præcist. Men konsekvensen kan af og til være, at brugerne møder et dødt link, fordi stoffet siden er blevet flyttet til en ny plads på netstedet. Så må I prøve at lede lidt på stedet.


Nr 76 september 08
Kontakt eJour, hnk@update.dk, Danmarks Medie- og Journalisthøjskole