wikipedia stor

Nyt net bygges på danske Wikipedia

Information.dk lancerer det semantiske web.

Danske Wikipedia bliver ofte beskyldt for at være en bleg kopi af den engelske moder-udgave. Men nu får de danske Wikipedia-skribenter en hjælpende hånd, der måske kan sætte gang i leksikonet - og få de flygtende læsere til at vende hjem.

Dagbladet Information har taget hul på et ambitiøst projekt om at sætte data i system. Det indebærer blandt andet, at informationer fra Wikipedia og andre aviser og databaser bliver trukket ind på avisens hjemmeside.

Missionen er kort sagt at træde ind i det semantiske web. Idéen om at data kan tale sammen på kryds og tværs.

Ved hjælp af sprogteknologi bliver alle artikler opmærket semantisk. Det betyder, at ord som Barack Obama og Søren Gade ikke bare er simpelt tekst. De bliver automatisk autotagget med metadata, så de kan indgå i andre sammenhænge og forbindes til eksisterende databaser og artikler.

Konkret betyder det, at Information har skabt 40.000 emnesider om personer, organisationer, steder og emner. Man kommer ind på emnesiderne via en boks i toppen af de fleste artikler. Se for eksempel oversigterne over Dronning Margrethe og Island.  

Er Wikipedia god nok
Men Wikipedia DK bliver ofte kritiseret for at være langsom og lille sammenlignet med andre Wikipedia-sider. Er det ikke farligt at basere en tjeneste på danske Wikipedia?

”Jeg har selv været en hård kritiker af det danske Wikipedia. Men vi gør meget for at opfordre folk til at bidrage til Wikipedia. Så jeg håber, at vi via det her projekt kan bidrage til, at der kommer mere indhold på Wikipedia. Men faktisk er Wikipedia ret hurtig på nyhedsfronten. For eksempel blev der hurtigt opstartet en kategori med ”lømmelpakken”. Men det er klart, at når man ser på historiske opslag, så har Wikipedia sine svagheder,” siger Nikolai Thyssen, der er chef for digitalt indhold på Information til ComON.

Men det er heller ikke Wikipedia alene, der skal sætte artikler i kontekst hos Information.

Information henter også data fra Dbpedia, det engelske Wikipedia og Geonames. Og brugen af Open Linked Data betyder også, at Informations artikler kan komplimenteres af artikler fra New York Times, der også anvender Open Linked Data.

”Fremover kan vi kombinere vores egen dækning af eksempelvis krigen i Irak med New York Times' dækning og lang række andre kilder. Brugerne vil opleve, at vi ikke blot skriver nyheder fra dag til dag, men sætter disse i sammenhæng og skaber viden, der giver mening og indsigt,” uddyber Nikolai Thyssen.

260410
 Men når man ser på funktionen, så minder den meget om det vi kender som ”relaterede artikler” eller ”læs mere”.

”Jeg kan godt følge påstanden, men man skal forstå, at det her handler om metadata. Det er meget mere end at linke videre til gamle artikler. Det her giver helt nye muligheder. Vi er jo først lige begyndt, men snart kan vi forbinde vores artikler med CIA World Factbook og på den måde vil man for eksempel kunne bede om at se, hvilke artikler vi har skrevet om de 10 fattigste lande i de sidste 14 dage,” forklarer Nikolai Thyssen.

”Det er rigtig sjovt at lege med berigede metadata, for det er noget, som brager af sted i udlandet. For eksempel i det engelske med OpenCalais. Men det er skidesvært at opbygge og uforholdsmæssigt dyrt for et lille sprogområde som Danmark, så vi håber, at vi med vores projekt kan være med til at skabe en standard,” siger Nikolai Thyssen.

Information vil snart give omverdenen adgang til emnekataloget via api'er. Senere vil avisen også lave en professionel løsning til andre medier.

Ifølge Information er den danske avis blot den tredje i verden, der succesfuldt har indbygget forbundne data. De andre er BBC og The New York Times.

Kommenter denne artikel


Kommentarer

5 kommentarer

Hvilken dokumentation har artiklens forfatter for "de flygtende læsere" fra den dansksprogede udgave af Wikipedia?

Statistikken viser et fald på 5 procent fra januar 2009 til januar 2010, som ikke tyder på en flugt.

http://stats.wikimedia.org/EN/TablesPageViewsMonthly.htm

Kato 26 April 2010 kl. 22:20
@Sarangan: Hvor er det lige, at det du skriver har relevans i forhold til artiklen?

Hvis du mener, at man bare kan bruge Gtranslate fra den engelske wiki i stedet for at bruge fra den danske, kan jeg kun gentage Kim Møller's argument.

Mht til Google Translate generelt, kan det godt være det er den nemmeste løsning, men meget, meget langt fra den bedste. Den har klart sine grammatiske svagheder, og bør efter min bedste overbevisning kun bruges som vejledende brug, i stil med måden man benytter en ordbog.

Mads L 26 April 2010 kl. 18:49
Brug google translator for at oversætte.. Det er det nemmeste istedetfor at oversætte alt manuelt.
Sarangan 26 April 2010 kl. 16:13
Til vuzman:

Den engelske Wikipedia er temmelig svag når det gælder danske emner, hvoraf mange sikkert også ville falde for notablitietskriteriet da de kun har rent dansk interesse. Det er den danske Wikipedias styrke at det er den grundigste netleksikon mht til danske emner (Encyklopædien har måske flere artikler, men de er så tilgengæld væsentligt kortere, i de fleste tilfælde ikke mere end et par sætninger).

Kim Møller 26 April 2010 kl. 15:52
I stedet for at bruge tid på det danske Wikipedia, ville det så ikke være nemmere (og bedre) bare at lære engelsk?
vuzman 26 April 2010 kl. 11:20


301x202 ComOFF: iPad er stor nok til sumofingre
26/08, 08:02 Japanske sumobrydere får udleveret iPads for at forbedre kommunikationen.
404 Homer ComOFF: Farverige fejlsider
18/08, 13:10 De såkaldte 404-sider kan laves på mange måder.

Ansvarshavende chefredaktør: Jens Nielsen
Telefon: +45 39150305
Adresse: Carl Jacobsens Vej 16, 2500 Valby
© Mediaprovider A/S

Mediaproviders websites

Nyhedsbrev

Nyhedsbrevstilmelding

Modtag daglige opdateringer med nyheder fra denne side i din indbox. Indtast din mail adresse forneden.

Vælg hvilken version du vil have nyhedsbrevet i. Dette kan senere ændres nederst i mailen ved at klikke på "skift version"