Semalt: Kuinka Wiki toimii eri kielillä?

Semalt- asiakasasiakkaiden menestyspäällikkö Oliver King kertoo, että Wikipedialla on laaja valikoima tietoja, artikkeleita ja sisältöä eri kielillä, ja toimittajia kehotetaan luomaan puuttuvat artikkelit tästä jättiläisestä tietosanakirjasta. On turvallista sanoa, että Wikipediaa on olemassa yli kolmesataa kieltä, mutta suurin osa niistä on epätäydellisiä ja suhteellisen pieniä. Ihmiset eri puolilta maailmaa käyvät Wikipediassa päivittäin ja lukevat sen yli 300 kieliversiota. Jotkut heistä etsivät erityisiä artikkeleita ja sisältöä, jotka ovat satoja tuhansia vapaaehtoisia kirjoittajia kirjoittaneet ja jotka vastaavat tämän kuuluisan ja ilmaisen tietosanakirjan rakentamisesta ja ylläpidosta. Wikipedian vierailijat hakevat artikkeleita enimmäkseen englanniksi, ja muiden kielten osuus Wikistä on 30 miljoonaa.

Demokratisoi tiedon saatavuus

Wikimedia-säätiön ja Stanfordin tietokoneasiantuntijat ovat onnistuneesti luoneet työkaluja auttaakseen eri kieliyhteisöjen kirjoittajia ja toimittajia arvioimaan puuttuvia artikkeleita. Yksi niistä auttaa tunnistamaan tärkeät artikkelit, joita ei vielä ole saatavana tietyllä kielellä. Toimittajat käyttävät sitten näitä suosituksia uusien artikkeleiden laatimiseen. Jos toimittajat ja kirjoittajat ovat monikielisiä, toisella kielellä olevien artikkeleiden löytäminen ja kääntäminen paikalliselle kielelle Wikipedian lukijoille on erittäin helppoa.

Joten tämä järjestelmä tunnistaa ensin Madagaskarin toimittajan, joka haluaa kirjoittaa ranskan kielellä, ja pyytää toimittajaa täyttämään artikkelin puuttuvat osat ja julkaisemaan sen Madagaskarin Wikipediassa. Tällä tavalla toimittajat voivat luoda artikkeleita erilaisille ihmisille maailmassa, mikä puolestaan voi vaikuttaa yleiseen käyttökokemukseen.

Wikimedia-säätiön tutkijat Leila Zia ja Ellery Wulczyn ovat tehneet yhteistyötä Stanfordin yliopiston opiskelijan Robert Westin kanssa esitelläkseen raportin kansainvälisessä World Wide Web -konferenssissa, Montrealissa. Heidän mukaansa Wikipedialla on paljon tietoa, ja sen artikkeleilla on vahva yhteys.

Tutkijat ovat alkaneet laatia luetteloita eri kielillä olevista artikkeleista ja vertailla viitteitä luetteloihin selvittääkseen, mitkä artikkelit puuttuvat millä kielillä. Sitten he arvioivat kaikkien puuttuvien artikkeleiden merkityksen maantieteellisen ja kulttuurisen merkityksen perusteella. He pyrkivät julkaisemaan puuttuvat artikkelit mahdollisimman pian ja saada ne paremmiksi.

Aukkojen sulkeminen

Tutkijat ovat testanneet lähtökohdan monilla kokeilla. He aloittivat projektin yli 4 miljoonalla englanninkielisellä artikkelin kirjoittamalla artikkelissa ja huomasivat, että ranskalaisesta Wikipedia-osiosta puuttui yli 1,5 miljoonaa artikkelia. Asiantuntijat valitsivat sitten 300 000 tärkeätä englanninkielistä artikkelia ja käänsivät sen ranskan kielelle. Artikkelit jaettiin kolmeen pääryhmään, joissa kussakin oli yli 100 000 artikkelia, ja ne luovutettiin parhaille ja kokeneimmille toimittajille. Kokeen ydin käsitti kaksi pääryhmää, kuusituhatta toimittajaa ja kirjailijaa, jotka tekivät useita muokkauksia sekä ranskan että englannin kielellä 12 kuukauden aikana ennen kokeen päättymistä. Kesäkuussa 2015 kaikki toimittajat saivat sähköpostin, jossa kerrottiin puuttuvista ainutlaatuisista artikkeleista, ja heitä pyydettiin kääntämään täydellinen artikkelikirja englannista ranskaksi. Kuukautta myöhemmin asiantuntijat käyttivät puuttuvaa artikkelin luomista ja huomasivat, että he voisivat nostaa orgaanisten artikkeleiden luomisastetta. Kaikkien näiden tulosten perusteella Wikipedia-säätiö kehitti joitain kokeellisia työkaluja, joissa toimittajat ja kirjoittajat voivat löytää aukot paikallisella kielellään ja saada huomautuksia tietyistä merkinnöistä.

mass gmail