perjantai 29. elokuuta 2014

Joukkovoimaa

Kun netissä rekisteröityy johonkin palveluun, tai lähettää vaikka kommentin keskustelupalstalle, joutuu usein kirjoittamaan vastauksen jonkinlaiseen bottivarmistuskysymykseen. Kyseessä voi olla vastaus vaikka yksinkertaiseen päässälaskutehtävään tai jollain sotkuisella fontilla olevan tekstinpätkän kopioiminen vastausruutuun. Näin voidaan erottaa, yrittääkö kommenttia laittaa ruudulle oikea ihminen vai tietokoneohjelma. Ohjelmat eivät osaa tunnistaa vaikeaselkoista, kuvatiedostona olevaa tekstiä, ja näin ne voidaan torjua. Joskus merkkirivit ovat niin oudoilla fonteilla ja viivoilla sotkettu, että hädin tuskin ihminenkään erottaa, mistä kirjaimista on kyse.

Harvempi tietää, etteivät ko. tekstinpätkät aina ole pelkästään sattumanvaraista siansaksaa. Google esimerkiksi käyttää tunnistussanoina oikeista vanhoista kirjoista ja sanomalehdistä otettuja pätkiä. Tekstin tunnistuksessa kyse on Googlen hankkeesta nimeltä reCAPTCHA, jossa netinkäyttäjiä käytetään apuna käännettäessä kirjoja ja sanomalehtiä digitaaliseen muotoon. Tunnistettavat sanat ovat sellaisia, joista kaksi erillistä tekstintunnistussovellusta on antanut erilaisen tuloksen, eikä niille löydy vastinetta sanakirjasta.

Tällaiset sanat lähetetään toisistaan erotettuina reCAPTCHAN kautta www-sivuille rekisteröityjien tunnistettavaksi. Kun tarpeeksi moni ihminen on tulkinnut ne samalla tavalla, tekstit lähetetään takaisin tunnistettuina, hyväksytyksi osaksi alkuperäistä digitoitua tekstiä. Netinkäyttäjät siis tekevät digitointityötä tietämättään. Vaikka jokainen käyttäjä tunnistaa vain yhden sanan kerrallaan, käyttäjien suuri määrä todellakin jouduttaa käännöstyötä: päivässä lähetetään ihmisten tunnistettavaksi yli 100 miljoonaa tekstinpätkää. Todennäköisesti sinäkin olet tietämättäsi digitoinut The New York Timesia. Idea on kieltämättä nerokas.

Vaikka toisaalta reCaPTCHA herättää kysymyksiä siitä, mitä kaikkea muuta tietoa näppäilyistämme minnekin tallentuu ja tietämättämme hyväksi käytetään, on joukkovoiman käyttäminen isoissa projekteissa suuri säästö kaikille. Kukaan ei jaksa yksinään skannata miljoonaa sivua, mutta miljoonalle käyttäjälle kyseessä on minuutin homma. Suuria urakoita saadaan valmiiksi ilman että kukaan huomasi edes tehneensä työtä.

Tietoverkot ovat mahdollistaneet sekä työn että työn tulosten jakamisen. Kirjastoissa yhteiseen aineistotietokantaan siirtyminen on säästänyt suuren määrän työtä ja nopeuttanut aineiston lainauskuntoon saamista. Ennen Satakirjastojen syntyä, oli käytännössä jokaisella kirjastolla oma, suljettu tietokantansa. Jokaisessa kirjastossa oli työntekijöitä, jotka luetteloivat kirjat tietokantaan. Samoja kirjoja luetteloi, periaatteessa samoin, standardoiduin säännöin, satoja työntekijöitä ympäri Suomen. Jotkut kirjastot tilasivat tiedot maksua vastaan yksityiseltä yritykseltä, jotkut luetteloivat ihan perinteisesti käsipelillä itse.

Yhteinen aineistotietokanta merkitsee sitä, että teos tarvitsee luetteloida vain kerran. Sen jälkeen tieto on kaikkien käytettävissä. Hyöty on valtava. Vaikka luettelointi”kieli” ja säännöt ovat standardoituja, poikkesivat saman kirjan luettelointitiedot eri kirjastoissa. Joissain kirjastoissa luetteloitiin vain melko suppeasti, joissain tietoja oli enemmän. Koska luettelointi toimii asiakasliittymän hakujen pohjana, siitä suoraan riippuu, kuinka hyvin joku aineisto tai aihepiiri on tietokannasta löydettävissä. Väärät tai puutteelliset hakusanat antavat vääriä tuloksia. Nyt sama teos löytyy samoilla kriteereillä joka kirjastossa. Kirjat myös ehtivät hyllyyn asiakkaan lainattaviksi nopeammin, kun jokaista ei tarvitse erikseen luetteloida.

Joskus tulevaisuudessa kaikkien Suomen kirjastojen aineistot saattavat olla samassa tietokannassa, ja luettelointitiedot tilataan valmiina yksityiseltä yritykseltä tai kirjastojen luettelointieksperteistä kootulta ryhmältä. Toisin kuin Googlella, kirjastojen asiakkaita tässä työssä tuskin käytetään. Sen sijaan asiakkaiden kirja-arvostelut, suositukset ja muun sisällöntuotannon hyödyntäminen alkaa olla arkea uusimmissa kirjastojärjestelmissä jo nykyisinkin.

keskiviikko 6. elokuuta 2014

Kaikki hajoaa

Työelämäni pisin kesäloma päättyi viime viikon maanantaina, ja taas mennään. Ylimääräistä askartelua ja huolta onkin riittänyt, sillä tuntuu, että pääkirjastosta pettää paikka toisensa jälkeen. Tässä pitäisi sitten tehdä puolivuotisraportti, koulutussuunnitelma ja ensi vuoden talousarvio samalla, joten työt ovat käynnistyneet ns. reippaasti.

Heti ensimmäisenä työpäivänä asiakkaat valittivat ilmastoinnista: yläkerrassa alkoi olla melkoisen nihkeä tunnelma. Työhuoneet sen sijaan olivat paikoin kuin jääkaappeja. Talotoimi hälytettiin apuun, mutta he eivät vikaa löytäneet, vaan päättelivät, ettei järjestelmä yksinkertaisesti jaksa viilentää asiakastilojen valtavaa ilmamassaa. Manuaalisesti ilmastointia säätämällä olo kuitenkin helpottui.

Seuraavana päivänä alkoi vesihanoista tulla syvänkeltaista vettä. Näytti kuin olisi menneet lähtevän ja tulevan veden putket jossain ristiin. No, tämä ilmiö ei onneksi kestänyt kuin iltapäivän, ja korjaantui itsestään. Syy oli kuulemma putkiremontti jossain keskikaupungilla.

Keskiviikkona hajosi palautusautomaatti, eikä suostunut ottamaan kirjoja vastaan. Laite on kalliisti huollettu alkukesästä, ja hajonnut kaksi kertaa sen jälkeen. Iltapäivällä saatiin puhelinneuvontaa puolisen tuntia, mutta laitetta ei saatu käynnistymään. Seuraavana aamuna konsultoitiin lisää, samoin tuloksin. Parin päivän päästä saapui asentaja, ja nyt kone taas toimii. Ohjelmointivika.

Torstaina asiakkaat valittivat lukusalin hämäryydestä. Kattolamppuja on sammunut niin paljon, ettei myrskyn pimentämä taivas enää tuottanut tarpeeksi valoa. Onneksi olemme jo vuosi sitten hankkineet pöydille erillisiä pöytälamppuja, sillä katonrajassa olevien lamppujen vaihto ei onnistu noin vain. Ennen syyspimeitä ne täytyy kuitenkin urakoida nosturin kanssa.

Perjantaina ei muistaakseni hajonnut mitään, ainoastaan tuli yöllä aiheeton murtohälytys. Lauantaina kirjasto on kiinni, joten mikään paikka ei voinut hajota, mutta sunnuntaina reistaili ulko-oven sähköinen avaussysteemi; murheenkryyni jota on korjattu ja pelätty vuosittain. Ovi korjaantui tälläkin kertaa itsekseen. Asiakkaat valittivat myös miesten vessan vilkkuvasta lampusta. Sen sain kunnian vaihtaa itse eilen. Toivottavasti lampun kupu ei putoa kenenkään päähän, kun oli se kiinnityssysteemi semmoinen ruuviton malli.

Tämä viikko käynnistyi hissin hajoamisella. Joku muuntaja tms. isompi juttu. Asiakkaat joutuivat kipuamaan portaita yläkertaan, ja vielä harmillisempi oli, että yläkertaan hyllytettävät kirjatkin piti kantaa portaita pitkin. Palautetut kirjathan tuodaan kärryissä hissillä ylös, joten niiden kantaminen koreissa on aikamoista jumppaa. Hissinkorjaaja on töissä parhaillaan, ja toivottavasti työ onnistuu. Ja vielä kun riittäisi rahaa tämän kaiken korjaamisen maksamiseen.

Maanantai-iltapäivällä huomattiin, että katolla olevan ilmastointijärjestelmän vesijäähdytys vuotaa pitkin rakennuksen seinää. Kyseisen puoliomatekoinen systeemi on aiheuttanut harmia ja vuotoja ennenkin, koska lehdet ja roskat tukkivat lattiakaivon, jonne veden pitäisi virrata, ja näin vesi uhkaa valua rakenteisiin.

Tiistaina sitten eräs asiakas tuli kertomaan, ettei kirjaston langaton verkko ole toiminut viiteen päivään. Omilla lainattavilla koneillamme se kuitenkin näytti toimivan ihan normaalisti, joten asia jäi siihen. Ehkä vika oli asiakkaan laitteissa tai asetuksissa.

Nyt on keskiviikko. Odotellaan.


EDIT: seuraavan viikon saldoa: kassakone kiukutteli, 3 aiheetonta murtohälytystä, kulunvalvonta ei toiminut kahden päivän ajan, miesten vessan ilmastoinnista (sen puutteesta) valitettiin ja digitointihuoneen kone on taas rikki, eikä sitä saada lainkaan hereille. Toimii normaalisti korjaajan pöydällä, mutta kirjastoon tuotuna ei tule virratkaan päälle. On tämä ihmeellistä.