Mitä data on?

Maataloudessa datan määrä kasvaa jatkuvasti. Maatilat ovat vääjäämättä siirtymässä datatalouteen, jossa tilaa johdetaan yhä enemmän dataan perustuen. Dataa syntyy viranomaisten taholta, maatilojen eri työkoneissa ja mittalaiteissa, sekä kolmannen osapuolen toimesta.

Big data, avoin data, metadata

Isoihin datamassoihin liitetään usein käsitteitä big data, avoin data ja metadata. Näistä big data liittyy suurten tietomassojen käyttöön. Silloin dataa on jo niin paljon, että sen ylläpitämiseen ja analysointiin tarvitaan siihen erikseen tarkoitettuja ohjelmistoja. Avoin data tarkoittaa aineistoja, jotka on annettu avoimesti käytettäväksi. Näistä hyviä esimerkkejä ovat satelliittiaineistot, joita kerätään Suomestakin useaan kertaan viikossa satelliiteissa olevien erikoiskameroiden avulla. Suomessa useat organisaatiot julkaisevat datojaan kuten Maanmittauslaitoksen Lidar ja ilmakuvat sekä Ilmatieteenlaitoksen säätiedot.

Maatilojen tuottamat datat ovat pääsääntöisesti ei julkista dataa. Data voi silti olla erilaisissa palveluissa, joiden ehdot ja käyttömahdollisuudet voivat olla hyvinkin kirjavia. Mikäli maatilan datarakenne ei ole selvillä, ryhdy toimiin.

Askelmerkit lähtötilanteen selvittämiseksi:

  1. Mitä aineistoja tilasta löytyy: työkoneiden tuottamat, urakoitsijat, viranomaiset, kirjanpito, jne.
  2. Missä aineisto sijaitsee ja saako sen ladattua omalle koneelle: oma kone, pilvipalvelu, muistikortti, työkone, jne
  3. Missä formaatissa aineisto on: excel, paperi, doc, csv, txt, jpeg, tif, shp, pdf, jne.

Seuraavaksi tee aineiston arviointi:

  1. Onko aineisto koneluettavassa muodossa eli aineistosta pystytään esim. filteröimään lukuja (huom. pdf yleensä tuhoaa aineistoa ja rajoittaa merkittävästi sen käyttömahdollisuuksia)
  2. Onko data laadukasta eli käyttökelpoista (esim. onko keräysajankohta ja paikkatieto merkattu tarkasti)
  3. Onko aineisto avattavissa ilman maksullista ohjelmistoa (avoin ohjelmistoformaatti)
  4. Paljonko aineiston muuttaminen datamuotoon veisi aikaa

Datarakenteen selvittäminen mahdollistaa pohtimaan tilan seuraavia askelia, eli mitä dataa tulisi ostaa, korjata, täydentää tai kerätä, jotta sillä olisi liiketoiminnallista merkitystä.

Vaikka ei vielä olisikaan selvillä seuraavista askelista, niin silti kannattaa varmistaa, että tilalla on oikeudet dataan ja se on käyttökelpoisessa muodossa. Kun dataa myöhemmin huomaa tarvitsevansa, se olisi jo valmiiksi käytettävissä. Vaadi esimerkiksi urakoitsijoilta ym. tahoilta aineistot koneluettavassa muodossa.