Sana "data" näkyy kaikissa tilastoissa. Tietoja on monia erilaisia luokituksia. Tiedot voivat olla määrällinen tai laadullinen, erillinen tai jatkuva. Huolimatta sanatiedon yleisestä käytöstä sitä käytetään usein väärin. Tämän termin käytön ensisijainen ongelma johtuu puutteellisesta tiedosta siitä, onko sanatiedot singular vai monikko.
Jos data on yksittäinen sana, niin mikä on datan monikko? Tämä kysymys on oikeastaan väärä kysymys. Tämä johtuu siitä, että sanadata on jo monikossa. Todellinen kysymys, jonka meidän pitäisi kysyä, on: "Mikä on sanatietojen ainutlaatuinen muoto?" Vastaus tähän kysymykseen on ”datum”.
Osoittautuu, että tämä tapahtuu erittäin mielenkiintoisesta syystä. Selittääkseni, miksi meidän on mentävä vähän syvemmälle kuolleiden kielten maailmaan.
Hieman latinalaista
Aloitamme sanan datum historiasta. Sana datum on peräisin Latina kieli. Datum on substantiivi, ja latinaksi termi datum tarkoittaa ”jotain annettua”. Tämä substantiivi on peräisin toisesta deklinaatiosta latinaksi. Tämä tarkoittaa, että kaikilla tämän muodon substantiivilla, joilla on yksikkömuoto, päättyy -um, on monikkomuoto, joka päättyy -a: lla. Vaikka tämä saattaa tuntua oudolta, se muistuttaa englanniksi yleistä sääntöä. Useimmat yksittäisnimiä tehdään monikkomuotoisina lisäämällä "s" tai ehkä "es" sanan loppuun.
Kaikki tämä latinalainen kielioppi tarkoittaa sitä, että moniarvo datum on dataa. Joten on oikein puhua yhdestä nollapisteestä ja useasta tiedosta.
Data ja Datum
Vaikka jotkut käsittelevät sanatietoja kollektiivisena substantiivina viitaten tietokokonaisuuteen, useimmat tilastotiedot kirjoittavat sanan alkuperän. Yksi tieto on nollapiste, enemmän kuin yksi on dataa. Seurauksena siitä, että data on monisana, on oikein puhua ja kirjoittaa "näistä tiedoista" kuin "näistä tiedoista". Samojen linjojen mukaan sanoisimme, että "tiedot ovat... "eikä" data on... "
Yksi tapa välttää tätä asiaa on pitää kaikkia tietoja kokonaisuutena. Sitten voimme puhua yksittäisestä datajoukosta.
Paikanna väärinkäytön esimerkkejä
Lyhyt tietokilpailu voi edelleen auttaa selvittämään oikean tavan käyttää termiä data. Alla on viisi lausumaa. Selvitä, mitkä kaksi ovat vääriä.
- Aineistoa käyttivät kaikki tilastoluokassa.
- Tietoja käyttivät kaikki tilastoluokassa.
- Tietoja käytti kaikki tilastoluokassa.
- Aineistoa käyttivät kaikki tilastoluokassa.
- Sarjan tietoja käytti jokainen tilastoluokassa.
Lause 2 ei käsittele tietoja monikkona, joten se on väärä. Lause # 4 kohtelee sanaa väärin monikkona, kun taas se on singulaarinen. Muut lausunnot ovat oikein. Lausunto # 5 on hieman hankala, koska sanasarja on osa prepositiolause "sarjasta."
Kielioppi ja tilastot
Kieli- ja tilastotieteiden aiheita ei ole monessa paikassa, mutta tämä on yksi tärkeä asia. Pienellä harjoituksella on helppoa käyttää sanoja data ja datum oikein.