Sisään kielitiede, yksiselitteisyys on prosessi, jolla määritetään mikä a-tunnus sana käytetään tietyssä konteksti. Tunnetaan myös nimellä leksinen yksiselitteisyys.
Laskennallisessa kielitieteessä tätä syrjivää prosessia kutsutaan sana-mielen yksilöinti (WSD).
Esimerkkejä ja havaintoja
"Niin tapahtuu, että meidän viestintä, erilaisina Kieli (kielet samankaltaisesti, antaa mahdollisuuden käyttää samaa sanamuotoa erilaisten viestintätapahtumien tarkoittamiseen. Seurauksena on, että tietyssä tapahtumassa on selvitettävä tietyn sanan tarkoitus sen mahdollisesti liittyvistä aisteista. Samalla kun epäselvyyksiä jotka johtuvat sellaisista monimuotoisista merkitysyhteyksistä, ovat leksikaalinen - tasolla, ne on usein ratkaistava laajemmasta asiayhteydestä esitelmä upottamalla sana. Siksi sanan ”palvelu” eri aistit voitaisiin erottaa toisistaan vain, jos voitaisiin katsoa itse sanan ulkopuolelle, kuten vastakohtana ” pelaajan palvelu Wimbledonissa 'tarjoilijan palvelulla Sheratonissa'. Tämä prosessi sanan merkityksen tunnistamiseksi diskurssissa on yleensä tunnetaan
sanan mielessä täsmennyssivu (WSD). "(Oi Yee Kwong, Uudet näkökulmat laskennallisiin ja kognitiivisiin strategioihin sanan ymmärtämiseksi. Springer, 2013)Leksinen yksiselitteisyys ja Word-Sense-yksiselitteisyys (WSD)
"Leksikaaliset täsmennyssivu sen laajimmassa määritelmässä ei ole merkitystä jokaisen sanan merkityksen määrittämisessä yhteydessä, mikä näyttää olevan suurelta osin tajuton prosessi ihmisissä. Laskennallisena ongelmana sitä kuvataan usein nimellä "AI-täydellinen", toisin sanoen ongelma, jonka ratkaisu edellyttää ratkaisun toteuttamista luonnollisen kielen ymmärrystä tai terveen järjen päättelyä (Ide ja Véronis 1998).
"Laskennallisen kielitieteen alalla ongelmaa kutsutaan yleensä sanamielen yksilöinniksi (WSD) ja se määritellään ongelma laskennallisesti määrittää, mikä sanan 'merkitys' aktivoituu sanan käytöllä tietyssä yhteydessä. WSD on pääosin luokittelutehtävä: sana-aistit ovat luokkia, konteksti tarjoaa todisteita, ja jokainen sanan esiintyminen on osoitettu yhdelle tai useammalle sen mahdolliselle luokalle perustuen todisteita. Tämä on WSD: n perinteinen ja yleinen luonnehdinta, joka näkee sen selvänä prosessina yksiselitteisyydestä sana-aisteiden kiinteän luettelon suhteen. Sanoilla oletetaan olevan äärellinen ja erillinen aistien joukko a: sta sanakirja, leksinen tietopohja tai ontologia (jälkimmäisessä aistit vastaavat käsitteitä, jotka sana leksikalisoi). Sovelluskohtaisia inventaarioita voidaan myös käyttää. Esimerkiksi konekääntämisessä (MT) voidaan asettaa sanakäännöksiä sanan aisteiksi, Tämä lähestymistapa on yhä toteuttamiskelpoisempi, koska käytettävissä on suuria monikielisiä yhdensuuntaisia corpora jotka voivat toimia harjoitustietoina. Perinteisen WSD: n kiinteä luettelo vähentää ongelman monimutkaisuutta, mutta vaihtoehtoisia kenttiä on olemassa.. .. "(Eneko Agirre ja Philip Edmonds," Johdanto "). Sanamerkin yksilöinti: Algoritmit ja sovellukset. Springer, 2007)
Homonymia ja yksiselitteisyys
"Leksikaaliset täsmennyssivu sopii hyvin erityisesti homonyymejäesimerkiksi esiintyminen basso on kartoitettava jompaan kumpaan leksikosta basso1 tai basso2, aiotusta merkityksestä riippuen.
"Leksinen yksiselitteisyys merkitsee kognitiivista valintaa ja on tehtävä, joka estää ymmärtämisprosesseja. Se olisi erotettava prosesseista, jotka johtavat sana-aistien erilaistumiseen. Entinen tehtävä suoritetaan melko luotettavasti myös ilman paljon asiayhteyttä koskevia tietoja, kun taas jälkimmäinen ei ole (vrt. Veronis 1998, 2001). On myös osoitettu, että homonyymit sanat, jotka vaativat yksiselitteisyyttä, hidastavat sanallisen pääsyn, kun taas moniulotteiset sanat, jotka aktivoivat useita sanan aisteja, nopeuttavat leksiaalista pääsyä (Rodd e.a. 2002).
"Sekä semanttisten arvojen tuottavalla muokkauksella että leksisesti erilaisten esineiden välisellä suoraviivaisella valinnalla on kuitenkin yleisesti, että ne vaativat ei-leksikaalista lisätietoa. "(Peter Bosch," Tuottavuus, polysemia ja ennustava indeksisyys ". Logiikka, kieli ja laskenta: Kuudes kansainvälinen Tbilisin symposium logiikkaa, kieltä ja laskentaa varten, toim. kirjoittanut: Balder D. kymmenen Cate ja Henk W. Zeevat. Springer, 2007)
Leksisen luokan yksiselitteisyys ja todennäköisyyden periaate
"Corley ja Crocker (2000) esittävät laajan kattavuuden mallin leksinen luokkatäsmennyssivu perustuu Todennäköisyyden periaate. Erityisesti he ehdottavat tätä sanoista koostuvalle lauseelle w0... wn, lauseprosessori käyttää todennäköisimmin osa puhetta jakso T0... Tn. Tarkemmin sanottuna heidän mallissaan hyödynnetään kahta yksinkertaista todennäköisyyttä: (minä) sanan ehdollinen todennäköisyys wminä tietyn osan puheesta Tminä, ja (ii) todennäköisyys Tminä ottaen huomioon edellisen osan puheesta Ti-1. Kun jokainen lauseen sana kohdataan, järjestelmä osoittaa sille sen puheosuuden Tminä, joka maksimoi näiden kahden todennäköisyyden tuloksen. Tämä malli hyödyntää monien näkemyksiä syntaktinen epäselvyyksillä on leksinen perusta (MacDonald et ai., 1994), kuten kohdassa (3):
(3) Varaston hinnat / merkit ovat halvempia kuin muut.
"Nämä lauseet ovat väliaikaisesti epäselviä sellaisen lukemisen välillä, jossa hintoja tai merkit on pääverbi tai osa a yhdiste substantiivi. Suuren korpuksen koulutuksen jälkeen malli ennustaa todennäköisimmän osan puheesta hintoja, ottaen oikein huomioon sen tosiasian, että ihmiset ymmärtävät hinta kuin substantiivi, mutta merkit verbinä (katso Crocker & Corley, 2002, ja siinä siteeratut viitteet). Malli ei vain vastaa monista yksiselitteisyysasetuksista, jotka juurtuvat leksikaaliseen luokkaan epäselvyys, se selittää myös sen, miksi ihmiset yleensä ovat erittäin tarkkoja ratkaisemaan tällaisia epäselvyyksiä. " (Matthew W. Crocker, "Ymmärtämisen rationaaliset mallit: vastaaminen suorituskykyparadoksiin". 2000-luvun psykolingvistiikka: neljä kulmakiveä, toim. kirjoittanut Anne Cutler. Lawrence Erlbaum, 2005)