Käsitteiden rooli oppimisessa
Siinä on otsikko, sisältö on vielä suuri kysymysmerkki. Meillä on suunnitteilla seminaari oppimisteorioista ja vaikka oppimistutkimuksessa olenkin töissä, minulla ei ole omaa vahvaa näkemystä siitä, mitä oppiminen on ja voiko sitä tukea, ainakaan samassa mitassa kuin minulla on vahva näkymys siitä millaisia käsitteet ovat ja miten mieli toimii. No, se miten mieli toimii tavallaan pitää sisällään sen miten se oppii, mutta en ole yrittänytkään katsoa tarkasti sitä aluetta pitkiin aikoihin. Vaatii suuria henkisiä ponnistuksia sellainen selväjärkisyys. Julistetaan kuitenkin aihe avatuksi, tämän oppimisteoriat-tagin alle tulee myöhemmin lisää.
Käsitteet ovat nykyään erikoistumisalani, joten katson oppimista niiden kautta. Liitto käsitteiden ja oppimisen välillä on vahva ja vanha ja siksi ensimmäinen siirto onkin kyseenalaistaa se.
Tämä on näin-tapahtuu -kuvaus, ei näin-pitäisi-olla -kuvaus.
Yritykset jäsentää sitä, mitä on opittu vaikkapa tietyn aineen oppitunneilla ja mitä pitäisi oppia, tapahtuu pilkkomalla alaa käsitteisiin ja yrittämällä saada oppijoiden käsitteet vastaamaan mahdollisimman hyvin oppimateriaalin ja opettajien käsitteitä, ainakin oleellisilta osin. Tässä asiantuntijuus tuo pienen pulman; asiantuntijuuden myötä kiinnostavat ja haastavat asiat painottuvat eri tavalla kuin noviisitasolla ja näitä painotuksia ei edes pitäisi siirtää opiskelijoille. Joten voi olettaa, että opettajilla on sen x:n lisäksi, mitä he tietävät aiheesta A versio x’ joka on heidän käsityksensä siitä mitä opiskelijoiden tulisi tästä tietää. Nykymaailmalle tyypillistä on, että opiskelijan versio x” voi sisältää paljon asioita joita ei kuulu x’:n eikä x:ään, omin päin hankittua erityistietoa. Opittavat käsitteet toimivat taas ankkureina yrityksille pitää oppiminen aiotulla alueella.
Dilemma: Se, mitä kaikki hyvät ja uskottavat käsiteteoriat sanovat, on että lähes kaikissa tapauksissa käsitteen rajaaminen on mahdotonta, mutta silti tarvitaan jotain referenssejä sille, milloin käsite on opittu oikein tai väärin ja milloin se on opittu vajavaisesti.
Ovatko x’ -tyyliset versiot käsitteistä jotenkin yksinkertaistettuja ja muokattuja niin, että niihin on lisätty rajat, totuusvaateet ja muut referenssipisteet? x’ ei kata koko opettajan käsitettä x eikä myöskään oppijan versiota x”, mutta jos se onkin joku puolijulkinen yksinkertaistus jolla on ominaisuuksia. Tällaiset puolijulkiset käsiteolennot voisivat olla se, millä yhdistää askeettisen coolit Jackendoff-Chomskylaiset käsitteet mielessä sosiaalis-konstruktivistisiin ja toimintateoreettisiin käsitteisiin. Me otamme noita rajaamattomia abstrakteja käsitteitä ja luomme niille käsitewrapperin kun nostamme ne keskusteluun tai oppimistilanteeseen. (Taas elämä on Pythonia!) Tämä käsitewrapperin luominen ei ole täysin automaattinen ja hallitsematon tapahtuma, sen voi perua ja tehdä uudestaan ja korjailla. Se, millaisen käsitewrapperin opittavalle asialle annamme, vaikuttaa hyvin paljon siihen miten sen voi oppia ja miten sen voi oppia parhaiten. Kun kerromme mitä mielestämme X on, siinä kertomuksessa on paljon tulkintaa mukana, X ei ole taltioitu missään kerrottavassa formaatissa, vaan sellainen täytyy luoda.
(Puoli tuntia myöhemmin, lisäys)
Se, että käsitteelle täytyy luoda wrapperi ennen kuin siitä voi alkaa puhua voisi sopia hyvin metaforateorioihin, Lakoff ja Johnson -juttuihin. Koska meidän täytyy kuitenkin luoda joku wrapperi, mutta wrapperi ei ole sinänsä välttämätön osa käsitettä mielessä (M-käsite), se kuinka sotkemme metaforia ja keksimme niitä muuttuu sekä ymmärrettäväksi osaksi kielen käyttöä, että keinoksi saada M-käsitteestä kaivettua jotain mitä toisella metaforalla ei saanut esiin. Se, että emme pääse käsiksi M-käsitteisiin ilman wrapperia on aiheuttanut sen, että wrapperien ominaisuudet oletetaan käsitteiden ominaisuuksiksi, mutta sitten on seurannut ongelmia, kun käsitteen samat ominaisuudet ovatkin rajusti toiset tarkastellen käsitettä toisesta suunnasta. Selitys tälle on, että käytämme toista wrapperia ‘tarkastellessamme toisesta suunnasta’ ja wrapperit lukevat ehkä eri asioita ja tekevät omia juttujaan.
Toinen tiskatessa mieleenjuolahtanut linkki on Vygotski. M-käsitteitä koskevien teorioiden on ollut vaikea ottaa vakavasti mahdollisuutta, että käsitteitä opitaan kunnolla käyttämään vasta teini-iässä, mutta tässä mallissa kyse Vygotskin teorioissa onkin käsitewrappereiden luomisen oppimisesta. M-käsitteet ovat olleet aina, J-käsitteet, (Julkiset) saadaan hallintaan vähitellen ja se on taito, jossa on suuria eroja. (Ja jossa satun olemaan erittäin hyvä. Paitsi että se sotkee puheeni.)
Ruotsin sanajärjestyksestä
Esimerkit Birgitta Viljanen ja Kari Viljanen (1994) Nykyruotsin peruskielioppi.
Suomen sanajärjestys on vapaa. Ruotsin sanajärjestys on määrätty. Morfologia on köyhempi, joten tarvitaan sanan sijaintia merkkaamaan mikä on rooli sillä on lauseessa.
Olen huomannut olevani huono muistamaan tapahtumien järjestystä ja toimintasarjoja (tanssiaskeleet, nuotit, solmujen teko, tunnusluvut). Yhdistettynä siihen, kuinka suomessa ei siihen edes tarvitse kiinnittää huomiota, ruotsin sanajärjestys on ollut ikuinen ongelma. Yritetään vielä kerran, johtavana kysymyksenä ‘miksi?’:
Päälauseen suora:
| SUBJ | PRED1 | LM | PRED2 | OBJ / PREDIKATIIVI |
ADVERBIAALI |
| Anders | har | sällan | varit | så | glad |
| Pekka | spelar | (inte) | – | tennis | – |
| Han | reser | – | – | – | till Frankrike på sommaren med egen bil. |
predikatiivi: se ‘jotain’ lauseissa, joissa jokin on _jotain_. Sitä ei voi sanoa objektiksi, koska se on tavallaan osa subjektia. Ominaisuuden antamista.
adverbiaali: toiminnan paikka/tapa/aika (ja tässä järjestyksessä!)
Päälauseen käänteinen:
| ADVERBIAALI/ PREDIKATIIVI OBJEKTI SIVULAUSE KYSYMYSSANA “REPLIIKKI” |
PRED1 | SUBJ | LM | PRED2 | PREDIKATIIVI OBJEKTI |
ADVERBIAALI |
| I kväll | spelar | Pekka | inte | – | tennis. | – |
| Skulden | behöver | han | inte | betala | – | på länge |
| På sommaren | reser | han | – | – | – | till Frankrike med egen bil |
PR:VI ja OBJ voidaan käyttää vain kerran, mutta ADV:li voidaan jakaa paikka/tapa/aikaan ja laittaa joku näistä eteen ja muut taakse. Huom, LM on näissä molemmissa ennen PRED2:ta ja myös tulevissa sivulauseen sanajärjestyksissä aina ennen PRED:a. — Siitä saa käyvän muistisäännön ja vihjeen siitä mihin LM sijoittaa: Jos vaihtaa verbin johonkin moniosaiseen versioon, se on aina välittömästi ennen sitä jälkimmäistä verbin osaa: I kväll spelar Pekka inte tennis ==> I kväll har Pekka inte spelat tennis. Liikkuvan määren sidos predikaattiin on murtumaton.
Vaikka liikkuvalla määreellä on näennäisesti vahvempi sidos PRED2:een kuin PRED1:een, epäilen, että PRED1 on jossain mielessä projisoitu aina LM:n eteen:
I kväll spelar Pekka [spelar] inte tennis
+------------>+
Predikaatin paikka subjektin jälkeen on niin ensisijainen, että käänteisessäkin sanajärjestyksessä se heitetään sinne mielessä, mutta lauseen pintamuodossa se on siirretty lähemmäksi tarkenteitaan, koska tarkenteet tarvitsevat verbiä.
Englannissa tätä siirtoa ei tapahdu: ‘At morning Richard went to the castle.’ :
‘På morgonen gick Gustav till slottet.’ Tämä ero pitäisi nyt minun osata: muuten kielet ovat samanlaiset, joten paremmin hallitulla englannin sanajärjestysintuitiolla yleensä lauseeni rakennan ja sitten kapsahdan tuohon. Jos aloitat päälauseen jollakin muulla kuin lauseen subjektilla, heitä predikaatti ekalle sanalle tueksi. Jos predikaatin voi jakaa, jätä puolet siitä liikkuvan määreen seuraksi. (Liikkuva määre täytyy kuvitella jos sellaista ei ole.)
Lauseet kielissä yleensä ovat muodossa subjekti-predikaatti-[tarkenteita]. Palauta se mitä haluat sanoa siihen. Yhden tarkenteista voi siirtää lauseen eteen, mutta edellämainittu predikaatin kummittelu seuraa siitä. Subjektille voi upottaa sivulauseen tarkentamaan sitä sen ja predikaatin väliin, mutta upotus on merkitty pilkuilla eikä varsinaisesti kuulu päälauseeseen.
Sivulauseen sanajärjestys
Sanajärjestys on suora, mutta liikkuva määre ei ole PRED1:n ja PRED2:n välissä vaan aina välittömästi näiden edessä. Miksi?
| PÄÄLAUSE | KONJ | SUBJ | LM | PRED1-2 | OBJ/ PR:VI |
ADV:LI | PÄÄLAUSE |
| Jag vet | att | saken | inte | är | – | så | – | Gå bort | innan | jag | på riktigt | blir | arg. | – | – |
| – | Om | du | aldrig | har varit | – | i Paris, | måste du åka dit nu. |
Toinen skeema on relatiivilause
| PÄÄLAUSE | PRON | SUBJ | LM | PRED1-2 | ADV:LI | PÄÄLAUSE |
| Mannen, | som | – | står | där på gården | år en bekant till mig. | |
| Mannen | (som) | vi | – | träffade | ute på stan | är min kusin. |
| Det är en by, | där | jag | aldrig | har varit. | – |
Relatiivilause voi tunkea itsensä päälauseen subjektin tai objektin perään. Pilkut ovat järkeviä, mutta eivät välttämättömiä merkkejä siitä, että ollaan siirrytty sivulauseeseen. Ehkä sivulauseen liikkuva määre on ennen sen predikaatin molempia puoliskoja sen takia, että päälauseen predikaatti on merkki siitä, että sivulause on päättynyt. Jos sivulauseen predikaatti olisi hajallaan kahdessa paikkaa, se sekoittuisi helposti päälauseen predikaattiin.
Kolmas skeema on kysymyslause. Käydään se vielä ja yritetään sitten koota kaikki variaatiot yhdeksi himmeliksi.
| PÄÄLAUSE | KONJ / KYSYMYSSANA |
SUBJ | LM | PRED1-2 | OBJ/ PR:VI |
ADV:LI | Jag vill veta | om | du | – | kommer | till oss | i kväll. |
| Mamma frågar | om | du | inte | har städat | – | ännu. |
| Kan du säga | när | vi | – | ska | åka | – |
| Jag förstår inte | varför | du | inte | har ringt | till mig | – |
| Jag ser inte | vem | som | – | går | där | på garden. |
| Säg nu | vilken bil | som | – | är | din. | – |
Kysymyssanan toinen käyttö on sijoittaa se päälauseen eteen ja tämä käynnistää aina ‘päälauseen käänteinen sanajärjestys’-skeeman. Tämä sivulauseen suora sanajärjestys on toinen vaihtoehto. Vaihtoehtojen lopputulokset ovat hyvin erilaiset: predikaatti ja subjekti vaihtavat aina paikkaa ja LM siirtyy koko predikaatin eteen tai predikaatin (puuttuvan) kakkososan eteen.
Palataan siihen, että lauseen perusmuoto on [SUBJ, PRED, TARKENTEET]. Tämä pätee päälauseisiin ja sivulauseisiin, mutta sivulause voi olla tarkenne, ja lisäksi se voi olla tarkenne suoraan subjektille: [SUBJ[SIVULAUSE], PRED, TARKENTEET[SIVULAUSE]]. Oikeastaan tarkenteet voisi hajottaa OBJ/PR:VI:n ja ADV:LIin. OBJ/PR:VI voi saada sivulauseloisen, ADV:li ei — ADV:li joka yrittää määritellä liian paljon asioita kasvaa helposti sivulauseeksi, sitä voi oikeastaan pitää kuihtuneena sivulauseena.
Pitkän lauseen pulmat
Kokeillaanpa osaanko purkaa seuraavan esimerkkilauseen:
Men samtidigt som vi är unika och fria är vi en del av en viss population med allt vad det innebär av begränsningar i valfriheten.’
‘Är vi’-rakenne on mahdollista vain käänteisessä päälauseessa ja käänt. päälause tapahtuu vain, jos päälause alkaa muulla kuin substantiivilla, joten sitä edeltävä on kaikki sivulausetta.
[[Men samtidigt som vi är unika och fria]_SL är vi en del av en viss population med [allt vad det innebär av begränsningar i valfriheten]_SL] =>
[SL är vi [en del av population med SL]] =>
[vi är en del av viss population med SL SL]
Olisiko tuo käännetty PRED-SUBJ-pari todellakin yleinen tunnusmerkki päälauseesta? Lause ei olisi ainakaan minulle käsittämätön, vaikka ‘är vi’:n kääntäisi toisinpäin. Miten helkutissa tuollainen lause prosessoidaan? Men … PRED1 …PRED2 - kun tulee toisen kerran vastaan predikaatti, eli verbi, eli sana joka on tunnistettavissa koska verbit ovat aina predikaatteja, niin silloin on ensimmäinen sivulause käsitelty loppuun. Jos tuon sivulauseen perään alkaisi rakentaa toista sivulausetta, se täytyisi päättää pilkkuun, puhuessa pieneen taukoon.. Konjunktiivi tai uusi predikaatti on merkki sivulauseen päättymisestä.. Eipäs, ‘unika och fria’ - siellä on ‘och’, mutta ei sivulausetta. Kyllä se on vain se predikaatti joka merkkaa lausesiirtymää. Ilmeisesti lausesiirtymä ei voi olla kovin kaukana predikaatista.
Sivuhuomiona edellisestä kappaleesta: kuinka iso ja kielistä toiseen siirtyvä asia on se, että verbit ovat tunnistettavia? On niin paljon leksikaalista ja morfologista homonymiaa: sana tai pääte tarkoittaa eri asiaa erilaisessa roolissa. Ruotsissa -en ja -n päätteet merkitsevät yksikön määräistä muotoa tietynlaisille sanoille, monikon määräistä toisille. Ei voi siis olettaa, että morfologinen pääte tulkitaan ensin: sillä voi olla joku taustaprosessi, jossa morfologisen päätteen mahdolliset tulkinnat kerätään, mutta tälläinenkin on mielekäs vain, jos mahdollisia tulkintoja kerätään järkevä määrä: vaikka -en -n aiheuttavat homonymiaa, ruotsi ei näytä erityisesti välttelevän sanojen luomista joissa -en ja -n ovat jo juuressa. Ehkä se, että -en ja -n ei tarkoita mitään on vain yksi mahdollisten tulkintojen listassa. Jos on vaikka 5 mahdollista tulkintaa mitä -en tarkoittaa, näistä tulkinnoista valitseminen tapahtuu hyvin helposti, sillä muuten listaa kasvattavia poikkeuksia optimoitaisiin kielestä pois. Käsitellystä pitkästä esimerkkilauseesta on vaikea löytää yksiselitteisesti lauseroolia merkitseviä kohtia, sillä yksiselitteisyys on nähtävästi vähemmän tärkeää kuin morfologisten muotojen kokonaismäärän minimointi. Kuitenkin algoritminen, etenevä lauseen parserointi tarvitsee jotain kiinnekohtia enkä keksi miten ihminenkään siitä selviäisi.
Vai tulkitsinko tuon lauseen väärin? Onko kyseessä kaksi rinnakkaista päälausetta? Siinä tapauksessa olemme pienen kielioppikirjani kantaman ulkopuolella. Suoran esityksen jälkeisellä päälauseella on käänteinen sanajärjestys ja rinnastettu päälause olisi lähellä sitä: rinnakkaisia toisiinsa liittyviä tapahtumia.. Ei, nyt on katsottava noita pikku tilpehöörisanoja, pronomineja, löytyykö niiden rooleista sen verran vakautta, että niitä voisi käyttää avaimina.
‘Men samtidigt som vi är unika och fria är vi en del av en viss population med allt vad det innebär av begränsningar i valfriheten.’
Nämä pronominit näyttävät ensisilmäyksellä yksiselitteisyyden vastakohdilta. Ensimmäinen ’som’ ei ole kielioppikirjani mukaan välttämätön, mutta koska se tuossa on, on sillä selventävä rooli. Huomaan, että kirjan esimerkkien kanssa olisi sopivaa uskoa, että ’som’ merkkaa subjektia: Jos on lause, joka ei ala subjektilla, sillä erotetaan edeltävä huttu subjektista — jos subjektia ei ole, ’som’ toimii subjektina, jos subjekti on, ’som’ on sen lipunkantaja. Eli sillä on tärkeä rooli sittenkin. Höpötä jotain ja kun sanot ’som’ höristän korviani sillä nyt päästään lauseen ytimeen: subjekti-predikaattiin.
‘Vi’ on yksiselitteinen tässä, toimii subjektina kahdessa kolmesta. Entä ‘allt’? Hm. Mikä ero on lauseilla ‘Osa kokonaisuudesta merkitsee tahdonvapaudelle’ ja ‘Kaikkea mitä osa kokonaisuudesta merkitsee tahdonvapaudelle’? Onko ensimmäinen versio kieliopillisesti vajaa vai pelkästään semanttisesti outo? Yksinkertaistetaan edelleen, en tajua noiden sanojen rooleja lauseissa:
- ‘Auton maalipinta merkitsee Simolle’::’Kaikkea mitä auton maalipinta merkitsee Simolle’
- ‘Auton maalipinta merkitsee Simolle rahaa’ :: ‘Rahaa auton maalipinta merkitsee Simolle’
Onneksi sanajärjestys on vapaa. Nyt pitää vain tajuta mitä tehtävää tuo ‘rahaa’ lauseessa toimittaa, sillä se on sama kuin mitä ‘kaikkea’ ja ‘allt’ toimittaa. On se varmaan vain objekti. Tai siis, meillä on pronomini objektina. ‘population med allt…’ voisi olla ‘population med bilar’.
Mutta mitä sivulause sanoo? ‘Allt vad X innebär av begränsningar i valfriheten.’, kun X=’vi är en del av en viss population.’ Kirjoitetaanpa se auki: ‘allt vad [vi är en del av en viss population] innebär av begränsingar i valfriheten.’ Tällainen lause ei olisi mahdollinen juuri sen takia, että ilman hakasulkuja olisi vaikea erottaa osien alkuja ja loppuja. Jos väliin tunkisi ’som’, se toimisi taas. Se, kuinka vaikea lauseesta on muodostaa selkeää mielikuvaa johtuu siitä, että sivulause kohdistuu koko predikaatin esittämään tilanteeseen: me olemme osa tiettyä populaatiota ja meillä on se, mitä olla-osana-tiettyä-populaatiota aiheuttaa tahdonvapaudelle. Tästä päästäänkin super-duper-bestis-kysymykseen: Miten ‘det’ osoittaa tuohon koko hoitoon eikä vain läheisimpään objektiin, ‘en del av en viss population’? Tietysti jos se osoittaisi siihen, ‘det’ täytyisi olla ‘den’, mutta eikö tämä olisi vähän liian satunnainen tapa tehdä ero? Ett-sukuisen objektin kanssa olisimme vaikeuksissa? Tämä on sotkuista, jos tämä vertailu helpottaisi ymmärtämään pulmaa:
‘Vi är en viss population med allt vad det innebär av begränsningar i valfriheten’
- Vi är en viss population med allt vad som [vi är en del av en viss population] innebär av begränsingar i valfriheten
- Vi är en viss population med allt vad [en del av en viss population] innebär av begränsingar i valfriheten
- Vi är en viss population med allt vad [en viss population] innebär av begränsingar i valfriheten
Miksi det tulkitaan tavalla yksi? Mahdollisuuksia:
- Ongelma ratkaistaan vasta semantiikassa. Tämä tarkoittaa, että lausetta ei pureta loppuun asti ennenkuin siitä aletaan lähettää semantiikalle kyselyitä. Minimalismiin tämä sopii, mutta jättää lauseen outoon kvanttihämyyn: sen syntaktinen rakenne päätetään vasta kun lauseen merkitys on tulkittu, vaikka lauseen merkitys tulkitaan sen syntaktisen rakenteen perusteella.
- en- ja ett-sukuisuuden ero todella on tärkeä tässä tapauksessa. Puolessa tapauksissa se ei kuitenkaan toimisi.
- Oletuksena ‘det’ yrittää kattaa mahdollisimman ison pätkän.
- Ongelmaa ei ratkaista. Tässä tapauksessa se toimisi, mutta jos PL olisi ‘Vi är motsat en viss population…’ niin motsatness-asenteen pitäisi siirtyä det:n mukana.
Kokeillaanpa:
- Vi är motsat ett visst hus med allt vad det innebär av begränsningar i valfriheten.
- Vi är motsat en viss population med allt vad det innebär av begränsningar i valfriheten.
Kyllä näyttää olevan (2) en-ett-sukuisuus se merkitsevä kriteeri edellisten lauseiden tulkinnassa! Ekassa voi ihan hyvin pitää talon merkitystä tahdonvapauden rajoittajana syynä sen vastustukselle, toisessa taas tunnustetaan vastustuksen merkitys tahdonvapautta rajoittavana tekijänä. Tämä ei sulje muita vaihtoehtoja vielä pois.
Julkaisen nyt tämän, mutta jatkan vielä muokkausta, kun ei tässä näytä pääsevän loppuun.
Kolme metaforaa I: Kaupunki
Seuraavaksi kirjoitan auki kolme tämänhetkistä suosikkimetaforaani mielen ja ennenkaikkea käsitejärjestelmän toiminnasta. Tämä on hevii shittii, oman ajatteluni tulos ja en ole nähnyt parempaa ajattelun toiminnan selitystä missään, joten edetkää avoimin mielin ja huolella.
Ensimmäinen metafora on kaupunki. Tarkastellaan Helsingin karttaa ja kiinnitetään huomiota siihen, miten etäisyydet vaikuttavat kaupungin levittäytymiseen. Kaupungissa on kaupunginosia, selvästi. Ne eivät ole kovinkaan selvärajaisia. Hämmästyttävää kyllä, tämä sumeus ja epäselvyys ei häiritse elämäämme: olisi hyvin helppoa vetää selkeät rajat ja poistaa tämä sumeus, mutta jostakin syystä sille ei ole tullut tarvetta. Kaupunginosilla on erityispiirteensä: on olemassa paljon yksittäisiä asioita, joita löytää vain tietystä kaupunginosasta: Keskustori, Eduskuntatalo, Itäkeskus jne. Erityispiirteiden lisäksi kaupunginosilla on tilastollisilla eroja: kaupunginosa voi sisältää paljon jotain –köyhiä, metsiä, baareja, virastoja. Jokaisessa kaupunginosassa on satoja yksittäisiä, ainutlaatuisia osoitteita ja niissä vastaavasti yksittäisiä taloja ja asukkaita.
Kaupunginosa vastaa aivoaluetta. Yksittäinen osoite yksittäistä käsitettä. Kaupunginosan tarjoamat palvelut käsitteiden yhteisiä piirteitä tai niiden jakamia metodeja, jos ohjelmointivertausta käytetään. Palveluissa voidaan zoomata paikallisempaan: voi olla, että kaupunginosassa on suuri kauppakeskus, mutta tietyllä kerrostalolla on alhaalla kioski, jossa suoritetaan paljon samoista asioinnista, minkä muut tekevät kauppakeskuksessa; alaluokkia.
Kaupunginosan sisällä liikutaan kävellen ja kävellen pääsee minne tahansa kaupunginosan sisällä: voisi sanoa, että kävellen liikkuessa resoluutio on tarkka. Käveleminen on hidasta ja suurimman osan ajasta et ole varsinaisesti missään kohteessa: olet kadulla, matkan varrella. Kävely vastaa ajattelussa assosiointia lajin sisällä; lähde banaanista, ajattele hedelmiä. Kävelet hedelmien naapurustossa: vastaan tulee erilaisia hedelmiä, mutta on helppoa eksyä läheisiin marjoihin tai vihanneksiin. Näihin liittyy tieto, että et ole enää hedelmien seudulla ja käännyt takaisin.
Jos haluamme liikkua nopeasti, käytämme julkisia välineitä. Näille ominaista on, että ne liikkuvat tarkkaan määrättyä reittiä, tarkasti ja ennustettavasti pisteestä A pisteeseen B, C, D, E.., eli pysäkeille. Verrattuna kävelyyn nämä reitit ovat niin nopeita, että jos tarkastelemme käytettyä matkaan käytettyä aikaa, toisella puolella kaupunkia, mutta lähellä pysäkkiä oleva kohde on yhtä lähellä kuin kohde kaupunginosan toisella puolella. (Ok, tässä täytyy vähän poiketa todellisuudesta ja nopeuttaa välineitä. Nämä bussit vievät käytännössä käyttämättä lainkaan aikaa pisteestä A pisteeseen E.) Jos olet esimerkiksi alueella KOIRA ja etsit sieltä kohdetta ‘MAKSA’, eli mitä minä tiedän koirien maksoista, en löydä koiran naapurustosta sellaista, joten otan bussin käsitteeseen MAKSA, se vie jonnekin seudulla ELIMISTÖ. KOIRAsta ei ole suoraa yhteyttä MAKSAan, sillä meillä ei ole kokemusta sellaisesta yhteydestä, joten on kuljettava yleiskäsitteiden suuntaan niin kauan, kunnes MAKSA-yhteys löytyy. Koirien maksa olkoon samanlainen kuin maksat yleensä. Jokaisella asuinalueella on useinkäytettyjä reittejä pysäkeille, jotka vievät silmänräpäyksessä toiselle alueelle, tiettyyn kohtaan. Jos useinkäytettyä reittiä ei tarjoudu, kulku on hitaampaa, mutta lopulta löydetään sopiva pysäkki ja singahdetaan oikealle alueelle.
Tämä joukkoliikenteen käyttö tekee kaupungin topologian mutkikkaaksi ja on syy, miksi yleistä käsitteiden hierarkiaa ja ontologiaa on ollut niin vaikea kuvata; tai se on helppo kuvata, mutta kun on saanut yhden kuvauksen valmiiksi, toteaa, että ihan yhtä hyvin voisi luokitella toisinkin. Meille intuitiivisesti KOIRAN JALAT ovat osa koiran käsitettä tai jossain sen lähellä, mutta toisaalta KOIRAN JALAT on myös lähellä yleistä JALAT-käsitettä. Jos meitä pyydetään kuvittelemaan erilaisia jalkoja, tulee mieleen erilaisten, kaukana toisistaan olevien asioiden jalkoja samalla helppoudella kuin erilaisia hedelmiä kuvitellessa. Jos koirista jalkoihin siirtyminen on mahdollista tehdä nopeasti, ongelma kummalle osastolle tieto säilytetään ei ole vakava, kunhan se tieto on siinä reitillä.
Joukkoliikenteen reittien säännöllisyys auttaa myös käsitteitä säilyttämään totuudellisuutensa ja luotettavuutensa. Käsitteen identiteetti on sen osoite; lähin nimetty pysäkki. Mitä osoitteesta löytyy saattaa muuttua, mutta käsite pysyy. Käsitteen tärkeimmät piirteet kuvaavat useimmiten reittejä joita siitä lähtee toisille alueille ja sen oman alueen ominaisuuksia. Joukkoliikennereittejä käyttäessä on huomattava, että reitit voidaan usein nimetä yhdistämällä lähtö- ja päätepysäkki (KOIRAN JALKA, AUTON RATTI)
Maailman asiat kappaleet ja yleensä substantiivien ilmaisemat käsitteet on suhteellisen helppo luokitella ja ajatella kaupunginosiin. Tapahtumat ja toiminnat ovat vaikeampia. Substantiivit ovat asukkaita, kaukana lähiöissä. Toiminta tapahtuu keskustassa. Keskustassa on palveluita ja virastoja, mutta palvelut ja virastot ovat turhia ilman asukkaita jotka niitä käyttävät ja joihin niillä vaikutetaan. Kuvitellaan vaikkapa toimintaa AJAA. Se on 1-3 paikkainen, vähintään AJAA(x) ‘Pekka ajaa’. AJAA(x,y) ‘Pekka ajaa autoa’ ja AJAA(x,y,z) ‘Pekka ajaa autolla kotiin’. Kuvitellaan virasto ‘AJAA’. Se lähettää samalla valonnopeudella, millä joukkoliikennekin kulkee viestin kohteeseen PEKKA, AUTO ja KOTI. PEKKA liitetään AJAA-toimintaaan agenttina ja etsii reittinsä AJAA-toimintaan. Jos on jotain Pekka-spesifiä tietoa joka muuttaa sitä, miten Pekka ajaa verrattuna geneeriseen kuskiin, ne tiedot aktivoituvat kulkiessa Pekan reittiä AJAA-virastoon. AUTO ja KOTI ovat haastavampia, sillä mikään yleinen AUTOn ja KODIn aktivoituminen ei riitä — no ne aktivoituvat, oletetaan sen verran. Pitäisi kuitenkin aktivoida PEKAN KOTI ja PEKAN AUTO kopioimatta koko AJAA-viraston byrokraattista logiikkaa Pekalle. Nyt tarvitaan kaikkien yhteispeliä, mutta ongelmana on taas, että näillä osasilla on varsin rajallinen käsitys toisistaan. ‘AJAA’ ei sisällä mitään Pekka-spesifiä polkua. ‘PEKKA’ voi sisältää polut Pekan autoon ja Pekan kotiin.
Miten maailmatietoon, eli kaupungin karttaan on talletettu se, että ajaessa autolla ajetaan yleensä omalla autolla ja ajaessa kotiin ajetaan yleensä omaan kotiin? Ehkä AJAA(PEKKA-AUTO-KOTI)-aktivoitumiskuvio yrittää löytää lyhyimmän tai helpoimman (vahvimmat painoarvot) reitin sen pisteiden välillä. PEKKA-käsitteestä on helposti tavoitettavissa Pekan omaisuus; Pekan auto ja koti ovat Pekkaan liittyviä tietoja, lähempänä kuin geneerinen auto ja koti. Koska tämä on teoria maailmatiedosta, tämä ei voi jättää detaileja enää muiden systeemien haltuun; kaikki mitä tiedämme AJAA(PEKKA-AUTO-KOTI)-kuviosta perustuu suoraan siihen mitä aktivoituu tämän kuvion myötä. Reitin täytyy olla niin ainutlaatuinen, että sen varrella on tilaa tähän tapahtumaan liittyville erityistiedoille ja yksittäisille muistoille, eikä se sama reitti saa aktivoitua jos jonkun osan vaihtaa. ‘Se kerta, kun olin kyydissä kun Pekka ajoi autolla kotiin ja näimme kolarin.’: tämä aktivoi tuon kuvion, mutta lisäksi jotain datapisteitä sen varrella joita käytetään risteyksinä erityishaaroille yksittäisiin tapahtumiin. En ole varma.
Tärkeää tässä kaupunkimetaforassa on, että data on kirjoitettu maastoon ja saa rakenteensa reittien mukaan. Lähinaapurustoissa läheisyys vaikuttaa — se epämääräinen, vaikeastinimettävä samankaltaisuus joka saman tyyppisillä asioilla on. Kauemmaksi päästään ominaisuuksien ja relaatioiden avulla — nimettyjä reittejä joita osaamme kutsua ja käyttää: ‘AASIN KORVAT’. Data ei ole pisteessä (käsitteessä) AASI eikä pisteessä KORVAT, vaan reitissä niiden välillä, reitissä jota kuljetaan vain kun aktivoidaan AASIN KORVAT. Reitti voi aktivoitua molemmista pisteistä, ja varmaan sen syntyminen vaatiikin molempien päiden yht’aikaista syttymistä.
Seuraavaksi katsotaan tarkemmin kaupungin asukkaita ja mitä henkisiä ominaisuuksia heiltä vaaditaan.
Semantiikkaa kielikoneeseen
(Käsiteltävä teksti: Laura Löfberg, Scott Piao, Paul Rayson, Jukka-Pekka Juntunen, Asko Nykänen, and Krista Varantola (2005) A semantic tagger for the Finnish language. Vol. 1, no. 1 Corpus Linguistics 2005)
Seuraavaksi siirrytään tutkimaan jo olemassaolevaa ohjelmallista ratkaisua, tai raporttia sellaisesta. Edellisten postien jälkeen on jo vankkoja aavistuksia siitä, miltä hyvän kielikoneen pitäisi näyttää ja sen pohjalta ihmettelen Kielikoneen ja yhteistyökumppaneiden projektia. FST = Finnish Semantic Tagger vastedes. FST-raportti= tuo artikkeli jota käsittelen. FST on rakennettu olemassaolevan USAS-taggerin päälle yhteensopivaksi. Myös ontologia, eli tässä tapauksessa semanttiset luokat on peritty siltä.
Semanttisen taggerin helpoin sovellus ts. sellainen joka ei tarvitse mitään muita läpimurtoja tai magiaa kuin semanttisen taggerin, on kontekstitajuinen sanakirja: jos osoittaa sanaa tekstistä, se vilkaisee ympärilläolevaa tekstiä ja päättelee sen avulla missä mielessä sanaa käytetään.
Suomen kielen semantiikan parserointi alunperin englannin kielelle suunnitellulla arkkitehtuurilla tuo tietenkin mielenkiintoisia eroja esille. FST-raportissa ensimmäinen on se, että suomessa yhdessä sanassa voidaan tarvita paljon dekompositiota ennen kuin päästään sinne juurisanaan, jolle pitäisi löytyä ontologiasta paikka. (Ontologialla tarkoitan vähän niinkuin leksikon semanttista vastinetta, paikkaa jonne sanojen semanttinen merkitys on tallennettu. Käsitteitä nämä eivät ole, ovat vähän turhan köyhiä siihen; jos ontologian järjestäisi oikein siitä tulisi käsitejärjestelmä, mutta sanoa näin niukkaa ontologiaa käsitejärjestelmäksi olisi kuin sanoa mitä tahansa ääntelyä kieleksi.)
Saadakseen suomen sanarakennelmat purettua FST käyttää TextMorfo-nimistä suomen morfosyntaktista analysoijaa. TextMorfo on Kielikoneen omistama, enkä pääse itse leikkimään sillä. Lemma, eli sanan juuri saadaan sillä esille ja se syötetään FST:lle. Huomattavaa on, että TextMorfo perkaa sanan kerrallaan ja analysoiduilla taivutusmuodoilla ei tehdä mitään: lauserakennetta ei edes yritetä miettiä.
Toinen suomen sanojen hassu piirre on yhdyssanojen yleisyys. Yhteenkirjoitetut yhdyssanat tekevät leksikon rakentamisen vaikeaksi; on välttämätöntä laatia joku keino erottaa yhdyssanan osat ja analysoida ne jos kokonaisuudelle ei löydy ontologiasta paria. Ajatellaan vaikka tilannetta, jossa sana ‘painajaisyönäsi’ esiintyy tekstissä: meille kielenkäyttäjille on selvää, että sanajuuri jota tuolla on ‘yö’. Koneen katseelle se ei nouse esille. TextMorfo voi irroittaa tuosta taivutukset pois, jättäen jäljelle sanan ‘painajaisyö’. Tällekään ei löydy ontologiasta ottajaa. Tällä yhdyssanalla on myös se kiva piirre, että ‘painajais’ ei ole sana jota näkisi yksinään, se esiintyy vain yhdyssanojen alkuosana. Tällaisille sanoille FST:hen rakennettiin oma luokkansa, CompPart. Sitten kun ontologiassa on lemma ‘painajais-’, yhdyssanan voi hakea pala kerrallaan: toinen sana alkaa siitä, mihin edellinen tunnistettava kokonaisuus päättyy.
Idiomiposteista tutut pulmat nousevat myös täällä: monisanaisilla idiomeilla on omat templaattinsa — ei kovin joustavat templaatit, eivät näytä sisältävän muuttujapaikkoja, mutta kuitenkin: ‘osoittaa elonmerkkejä’ analysoidaan osoittavan yhteen erityiseen kohtaan ontologiassa, ei niin, että se puretaan toiminnaksi OSOITTAA ja sitten jotain mitä osoitetaan.
Aika suoraviivaisia ratkaisuja.
Yhdyssanojen analysoinnista FST-raportissa myönnetään vielä sellainen heikkous, että yhdyssanoja purkavassa modulissa käydään ennen kuin käydään tarkistamassa löytyy koko klöntille leksikalisoitunutta merkitystä. Toinen myönnetty heikkous on, että yhdyssanakone ei tee TextMorfo-karsintaa irroitetuille osille: yhdyssanojen ensimmäinen sana on usein genetiivissä ja jos sille ei löydy osumaa, sanaa ei tunnisteta. Esimerkiksi ‘avaimenperä’ epäonnistuisi molemmista syistä: ‘-perä’ on huono vihje sille, minkälaisesta ontologisesta oliosta on kyse, ‘avaimenperä’ kokonaisuudessaan taas olisi niin yleinen ja tod.näk. leksikalisoitunut sana, että sille pitäisi olla oma edustajansa. ‘Avaimen’-palikka puolestaan ei sovi ‘avain’-aukkoon. Kolmas mainittu heikkous on, että yhdyssanakone tekee vain yhden splitin, kolmiosaiset yhdyssanat analysoidaan kaksiosaisina ja todennäköisesti väärin.
Sivupolku: pohdintaa paremmasta käsitejärjestelmästä
Onko edellä kuvaillusta tekstin semanttisen kentän ‘haistelusta’ hyötyä vai haittaa täydellisen kielikoneen kannalta: jos semanttista haistelua tarkentaa ja kehittää edelleen, oppiiko se ymmärtämään tekstiä? Sanon tuota semanttisen kentän haisteluksi, koska siinä otetaan sisään yksittäisiä leksikko-olioita kuin asioiden molekyylejä ja arvioidaan niiden määriä, menettäen samalla niiden suhteet toisiinsa: ‘tämä teksti ei käsittele kissoja’ ja ‘tämä teksti käsittelee kissoja’ saisivat samat pisteet kissa-aktivaatiossa; haiskahtavat kissoilta yhtälailla.
Jotta esimerkkilauseissa tekstin ja kissojen suhde laskettaisiin ymmärretyksi, sen pitäisi aiheuttaa jotain eroja. Jos teksti alkaa lauseella ‘Tämä teksti ei käsittele kissoja.’, ja jatkuu kertoen kissoista, se on yllättävää. Tuleville kissa-lauseille tulee koeteltua tulkintoja, jotka pitäisivät ne jonkinlaisessa merkityskoherenssissa ensimmäisen kanssa. Ensimmäinen lause ei ole läsnä enää kielenä, mutta jonakin semanttisena rakenteena joka ei ole kieltä, jonakin johon seuraavat lauseet tulevat lisäämään jotain. Vertaa romaaniin: sata sivua sitten tapahtuneet asiat ovat lauseina unohtuneet, mutta kirjan tapahtumina ne ovat tallessa ja sävyttävät uusien tapahtumien tulkintaa. Jotain valtavaa ja rakenteellista muodostuu lause lauseelta. Oletan, että käsitejärjestelmä on se joka tämän rakentaa ja josta se rakennetaan.
Haistelusysteemin ontologia käyttää luokkia: semanttinen läheisyys on sitä, kun käsitteet on luokiteltu samaan luokkaan. Kunnon käsitejärjestelmässä luokat toteutetaan dynaamisesti: me pystymme luokittelemaan asioita käsitejärjestelmällämme, mutta luokat ovat myös muokattavissa ja luokiteltavissa edelleen. Se tekee ne kovin pakenevaiseksi naturalistiselle käsitetutkimukselle: olisi erittäin hyödyllistä löytää käsitejärjestelmän luonnolliset luokat, luokat joiden muodostuminen on välttämätöntä eikä sopimuksenvaraista. FST:n ontologialla ei ole tätä huolta, mutta onhan se myös epätarkka ja kyvytön sanomaan luokan lisäksi mitään muuta käsitteestä.
Pauli Brattico on käyttänyt esimerkkinä mahdollisesta luonnollisesta luokasta käsitejärjestelmässä värejä. Värikäsitteet ovat monessa mielessä samanlaisia keskenään ja monessa mielessä ne eroavat muista käsitteistä. Jos oletamme värikäsitteet omaksi käsitteiden luokaksi, joilla on joitakin toiminnallisuuksia joita ei muilla käsitteillä ole, käsitteiden yleisen rakenteen mysteeri alkaa vähitellen aueta: ei tarvita yleistä käsitteen rakennetta, jonka täytyisi sopia kaikkiin käsitteisiin; värikäsitteet voivat olla rakenteeltaan omanlaisiaan ja aikakäsitteet omanlaisiaan. Niille tarvitaan vain yhteinen käyttöliittymä. Siksi naturalistiset käsiteluokat ovat meille läpinäkymättömiä: me käytämme niitä kaikkia samalla käyttöliittymällä, jotkut vain antavat erilaisia tuloksia ja tulosten erojen perusteella voimme päätellä, että nämä ovat syvällisesti erilaisia. Leksikolle nämä käsitteiden erot ovat myös näkymättömiä ja siksi meillä on kieliä, jotka tekevät omia älyttömiä leksikaalisia luokittelujaan femiineihin, maskuliineihin ym. kategorioihin, jotka kattavat koko maailman vaikuttamatta varsinaisesti käsitteisiin. Leksikkojen luokittelut eivät vaihtelisi niin kielten kesken, jos ne voisivat nähdä yhteisen käsitteellisen pohjan.
Käsitteiden yleisen rakenteen ongelma on siirtynyt käsitteiden yleisen käyttöliittymän ongelmaksi. Oli kyseessä sitten tunne, esine, toiminta tai väri, sillä voi ainakin yrittää tehdä erilaisia akteja; lopputulos riippuu käsitetyypistä, onko tämä metodi implementoitu sille vai ei? Kuulostaako tämä Python-ohjelmointikieleltä? Pitäisi kuulostaa.
Tässä esimerkkejä lauseista jotka kutsuvat tiettyä metodia eri käsitteistä:
- Miltä punainen näyttää?
- Miltä talo näyttää?
- Miltä haju näyttää?
- Miltä ikävä näyttää?
Tapauksissa 1 ja 2 sanalla ‘miltä x näyttää’-metodi on toteutettu joillakin suoraviivaisilla tavoilla, mutta erilaisilla. Punainen (1) näyttää punaiselta ja herättää kyllä vahvan mielikuvan, mutta juuri muuta siitä ei voi sanoa. (2) on myös ‘luonnollisesti’ tuettu: jos on talo, se varmasti näyttää joltakin. Se on esineiden tai fyysisten asioiden luokassa, jossa kaikki näyttävät joltakin. (3) on semanttinen rikkomus, hajuilla ei ole näkyvää muotoa. (4) on jossain HAJUn ja TALOn välillä: IKÄVÄlle voi rakentaa jonkun visuaalisen ilmentymän, mutta se ei ole välttämätön eikä välittömästi olemassa; se on jossain metaforisten mutkien takana. Kielen tasolla kaikki kysymykset 1-4 olivat yhtä hyviä, siellä ei tiedettä viitattujen käsitteiden tuetuista metodeista. Juuri se, että meillä on erillinen kielikone ja erillinen käsitejärjestelmä mahdollistaa sen, että kielellä voi luoda vaikeita ajatuksia, kuten 4, ohjata käsitejärjestelmän sinne, minne käsitejärjestelmä ei omin avuin pääse.
Luulenpa että tässä on tarpeeksi. FST:n rajat tulevat nopeasti vastaan, mutta todellisen käsitejärjestelmän liittäminen kielikoneeseen on vielä kaukana: jonkun pitäisi suunnitella ja rakentaa todellinen käsitejärjestelmä. Uskon voivani tehdä sen vielä.
Idiomaattista III - tuotannon puoli
Puheenparret, sanonnat, fraasit, tyhjät fraasit ja tervehdykset ovat selviä idiomaattisia tapauksia. Kun sanon ‘hei’ en ole varma haluanko ilmaista käsitteen HEI vai tuleeko syy laukaista leksikon ‘hei’ jostain toisesta suunnasta; jotkut idiomaattiset ilmaisut eivät tarkoita mitään siinä mielessä kun jotkut toiset tarkoittavat: ‘vedin päiväkännit’ selvästi tarkoittaa jotain käsitteiden maailmassa, edellisen postin perusteella JOIN PÄIVÄKÄNNIT. Pidetään vielä rinnalla ei-idiomaattinen ja täysin kompositionaalinen ilmaisu ‘kissa oli pöydällä’, jossa voidaan olettaa, että käsitteellisessä mielessä sille on vastaava käsitteellinen rakennelma KISSA OLI PÖYDÄLLÄ tai MENNYT(PÄÄLLÄ(KISSA, PÖYTÄ)), riippuen ihan miten käsitteiden maailmaa yrittää notatoida. Oikeaa tapaa sille ei tietääkseni ole.
Pelikenttä on siis tällainen:
Kieli | muita | Käsitteet
|aivojen| ..
Syntaksi |alueita| ILO
| | | | ...
Leksikko | | ELÄIN
[... | | ...
'kissa'--|-------|--KISSA
...] | |
Sanalle ‘kissa’ on vastine käsitteiden maailmassa, vastine joka ei ole kieltä, mutta saattaa sisältää kielellistä informaatiota; varmaan kaikki se mitä minä tietoisesti pystyn sanomaan sanasta ‘kissa’, sen etymologiasta jne. Tällaista tietoa on käsitteellisellä puolella, sillä kielikone ei ole tietoisuudelle kovinkaan läpinäkyvä: se tekee työtä käskettyä, mutta käskyt tulevat muualta.
Minun mallissani kieli ja käsitteet pidetään mahdollisimman erillään toisistaan mahdollisimman pitkään. Syyt tähän ovat seuraavat:
- Uuden kielen oppiminen ei vaadi käsitteiden uudelleen oppimista eikä käsitejärjestelmän kopiointia. Äärimmäisen harvat sanat toisessa kielessä vaativat uusien käsitteiden opettelua, yleensä löytyy samaa tarkoittava sana. Merkitysvivahde-erot voi rakentaa kirjaimellisesti lisäämällä maininnan merkitysvivahde-eroista leksikkoilmentymään.
- Kielen käsittelyn tehokkuuden kannalta leksikkoilmentymät ovat huomattavasti kevyempiä käsitellä kuin käsitteiden oletettavasti verkostomaiset ja informaatiorikkaat esitykset. Ohjelmointivertauksena: Kielen kannattaisi pelata pointtereilla muistiosoitteisiin, ei varsinaisilla objekteilla. Syntaksi harrastaa niin paljon sanojen siirtelyä ja uudelleenjärjestelyä, että palojen pitäisi olla kevyesti liikuteltavia.
- Syntaksin rakennelmien ja käsitteellisten rakennelmien välillä ei ole isomorfiaa: ‘Kissa on pöydän alla’ ja ‘Kissa on pöydän päällä’ ovat syntaktisesti samanlaisia, mutta kuvaavat päinvastaista asiantilaa. Lisäksi erilaisia käsitteellisiä avaruuksia kuten aikaa ja tilaa kuvataan samoilla kielellisillä relaatioilla. Jos kieli pudottaa tämän aika/tila eron pois, se tarkoittaa sitä, että sen säilyttäminen veisi resursseja — jos käsitteet ja leksikko olisivat yhtä, sanarelaatiot ja käsiterelaatiot olisivat myös samat.
- Liittyen edelliseen: kielellisesti mielekäs voi olla käsitteiden tasolla mahdoton tai epäuskottava. ‘Etsintä nautti vihreät ideat’ on käypää kieltä, mutta käsitteellisesti rikki. On niin helppoa lukea tekstiä ja muutaman sivun jälkeen tajuta, että ei lainkaan ymmärrä missä mennään. Nämä asiat prosessoidaan erikseen.
- On vaikeaa selittää ajatteluaan kielellä.
Oletetaan siis, että käsitteet ja kieli ovat eri moduuleissa ja jos ne ovat eri moduuleissa, niiden on vaihdettava informaatiota jotenkin säästeliäästi. Ne ovat toisilleen ymmärrettäviä vain tietyissä rajapinnoissa. Leksikaalisen ilmentymän ja käsitteen välinen yhteys on tärkein rajapinta.
Käsitteet ovat keskenään kompositionaalisia. Kielellä voi antaa reseptejä toiselle, mitä käsitteitä ottaa ja miten ne toisiinsa liittää, vaikkapa näin: ‘kissa on pöydällä’ -> C_1=’kissa’=>KISSA, C_2=’pöytä’=>PÖYTÄ, C_3=’on’(C_1,C_2)=>ON(C_1,C_2). Ainoat liikkuvat osat ovat nuo pointterit C_1..3. Käsitteet voivat myös muodostaa rakenteita omin päin ja ehdottaa näitä kielikoneelle kuvattavaksi: taaskin kulkemalla käsitteen yhteyslankaa sen leksikaaliseen ilmentymään.
Oletan, että kun käsite aktivoi leksikaalisen ilmentymänsä, se lähettää samalla jotain tiukasti koodattuja argumentteja siitä, millaisessa roolissa tämä käsite on käsitteellisessä rakennelmassa. Kielikone kuuntelee käsitteiltä tulevia aktivoituja leksikaalisia ilmentymiä ja yrittää näiden ja näiden saamien argumenttien perusteella rakentaa lauseita.
Idiomin aktivointi on käsitteiden puolella ihan samanlaista kuin minkä tahansa sanan aktivointi: seurataan käsitteestä lankaa leksikkoon. Nyt vain leksikossa aktivoituva olento on vähän erilainen, käsitteeltä tulevien argumenttien lisäksi se sisältää idiomiskeeman leksikossa olevia argumentteja, jotka rajaavat minkälaiseen lauseeseen ja millaisten sanojen ympäröimänä tämä idiomi toimii. Pahimmillaan idiomiskeema aktivoituessaan esittää kokonaisen kielellisen rakennelman ilman yhtään paikkaa muille käsitteille. Helppo hokema, tervehdys tai muu automatisoitunut kielellinen akti on tällainen. Yleensä, kun idiomiskeema aktivoituu, se antaa enemmän lauseen rakennusaineita, jonkun valmiin osan lauseen kehikkoa, kuin monta täysin kompositionaalista palasta. Se on helpompi kielelle.
Tämän pitäisi olla ilmaisun eroista huolimatta olla yhteensopivaa Chomskyn minimalismin kanssa, mutta hänen tapansa esittää tilanne painottaa minun kannalta vääriä kohtia ja jättää tämän käsitepuolen mysteeriksi. Minua kiinnostaa mitä informaatiota kielen täytyy lähettää käsitteille, että lause voi aktivoitua oikein; tämän informaation on oltava niukkaa ja yleistä, kieli ei tajua semanttisten alueiden eroista, mutta käsitteiden maailmaan voi rakentaa kontekstisidonnaisia tulkitsijoita.
(Uskon, että päätehtäväni yhdyssanojen mysteeri aukeaa näillä käsitteiden maailman kontekstisidonnaisilla tulkitsijoilla jotka saavat syötteensä kielikoneelta. On vaan pirun vaikea kirjoittaa tämä pelikenttä jota esittelin graduun niin, että se on riittävästi oikeutettu. Yhdyssanojen mysteeriä ratkoessa oikea pelikenttä on ihan oleellisen tärkeä valinta, mutta käsiteltävissä muiden teorioissa pelikenttä perustuu niin perin juurin rikkinäisiin tai syvälle kätkettyihin oletuksiin, että niistä teorioista on vaikea nousta tänne. Kumminpäin sen tekisi, esittelisi mikä heidän pelikentissään on vikana ja sitten esitellä omani, vaiko esitellä omani ja sitten tarkastella mikä niissä muissa on vialla siihen nähden? Se yleensä tehdään kritisoimalla muut eka, mutta siinä tyylissä on se ongelma, että kritiikki on niin satunnaisen oloista jos ei samalla tarjoa miten oikeasti asiat menevät ja se taas tuppaa laajentumaan oman teorian selitykseksi. Blaah. No, jatketaan pukerrusta.)
Idiomaattista II, monisanaista sekavuutta
(Jatkoa artikkelipohdintaan, Nenonen, Marja 2001. Idiomaticity in Finnish, kts. edellinen posti)
Monisanaiset idiomaattisuudet ovatkin haaste leksikolle. Jackendoff-tyylinen ‘pattern’, kuvio tai skeema tarvitaan näille, mutta se skeema ei koostu mistään atomisista osista, jotka tunnistetaan ensiksi, yksittäisistä sanoista, vaan se havaitaan suoraan ja yksittäisten sanojen tulkinta voidaan jättää väliin jos kuvio sopii.
Ensimmäinen Nenosen nostama joukko on substantiivifraasiidiomit, idiomaattiset adverbiaalit ja predikatiivit: ‘mieli’->’mielin kielin’, ‘olla/tulla hyvä/paha mieli’ ja ‘ottaa’->’tarkkaan ottaen’, ‘olla otettu’. Näiden käsitteelliset kohteet ovat selvästi olemassa, näillä on selvä merkitys johon nämä viittaavat, mutta leksikaalinen representaatio -> käsitteellinen merkitys -linkissä ongelmallinen kohta on leksikaalinen representaatio. Nämä tunkevat lauseen syntaksin puolelle, yliajavat syntaktista merkitystä myös sellaisilta sanoilta, joiden ei voi olettaa olevan varsinaisessa skeemassa. Tai siis yksinkertaisemmin, nämä leksikaaliset oliot sisältävät muuttujapaikkoja. Näistä esimerkeistä vain tuo ‘olla/tulla hyvä/paha mieli’ ilmentää tätä, ja varsin rajoitetusti (vain hyvä/paha ja olla/tulla ovat skeemaan sopivia vaihtoehtoja, mutta pian tulee lisää näitä.)
Epäilen, että idiomaattisilla fraaseilla fraasin sisällä sanojen syntaktinen suhde toisiinsa jätetään käsittelemättä ja sille annetaan joku idiomaattinen vastaus. Jos joku on ‘mielin kielin’, se ei silti kerro mitään hänen kielestään.
Oikeastaan edellinen voisi olla empiirisesti testattava väite: käsitelläänkö idiomaattisissa ilmaisuissa ‘ohitettavia’ merkityksiä jossain alitajuisesti (ne kalkyloidaan ja todetaan vääräksi ja hylätään) vai ohitetaanko ne sen kummemmin analysoimatta. Jos meillä on lause, jossa joku sana on sellaisen idiomin sisällä, jossa sana ei enää viittaa alkuperäiseen merkitykseen, huomataanko se hitaammin kuin normaalikontekstissa? Eli ‘mielin kielin’ kolahtaa hitaammin (tai jää huomaamatta useammin) kuin ‘opin uuden kielen’ jos spotattava sana on ‘kieli’? Varsinkin jos ollaa harjoitusajoissa viritetty ‘kieli’ sanaa vain lauseilla, joissa sitä käytetään kieli/language-sensessä. Tämä olisi kiva tutkia silmänliikkeiden kautta.. Menee.. menee.. menee.. peruuttaa ja tarkistaa uudelleen!
Nenonen jakaa monisanaiset fraasit neljään ryhmään, mutta yrittäessäni tulkita taulukkoa niistä en kyllä tajua mikä on ero kolmen viimeisen ryhmän välillä. Ensimmäinen ryhmä esiteltiin jo, niissä idiomi otti joko lauseen objektin tai adverbin paikan. Kolme viimeistä ryhmää ovat (1)verbifraasi-idiomit, (2) syntaksin jähmettymät ja (3) idiomirakenteet. Näistä esimerkkeinä Nenonen tarjoaa:
‘mieli’-> ‘olla eri/samaa mieltä’(1), ‘tehdä mieli’(1), ‘(jos) mielii’(2), ‘tulla/jäädä/juolahtaa mieleen’(2), ‘olla X:llä miele+llä’(3)
‘ottaa’-> ‘ottaa kaaliin’(1),’ottaa mieliharmia’(?? 1), ‘otti ja lähti’(2), ‘ottaa X:t’(2), ‘ottaa X+kse+en’(3), ‘ottaa X+sti’(3)
Taulukko on puristettu niin matalaksi, että se on saattanut menettää muutamia oleellisia kappaleenvaihtoja ja esimerkkien ryhmittely on menetetty samalla.
Ensimmäinen huomio:
‘Ottaa’-perheestä vain ‘ottaa X:kseen’ ja ehkä ‘ottaa mieliharmia’ sisältää ottamisen sen perusmerkityksessä. Tämä tarkoittaa, että käsitteiden maailmassa nämä eivät viittaa ‘ottaa’-käsitteeseen, mikä on huolestuttavaa lipsumista semantiikassa: ‘ottaa’ joka ei tarkoita OTTAA edes metaforisesti; jos idiomia yliyleistää, ‘ottaa avaimet’ ei tarkoitakaan enää OTTAA AVAIMET vaan jotain outoa muuta. Yliyleistämisen välttämiseksi näille idiomeille on tuntomerkkinä tietyt taivutusmuodot: jos ‘ottaa’ on lauseen verbi, idiomaattista merkitystä käytetään vain, jos objekti tai muut ympäröivät relevantit sanat sopivat skeeman tuntomerkkivaatimuksiin. ‘Ottaa avaimet’ onkin pulmallinen esimerkki siinä, että sehän oikeastaan sopii tuohon ‘ottaa X:t’-kriteeriin. Kriteerille on kuitenkin tarkennus: Nenosella ‘Ottaa X:t’ kuvaillaan ‘take X+ACC+PROPER NAME’='act like the one in question’, eli tarkoittanee jotain ‘Ottaa Hannut’= käyttäytyä hannumaisesti. Se, että yksikössä viihtyvä Hannu (proper name) taivutetaan monikkomuodon näköiseksi voisi siis toimia merkkinä, että tässä on kyseessä idiomaattinen juttu. Idiomaattisen tulkinnan signaalit ovat tässä sanonnassa aika heikot, mutta koko sanonta onkin harvinainen ja omiaan hämmentämään. Epäilen, että idiomitulkintaa tässä tapauksessa yritetään vasta kun kompositionaalinen tulkinta epäonnistuu.
Premissi: Monisanaisille idiomaattisille ilmauksille on välttämätöntä, että niille on joku aktivoitumisen ehto.
Jatkokysymyksiä: Jos ‘Ottaa Hannut’ on idiomaattinen, niin onko ‘ottaa torkut’ idiomaattinen, metaforinen vai ei kumpaakaan? ‘Ottaa avaimet’ ei ainakaan ole kumpaakaan ja ‘ottaa jalat alleen’ on ainakin idiomi. Jos ‘ottaa torkut’ on ok, miksi ‘ottaa bileet’* ei? Jos ‘ottaa torkut’ sisältää idiomaattisen osuuden, mikä on sen aktivoitumisehto, joka sallii sen, mutta ei salli ‘ottaa bileet’?
Ehkäpä idiomaattinen ilmaisu ‘pitää bileet’ interferoi jotenkin ilmaisun ‘ottaa bileet’* kanssa. Ainakin ‘pitää torkut’* olisi yhtä väärin kuin ‘ottaa bileet’*. ‘Pitää päiväunet’ puolestaan olisi ok. Tämäpä kimuranttia.
‘Ottaa torkut’, ‘ottaa päiväunet’, ‘ottaa kännit’, ‘ottaa päiväkännit’ — ovatko nämä generatiivisia idiomeja, voiko näitä sarjoja jatkaa sopivilla, tietyt ehdot täyttävillä objekteilla? Mitkä ovat nämä ehdot? ‘Ottaa kännit’-idiomille voi luoda sisaruksia semanttisesti samankaltaisilla sanoilla: ‘Ottaa pirit’, ‘ottaa kokaiinit’ toimisi samalla idiomilla, mutta ‘ottaa huumeet’ tai ‘ottaa lääkkeet’ ei… Eipäs.. Joo, ‘ottaa lääkkeet’, sehän on idiomaattinen ilmaisu, niin yleinen ettei sitä aluksi edes tajua ja voi hyvinkin olla juuri, josta yleistetään skeema näille muille.
Oletetaan, että on skeema ‘ottaa x:t’ joissa x on jotakin jonka saavuttaminen (jos tila) tai käyttö (jos esine) sisältää ottamisen kaltaisia liikkeitä (jokin joka on kaukana tulee lähemmäs). Tämä ei vielä selitä ilmaisuja ‘ottaa torkut’ tai ‘ottaa päiväunet’. Ok, yritetään uudestaan, tehdään kolme ‘ottaa x:t’ skeemaa:
- ‘ottaa x:t’, jos x viittaa UNEEN (huom. unen käsitteeseen) -> MENNÄ NUKKUMAAN JOKSIKIN AIKAA (joksikin aikaa: ei sanota, että ‘menen ottamaan yöunet’*
- ‘ottaa x:t’, jos x on esine jonka voi nauttia sisäisesti/ainesana -> NAUTTIA X:stä
- ‘ottaa x:t’, jos x on mielentila jonka voi saavuttaa nauttimalla jotakin ainetta -> NAUTTIA Y:STÄ SAAVUTTAAKSEEN X:N.
Ei voi olla huomaamatta, että näissä kolmessa skeemassa ‘ottaa x:t’ on korvattavissa ‘vetää x:t’. Tämänkin käyttöehdot eroavat hieman; on paljon ‘ottaa’-skeemoja, joissa ‘vetää’ ei toimi. Joko skeemoja pystyy kopioimaan suht’ helposti tai sitten edelliset skeemat pitäisi ilmaista muodossa ‘ottaa/vetää x:t’.
Tutkitaanpa vielä sääntöä 3. ‘ottaa kylläisyydet’* sopii säännön nykymuotoon, mutta ei se hyvältä näytä. ‘Ottaa/vetää virkistävät’ toimisi, kuten myös x=(täyttävä, raikastava, kyllästävä). Nämä eivät kuitenkaan enää ole samanmuotoisia kuin ‘ottaa/vetää kännit/humalat’. Taasko pitää luoda uusi skeema? Kavennetaan edellinen skeema 3 muotoon:
- 3. ‘ottaa x:t’, jos x viittaa HUMALAAN -> TAVOITELLA HUMALAA.
- 4. ‘ottaa x:t’, jos x on adverbiaali(?), joka kuvaa tilaa jonka saavuttaa nauttimalla y:tä -> NAUTTIA Y:STÄ SAAVUTTAAKSEEN X:N.
Tämä vain laajenee, eikä loppuyhteenvetoa näy. Alkaa olla aavistuksia siitä, mitä kaikkea idiomiskeemojen pitäisi kyetä tekemään, ts. mitä informaatiota skeemojen aktivoitumisehdot saavat käyttöönsä. Tämä informaatio kannattaa pitää minimissä ja jotenkin erottaa vialliset idiomit ‘ottaa bileet’* toimivista jo kielessä menemättä käsitteiden (ISOT KIRJAIMET) puolelle. Säännöt 1 ja 3 edellisistä jo menivät, mutta ne voisi ehkä korjata synonyymien tunnistamisella leksikkotasolla.
‘Ottaa/vetää kännit’ tulee esille myös Nenosen tekstissä. (Huomasin sen vasta nyt .) Nenosen luvun 3. osa käsittelee idiomialtista morfologiaa, eli morfologisia ilmiöitä, joita tapahtuu idiomien yhteydessä. Idiomien yhteydessä esiintyy poikkeuksellisia sijamuotoja ja lukumääriä — ‘kännit’ on monikossa; X+AKKUSATIIVI+MON,
‘pidän sinu+sta’ on sinä+ELATIIVI vaikka elatiiville tyypillistä sisältä-ulos aktia ei tapahdu (vrt. ‘tulin talo+sta’). (hmm?). Lisäksi Nenonen ottaa erikseen esille oudon possessiivitaivutuksen, vähin+tä+än, jossa tuo viimeinen +än on kolmannen persoonan POSS, eli sama kuin ‘rapu heilutti saksi+aan’, mutta tämä 3.POSS vähät välittää ovatko ympäröivät sanat 1. vai 2. persoonan. Eli ei sanota ‘olen vähintäni 180 senttiä pitkä’ tai ‘olet vähintäsi…’ Tämä outo possessiivitaivutus on hyvin leksikalisoitunut; ‘vähintään’ on vain yksi sana kaukana juurestaan, eikä sikäli ongelmainen. Muuten poikkeukselliset aika- ja sijamuodot ajavat mielestäni selvää tehtävää: ne toimivat idiomien tuntomerkkeinä.
Tosin nyt hämmentää, miksi ‘pidän X+sta’ tarvitsee idiomihälytyksen; eikö sanan ensisijainen merkitys olekin tämä mihin idiomiversio osoittaa? Varsinkin kun sanan toinen merkitys, PITÄÄ KIINNI, käyttää helposti samaa taivutusmuotoa: ‘pidän köydestä’. Onko tässä kyseessä toisenlaisesta säästämisestä? Jos pitämisen sense määräytyy täysin lausekontekstista, mutta idiomi yksinkertaistaa asettamalla, että aina kun ‘pitää’, pitää jostakin, eli ILLATIIVI.
Tähän mennessä idiomaattisuuksia on ihmetelty ymmärryksen kautta, kuinka ne aiheuttavat monitulkintaisuuksia ja kuinka idiomaattisiin ilmauksiin on kätketty vihjeitä siitä, että ne ovat idiomaattisia ja vaativat erikoiskohtelua. Seuraavaksi tutkitaan asiaa tuottamisen kannalta; eli jos minulla on käsitteellisessä mielessä jotain minkä haluan sanoa, miksi ja miten käytän idiomaattisia puheenparsia sen sanomiseen. Mitä etua sillä saavuttaa?
Idiomaattista I, eli lisää tunkua leksikkoon
Nenonen, Marja 2001. Idiomaticity in Finnish. In: Niemi, Jussi & Janne Heikkinen (eds.)
Nordic and Baltic Morphology: Papers from A NorFA Course, Tartu, June 2000. Studies in
Languages 36, University of Joensuu, Faculty of Humanities, pp. 57-65.
Edellisessä päästiin siihen, että sanojen yleisillä taivutetuilla muodoilla näyttää olevan oma tunnistettava leksikaalinen ilmentymänsä; ne tunnistetaan joutumatta purkamaan juurta ja päätettä. Kuinka pitkälle tämä ilmiö, tämä epäkompositionaalisuus oikein ulottuu? Marja Nenosen luku idiomeista auttakoon.
Välihuomautuksena suomi voi olla erinomainen kieli tämän tutkimiseen; meillä on intuitiivisesti sanoja, joiden juurisanaa ei edes tajua ennenkuin tutkiskelemalla ja yleensä meillä on se, että sanoja taivuttelemalla synnytetään ‘uusia’ sanoja. Meillä on myös luontevaa kysyä talletetaanko näitä uusia taivutusmuotoja/uusia sanoja jonnekin vai tehdäänkö ne aina uudestaan juuresta. Analyyttisissa kielissä intuitiot leksikosta hannaavat vastaan jos yrittää muodostaa samaa kysymystä: ‘On the bridge’ - onko tästä leksikaalinen esitys tallennettu? Se ei ole sana, se on rakenteellinen joukko sanoja, ja leksikko on luonteva paikka sanoille, ei näille joukoille. No, suomessa se olisi ’sillalla’ ja mikäs siinä, leksikkoon vaan. Englannissa ‘on the bridge’ olisi.. en tiedä onko se ihan idiomi vai fraasi vai mikälie, mutta joku hankala välimalli, josta ei tiedä mihin sen sijoittaisi.
Marja Nenonen käykin heti setvimään idiomille määritelmää. Ei-kompositionaalisuus on käypä avainsana, mutta Nenonen erottaa ‘idiomaattisen’, eli ei-kompositionaalisen eli sanojen sopan, jonka merkitys ei täysin määräydy sen osasista, varsinaisista idiomeista. En kylläkään tajua mikä se ero on. Idiomi on ehkä vain joku sanojen yhdistelmä, jossa on tarpeeksi idiomaattisuutta.
Nyt tekee mieli vähän känistä Fodoria vastaan. Hänen napakka argumentointi kompositionaalisuuden puolesta jättää idiomit ärsyttäviksi poikkeuksiksi, sotkemassa kaunista merkityksen rakentumisen systeemiä. Nyt kun todisteita kasautuu idiomaattisten (ei-kompositionaalisten) piirteiden yleisyydestä, niille ei ole enää paikkaa systeemissä. Nonosen luku listaa idiomaattisia ilmiöitä suomen kielessä, listaan ne perässä ja yritän ihmetellä mihin osaan kielikonetta nämä pitäisi tallettaa. Yleistävä väite Fodorista laimenee varmaan sen myötä.
Aloitetaan säilötyistä derivaatioista ts. johdannaisista:
‘mieli’-> ‘mielle’, ‘mielekäs’, ‘mieltää’, ‘mielistyä’ ja ‘ottaa’-> ‘otella’, ‘ottelu’, ‘ote’, ‘otanta’, ‘otollinen’ (Nenonen käyttää sanoja mieli ja ottaa juurina kaikissa tulevissa esimerkeissä, koska molemmat ovat yleisiä ja onnistuneet luomaan paljon idiomaattisia jälkeläisiä.)
Mielle on idiomaattinen, koska se mitä mielteellä tarkoitetaan on jotakin enemmän kuin saavutettaisiin ynnäämällä juuri mieli+pääte, varsinkin koska päätteelle ei ole morfologista sääntöä miten tämä pääte merkitystä muuttaa yleensä. Näille voi selvästi antaa leksikkoon oman representaationsa. Yhteys sanojen ‘ottaa’ ja ‘ottelu’ välillä on olemassa vasta kun sitä erikseen etsii; kielen käsittelyn teoria joka olettaisi, että molempien ymmärtäminen vaatisi ‘ottaa’-juuren aktivointia olisi huono, väärä ja paha.
Otetaan rinnalle vielä jähmettyneet taivutusmuodot (inflected freezes)
‘mieli’-> ‘mielellään’,'mielissään’ ja ‘ottaa’->’ottava’. Tämänkaltaisiahan käsittelin kahdessa edellisessä kirjoituksessa, joissa näytti siltä että jo taivutusmuodon yleisyys oikeuttaa sille oman edustajan leksikkoon. Nyt vain lisätään tälle edustajalle semanttisia piirteitä, joita ei voi perustella vain taivutusmuodolla. ‘mielellään’ ei tarkoita samaa kuin mieli+ADESSIIVI+POSS; se tarkoittaa sitä joskus, mutta yleensä ‘mielellään’ tarkoittaa jotakin mieluusti-sensessä.
Seuraava joukko idiomaattisia ilmaisuja on yhdyssanat (vai osa niistä?): ‘mieli’ ->’mielipide’,'avomielinen’,'luonnonsuojeluvihamielisyys’ ja ‘ottaa’->’ottopoika’,'vastaanotto’,'vastaanottoaika’. Näillä kaikilla taitaa olla leksikkoedustajansa, mutta sanojen semanttinen läpinäkyvyys vaihtelee. Osa on merkitykseltään 100% osiensa summa, osa taas vähän sitä ja paljon jotain idiomaattista muuta. ‘Vastaanotossa’ ei juurikaan ole ‘ottamista’ sen perusmerkityksessä.
Tähän mennessä kaikki idiomaattisuus on selvinnyt vain lisäämällä leksikkoon uusia sanoja, jonkun juuren versioita joilla on semanttista ekstraa. Nämä käsitellään suoraan, käymättä juuren kautta. Juuren kautta käyminen on yhä optio, johon turvautua jos suora merkitys ei sovikkaan, vaikkapa lauseessa ‘Minä en koskenut siihen käsilläni lainkaan, tuhosin sen mielelläni.’, jossa yllättäen onkin mieli+ADESSIIVI+POSS. Idiomien tie on nopea, mutta vaatii laajaa leksikkoa. Analyyttinen tie vaatii enemmän laskentaa. Oletettavasti reaktioaikoja mittaavat kielen ymmärrystä mittaavat testit nojaavat käyttävät paljon idiomien tien tarjoamia mahdollisuuksia.
Korjataan edellistä kappaletta: todennäköisesti idiomien tie ei aina ole ensisijainen vaihtoehto, kontekstilla pystyy virittämään ei-idiomaattisen ratkaisun helpommaksi. Suomen kielessä on paljon taivutuksia, jotka pakottavat ympärillä olevia sanoja (verbiä, ym) taipumaan mukana ja sitä kautta taivutusmuodot ovat ennakoitavissa. Oletettavasti edellisen kappaleen esimerkissä ‘…tuhosin sen mielelläni’ ‘tuhosin sen’-osuus on jo virittänyt adessiivin aika todennäköiseksi taivutusmuodoksi seuraavalle sanalle.
Jatkuu.. monisanaisilla idiomaattisuuksilla..
lauta+jA, vai lautoja?
Tein hakuja suomen yhdyssanoista (finnish compounds) ja sain nipun artikkeleita, joilla joko on tai ei ole relevanssia gradulle. Ne herättävät ajatuksia ja se on taas yksi ongelma, mihin minä nekin ajatukset tunkisin? Tähän.
Ensimmäinen artikkeli:
The role of context in morphological processing: Evidence from Finnish
Raymond Bertram, Jukka Hyönä and Matti Laine
Language and Cognitive Processes 2000, 15 4/5 367-388
Suomenkaltaiset vahvasti sanoja taivuttelevat kielet vihjaavat siihen, että sanat säilötään leksikossa jonkinlaisina runkoina - kaikkien muotojen säilyttäminen varsinkin erikseen olisi melkoista tuhlausta. Tässä paperissa tutkitaan partitiivin monikkoa, eli laukku-ja, auto-ja. Koska näissä on painotus, ne kirjoitetaan artikkelissa -jA. Seuraan tätä käytäntöä.
-jA sattuu myös olemaan yksi niistä päätteistä, joilla verbistä saa substantiivin; joku joka tekee verbiä: autta-jA, tutki-jA. Tämä homonymiaongelma tuli vastaan jo ruotsin ja italian kielioppia opiskellessa: samalla päätteellä tehdään eri juttuja eri kontekstissa. Sepäs on omiaan aiheuttamaan hämmennystä kieltä opiskellessa! Ilmeisesti tämä on kuitenkin jollain minimalismin & optimaalisuuden tasolla kannattavaa, koska kielet tekevät tätä paljon. Vrt. kaikki mitä ruotsissa tarkoitetaan päätteellä -en, -s tai italiassa -a, -e. Näyttää olevan siis halvempaa pitää samalla morfologisella päätteellä monta keskenään ristiriitaista käyttötarkoitusta kuin luoda uusia morfologisia päätteitä. Tai ainakaan ristiriitaiset käyttötarkoitukset eivät interferoi toisiaan.
Kokeissa yritettiin selvittää, josko sanan juuren yleisyys ja taivutetun muodon yleisyys vaikuttavat sen -jA taivutusmuodon lukunopeuteen. Bertram & kump. on käytössä silmänliikemittarit, joten lukemisen aktista — ainakin pintapuolisesti — saadaan tarkempaa tietoa kuin lue-teksti-ja-vastaa-mahdollisimman-nopeasti -paradigmalla. Kiinnostavaa minulle, mutta silmänliikealalla tuttua on myös, että tekstiä prosessoidaan melkoisina möhkäleinä; vähintään sana kerrallaan, usein enemmän ja päätteiden ja juurten tulkintajärjestys ei mitenkään välttämättä täydy olla siinä järjestyksessä missä kirjaimet sanassa ovat.
Mietitäänpä hetki mitä tarkoittaisi se, jos aluksi reagoidaan päätteeseen ja vasta sen jälkeen juureen. Jos näin olisi, päätteiden homonymia olisi ongelma; taas turhaan mutkistuu tulkinta kun pääte tarkoittaa erijuurisella sanalla eri asiaa. Bertram & kump huomauttavat, että lausekonteksti saattaa riittää poistamaan ambiguiteetin; jos tämänkaltaisia taivutettuja sanoja esitetään yksi kerrallaan ilman kontekstia, niiden tulkinta on suhteessa hitaampaa kuin pitäisi (Hyönä et al. 2000). Yleensä silmänliikkeitä käyttävät mallit päätyvät suosimaan rinnakkaisia prosesseja tai vähintään monikanavaisia lukiessa. Rinnakkaiset mallit ovat vaikeita. Jos toisella kanavalla selvitetään seikkaa A ja toisella seikkaa B ja molemmat saavat sen käsiteltävän aineistonsa samasta lähteestä, pitää päättää toimivatko ne molemmat saman raakadatan kimpussa muuttaen sitä, ja siten vaikuttaen toistensa toimintaan vai työskentelevätkö molemmat omalla kopiollaan. Jos omalla kopiollaan, kopioitu informaatio täytyy pitää minimissään ja päättää missä kohdassa se rinnakkaiset prosessit yhdistävät taas datansa.
Takaisin varsinaisiin tuloksiin. Muistutetaan siitä, että sanan juuren yleisyys (esim ‘lauta’, f=x) ei ole suoraan suhteessa sen taivutetun muodon ‘lautoja’ yleisyyteen. Joitakin sanoja käytetään useammin tietyssä taivutetussa muodossa kuin toista, perustaajuudeltaan vastaavaa sanaa. Molemmista, perustaajuudesta ja taivutetun muodon yleisyydestä löytyi vaikutusta, mutta perustaajuuden vaikutus tapahtui viiveellä (eli seuraavan sanan lukeminen oli hitaampaa). Se, että taivutetun muodon yleisyys nopeuttaa sen tunnistamista, vihjaa siihen, että taivutetut muodotkin on jotenkin tallennettu, ainakin yleisimmät.
Se, että yleisestä muodosta ‘lautoja’ on tallennettu jonkinlainen nopeastitunnistettava representaatio vie pois syitä varsinaisesti analysoida juuri+muoto erilleen. Sanalle ‘lautoja’ voi aivan yhtä hyvin olla suora yhteys käsitteelliseen merkitykseen. Tätä voisi yrittää havainnollistaa:
SYNTAKSI SEMANTIIKKA
Analyyttinen tapa:
'lautoja' -> 'lauta' -> subst -> objektina-mon-LAUTA
'-jA' -> monikko, partitiivi ->
Suora tapa:
'lautoja' -> -+> -> objektina-mon-LAUTA t. LAUTOJA
|
+->'lauta' -> subst
+->'-jA'-> monikko, partitiivi
Prepositioista
Pakollisia kielikursseja käydessä tuli vastaan graduun liittyvä, mutta silti vähän sivussa oleva ilmiö joka on mietityttänyt viimeaikoina. Asian pohdiskelu on tuntunut vähän turhalta koska vaatisi paljon tekstiä kirjoittaa tämä haara kiinni graduaiheeseen. Tämä lähti käyntiin ruotsin prepositioita ihmetellessä — kaikissa kielissähän oikean preposition käyttö tietynlaisten asioiden ja tapahtumien kuvaamiseen on täynnä opittuja idiomaattisia rakenteita joissa ei näytä olevan mitään syvempää logiikkaa, mutta lisäksi siellä ovat ne perustapaukset joissa on joku helpohko logiikka. Jos on joku esine, joka on toisen esineen päällä, se on aina englannissa ‘on’, ruotsissa ‘på’ ja suomessa ‘päällä’ tai ‘-llä’ ‘-lla’. Tämä on helppoa. Jostakin syystä ‘on’ ja ‘på’ prepositioita käytetään myös ilmaisemaan tietynlaisia toistuvia ajanjaksoja: ‘on mondays’, ‘på mondag’ tjs. Jos minulla olisi joku funktionaalinen kuvaus siitä, mitä ‘på’ tekee merkitykselle, tällainen sivuhaara på-preposition aikaanliittyvästä käytöstä hankaloittaisi funktionaalista kuvausta. Lisätään tähän ‘på’-olioon kaikki ne tilanteet, missä ‘på’ on oikea valinta prepositioksi ja olemme luoneet på-oliosta melkoisen sotkun.
Graduun liittyen: gradussa tärkeässä roolissa ovat juuri prepositiot ja kuinka oudon yhdyssanan merkitys ‘avautuu’ jos yhdyssanan osien väliin asettaa oikean preposition (sitä myöten relaation). Levin ja Gagnen teorioiden mukaan prepositiot vastaavat tiettyjä käsitteidenvälisiä relaatioita (relaatiot ovat siis jotain ei-kielellisiä prepositioita) ja eri relaatiotyyppejä (tai relaatioinstansseja, en ole varma kumpaa tarkoittavat — mutta tästä seuraisi mielenkiintoista piuhoitusta) on vain parikymmentä.
Mitäs tästä seuraisi? Jos meillä olisi joukko J relaatioita, ja siihen mäppäytyisi kielestä L(ruotsi) prepositio ‘på’ merkitsemään relaatiota J_1(PÄÄLLÄ) ja J_13(JAKSOTTAIN AJASSA) ja yksittäistapauksia relaatioissa J_5, J_9, J_14, J_15… Mahdollista, mutta tuntuu vähän turhalta. Ensinnäkin nämä (Levin) relaatiot ovat jonkinlaisia koosteita suunnilleen samanlaisista relaatioista, mutta koosteina ne sisältävät liian vähän informaatiota hoitaakseen hommansa loppuun. Esimerkiksi IN-relaatiosta on erilaisia seurauksia seuraavissa tapauksissa: ‘thought IN mind’, ‘thought IN brain’, ‘note IN tune’, ‘note IN sheet’, ‘cat IN box’. Jos objektit joiden pitäisi olla IN-relaatiossa toisiinsa nähden ovat erilailla olemassa toisiinsa nähden, niiden ‘olemisesta toisen sisällä’ seuraa erilaisia asioita kuin jos ne ovat esim. molemmat fyysisiä kappaleita. Jos ‘thought is in brain’, voiko se tulla ulos sieltä? Luoti voi tulla ulos aivoista, säilyttäen identiteettinsä, koska molemmat ovat fyysisiä kappaleita (tämä on se luoti joka oli aivoissa) mutta ajatus? Työtaakkaa näiden yksityiskohtien selvittämiselle ei voi sälyttää yleiselle IN-relaatiolle, mutta samaan aikaan: jos IN-relaatiota olisi syytä olettaa, sen pitäisi selittää jotain; mitä tarkoittaa kun jokin on toisen sisällä.