Aakkostus Suomessa
Standardin SFS 4600 lyhyt selitys ja kommentaari

Tämä dokumentti selostaa lyhyesti Suomen kansallisen standardin SFS 4600, Aakkostaminen ja siihen liittyvä ryhmittely (kolmas, uusittu painos, 2000-06-12, ks. SFS:n tiedotetta Uudet ohjeet aakkostamiseen), mukaiset aakkostussäännöt ja hiukan kommentoi niitä, mm. sanoittaista ja kirjaimittaista aakkostusta. Tavoitteena on kuvata eräitä pääkohtia lähinnä aakkosellisten luetteloiden käyttäjiä varten. Varsin yleisesti esim. puhelinluetteloissa, kirjojen hakemistoissa yms. sovelletaan standardin mukaista aakkostusta, joka joiltakin osin poikkeaa siitä, mitä ihmiset usein odottavat. Luetteloa tehtäessä tarvitaan usein tarkempia tietoja ja itse standardiin perehtymistä, ainakin, jos listassa esiintyy esim. ihmisten tai yhteisöjen nimiä, joita koskevat eräät erityissäännöt. Itse standardi on ostettavissa Suomen standardisoimis­liitolta ja luettavissa useissa kirjastoissa. (Eräisiin kirjastoihin hankitaan kaikki SFS-stan­dar­dit.)

Asiasisällön takia tällä Web-sivulla tarvitaan eräitä merkkejä, jotka eivät ole luotettavasti esitettävissä. Tämän takia kyseiset merkit, nimittäin šžűőœđŋ, selitetään myös sanallisesti. Jos itse merkit eivät näy oikein, asia saattaa olla korjattavissa selaimen asetuksia muuttamalla.

Perussääntöjä

Kirjainten perusjärjestys on tuttu:
a b c d e f g h i j k l m n o p q r s t u v x y z å ä ö.
Mutta sen lisäksi standardi määrittelee:

Syynä w:n käsittämiseen vain v:n muunnelmaksi lienee lähinnä se, että suomen kielessä w on ollut vanhastaan käytössä v-äänteen merkkinä. Vaikka 1900-luvulla v vakiintui, jäi w-kirjain moniin nimiin. Siltä kannalta on luonnollista esim. puhelinluettelossa aakkostaa Virtanen ja Wirtanen samoin. Toisaalta jos esimerkiksi amerikkalainen etsii nimeä suomalaisesta puhelinluettelosta, hän tuskin osaa ennalta odottaa, että v:llä ja w:llä alkavat sanat ovat sekaisin. Suuntaus on kohti w:n aakkostamista erikseen, ja tätä voidaan muodollisestikin perustella sillä, että miltei mikä tahansa luettelo on ymmärrettävissä ”monikieliseksi”. Se, miten w on aakkostettu, on usein hyvä joka tapauksessa mainita erikseen luettelon käyttöohjeessa.

Jos kahden ilmaisun ainoa ero on se, että toisessa on kirjaimeen liittyvä tarke ja toisessa ei, aakkostetaan ensin se, jossa tarketta ei ole. Esim. ”Linden” aakkostetaan ennen sanaa ”Lindén” (mutta ”Lindén, A.” ennen nimeä ”Linden, B.”) ja ”sakki” ennen sanaa ”šakki” (”shakki” hattu-s:llä kirjoitettuna; sen sijaan jos ”shakki” kirjoitetaan sh:lla, se aakkostetaan normaalisti).

Sanoittainen vai kirjaimittainen aakkostus?

Ehkä suurimmat ongelmat aakkosellisten luetteloiden käytössä aiheuttaa se, että sanan­välien käsittelytapoja on kaksi: sanoittainen, jossa sananväli (tyhjämerkki, välilyönti) otetaan huomioon, ja kirjaimittainen, jossa se jätetään huomiotta. Standardi ei sano asiaa kovin selvästi, mutta ilmeinen tarkoitus on, että sanoittaisessa aakkostuksessa tyhjämerkin ajatellaan edeltävän kaikkia muita merkkejä.

Esimerkiksi ”kevyt sinko” ja ”kevytpaino” ovat sanoittaisessa aakkostuksessa tässä jär­jes­tyk­ses­sä, koska tyhjämerkin ajatellaan olevan muita merkkejä ennen, joten merkkijono ”kevyt ” edeltää merkkijonoa ”kevytp”. Ehkäpä luonnollisin tapa ajatella sanoittaista aakkostusta on se, että etsittäessä ilmaisua siten aakkostetusta luettelosta haetaan ensin ensimmäinen sana ja vasta sitten ruvetaan kiinnittämään huomiota muihin sanoihin. Kirjaimittaisessa aak­kos­tuk­ses­sa järjestys on ”kevytpaino” ja ”kevyt sinko”, koska jälkimmäinen aakkostetaan ikään kuin se olisi kirjoitettu ”kevytsinko”.

Standardi suosittelee sanoittaista aakkostustapaa, ja lisää: ”Jos tästä poiketaan, se on ilmaistava luettelon käyttöohjeessa.” Lisäksi sukunimissä on aina noudatettava sanoittaista aakkostusta. Tämähän lienee selvää; haluamme, että kaikki Virta-nimiset ihmiset ovat listassa ennen Virtanen-nimisiä. Kirjaimittainen aakkostushan merkitsisi esim. järjestystä ”Virta, Jukka”, ”Virtanen, Jukka”, ”Virta, Paavo”! Mutta monet eivät varmaankaan muutoin pidä sanoittaista aakkostusta luonnollisena ja ilmeisenä periaatteena, etenkään siksi, että yhteen tai erikseen kirjoittamisessa on suurta horjuvuutta. Mistä luettelon käyttäjä etukäteen tietää, onko siinä kirjoitettu ”kevytsinko” vai ”kevyt sinko”? Niinpä minusta olisikin hyvä aina ilmaista luettelon käyttöohjeessa, kumpaa aakkostustapaa on noudatettu, ja selventää asiaa esimerkillä. Toki aivan pienet luettelot eivät mitään käyttöohjetta tarvitse; jos lista mahtuu yhdelle sivulle, niin eiköhän siitä näe tarpeeksi helposti, mitä se sisältää.

Suomalaiseen kirjaimistoon kuulumattomat kirjaimet

Edellä kuvatusta periaatteesta jättää tarkkeet huomiotta aakkostuksessa on muutama poikkeus:
ü ja ű (u, jossa on kaksoisakuutti; unkarissa käytetty) aakkostetaan kuten y (eikä kuten u)
õ ja ő (o, jossa on kaksoisakuutti; unkarissa käytetty) aakkostetaan kuten ö (eikä kuten o).

Eräät latinalaiseen aakkostoon (ilmaisun laajassa merkityksessä) kuuluvat merkit käsitellään aakkostuksessa seuraavasti:
ų kuten ö
ę kuten ae
œ (oe-ligatuuri; ranskassa käytetty) kuten oe
ß kuten ss
đ (d, jossa on poikkiviiva; saamessa käytetty) ja š kuten d
ž kuten th
ŋ (äng-merkki, ”n jossa on jalka oikealla”; äng-äänteen merkkinä saamessa käytetty) kuten n.

Muut kuin latinalaiset kirjaimet aakkostetaan latinalaisten kirjainten jälkeen, kirjaimistot keskenään niiden suomenkielisen nimen mukaan ja kunkin kirjaimiston sisällä ”yleisesti hyväksyttyyn” järjestykseen. Täten siis latinalaiset kirjaimet tulevat ensin, sitten esi­mer­kik­si arabialaiset, kreikkalaiset ja kyrilliset. (Jos esim. venäläinen nimi kirjoitetaan trans­lit­te­roi­tu­na, se tietenkin aakkostetaan kuten muutkin latinalaisin kirjaimin kirjoitetut ilmaisut.)

Monikirjaimistoinen aineisto voidaan standardin mukaan kuitenkin aakkostaa myös ENV 13170:n mukaan. ”ENV” tarkoittaa eurooppalaista esistandardia. Kyseinen ENV määrittelee ns. European Ordering Rules -säännöt (ks. EOR-luonnosta).

Muut merkit kuin kirjaimet

Hakemistoon otetaan usein ilmaisuja, joissa on muitakin merkkejä kuin kirjaimia. Niitä voi sisältyä esimerkiksi tuotteiden nimiin. Esimerkiksi ohjelmointikielen käsikirjan hakemistoon halutaan ehkä ottaa erikoismerkkejä kuten % ja # omiksi hakusanoikseen, jos niillä on kielessä jokin erityinen merkitys.

Numerot aakkostetaan ennen kirjaimia. Numerojonot aakkostetaan numeerisen järjestyksen mukaan, lukuina, esim. ”9”, ”10”, eikä merkkijonoina. Desimaali- ja murtoluvuille on erityis­sääntö­jä. Myös roomalaiset numerot aakkostetaan lukuarvonsa mukaan, esim. ”V”, ”IX”.

Muut merkit jätetään yleensä huomiotta. Tämä koskee sellaisiakin merkkejä, jotka vastaavat sanoja, esim. & ja %, samoin kuin yhdysmerkkiä, lyhenteisiin kuuluvaa pistettä jne. Esim. ”F/E” aakkostetaan siis kuten ”FE”. Kuitenkin erikoisaineistoissa voidaan erikoismerkit ottaa huomioon ja aakkostaa Unicode-koodiarvonsa mukaan. Ks. erityisesti ISO Latin 1 -merkistön koodiarvojen taulukkoa.

Huomattakoon kuitenkin, että sananvälit ovat merkitseviä sanoittaisessa (siis suositellussa) aakkostuksessa. Vaikka esim. lyhenteen ”fil. kand.” pisteet jätetään huomiotta, se käsitellään sanoittaisessa aakkostuksessa kuten ”fil kand” (ja vain kirjaimittaisessa kuten ”filkand”). Sananvälien käytön horjuvuuden takia tästä voi seurata ongelmia. Esimerkiksi ”f.o.b.” sijoittuu sanoittaisessa aakkostuksessa aika eri tavalla kuin ”f. o. b.”.

Lisäksi on erikoissääntö, jonka mukaan ajatusviiva otetaan huomioon kuten sananväli. Tästäkin johtuu ongelmia sen takia, että usein ajatusviivan tilalle kirjoitetaan yhdysmerkki, vieläpä jättämättä tyhjää väliä sen ympärille.

Lisäpoikkeuksia

Standardissa on lisäksi seuraavia asioita koskevia lisäsääntöjä, jotka merkitsevät poikkeuksia yleisistä säännöistä:

Erityisen hankalia ovat sukunimien etuliitteet. Niistä osa luetaan osaksi sukunimeä, osaa ei, eikä tässä ole mitään selvää sääntöä. Itse asiassa normiakaan ei ole, sillä asiaa koskeva taulukko on standardin ns. opastavissa tiedoissa, jotka eivät ole normatiivisia. Taulukon sisältö on seuraava:

KieliEtuliitteet, jotka luetaan sukunimeen Etuliitteet, joita ei lueta sukunimeen
englanti A’, Ab, Ap, D’, De, Fitz, M’, Mac, Mc, O’, Van -
espanja la, las, los, San, Santa, Santo de, de la, de las, de los, del
hollantiver de, den, der, ‘t, ten, ter, thor, van, van den, van der, vander, van’t
italia d’, dagli, dai, dal, dalla, dalle, de, de’, degli, dei, del’, della, delle, di, la, San, Santo de, de’, degli, dei, de li (ennen 1800-lukua eläneiden aatelisten henkilöiden nimissä)
portugali Santo, Sćo d’, da, das, de, do, dos
ranska des, du, l’, la, le, les, Saint, Sainte d’, de
ruotsi d’, de, du af, van, von, von der
saksa am, auf’m, aus’m, im, vom, zum, zur de, von, von dem, von den, von der, zu, zu dem, zu den, zu der

Menettely on paitsi mielivaltainen myös vaikeasti muistettava, koska eri kielten osalta nou­da­te­taan erilaisia periaatteita. Esimerkiksi ranskan osalta käytäntö on selitettävissä ja muis­tet­ta­vis­sa sellaisena, että pelkästä prepositiosta koostuva etuliite käsitellään nimestä eril­li­se­nä, kun taas etuliitteen ja artikkelin yhdistelmästä muodostunut sana (esim. du < de + le) tai artikkeli (esim. la) käsitetään nimeen kiinteästi kuuluvaksi. Mutta muiden kielten osalta menet­te­lyt ovat toisenlaiset.

Sukunimiä sisältävässä aakkostetussa luettelossa on aina syytä kertoa, miten etuliitteelliset nimet on aakkostettu, jos niitä esiintyy. Tosin jos niitä on vain muutamia, on ajateltavissa, että ne esiintyvät sekä etuliitteen mukaan että ilman sitä aakkostettuina siten, että toinen esiin­ty­mis­tä viittaa toiseen.

Loppuhuomautuksia

Aakkostussäännöt ovat siis suhteellisen mutkikkaat, ja lisäksi niiden niiden toteuttaminen ohjelmoinnissa on huomattavan hankalaa. Yleisessä tapauksessa jouduttaisiin oikeastaan tekemään tekstin semanttinen analyysi! Esimerkiksi merkkijonoa ”II” on käsiteltävä eri yhteyksissä eri tavoin sen mukaan, onko kyseessä lukua 2 tarkoittava roomalainen numero vai kaksikirjaiminen lyhenne jostakin. Vastaavasti esim. merkkijono ”en” voi olla asia­yhtey­den mukaan ruotsin kielen artikkeli, joka on jätettävä huomiotta, tai ruotsin kielen lukusana tai jotain ihan muuta.

Käytännössä jouduttaneenkin soveltamaan yksinkertaistettuja algoritmeja ja ehkä ”käsin” korjaamaan joitakin yksityiskohtia. Usein on suotavaa ottaa esimerkiksi hakemistoon sama ilmaisu kahteen tai useampaan paikkaan silloin, kun eri aakkostustavat sijoittaisivat sen aivan eri kohtiin, tai liittää hakemistoon lyhyt selostus aakkostusperusteista.

Standardia voidaan pitää monelta osin epäonnistuneena, eikä sitä sellaisenaan juurikaan noudateta, paitsi sattumalta – nimittäin silloin, kun aakkostettava aineisto on niin yksin­ker­tai­nen, ettei aakkostuksessa synny mitään ongelmia. Standardin noudattamista kuitenkin suo­si­tel­laan mm. Kielitoimiston oikeinkirjoitusoppaassa ja Kielitoimiston nimioppaassa. Jäl­kim­mäi­ses­sä itsessään ei kuitenkaan noudateta sitä. Ks. sivua Kielitoimiston oikein­kirjoitus­oppaan ja Kielitoimiston nimioppaan virheitä.