Nykyajan kielenopas, luku 4 Kirjoitusmerkit:

Aakkosjärjestys

Yleistä aakkostuksesta

Aakkosjärjestyksen merkitys

Aakkosjärjestyksellä on merkitystä lähinnä järjestettäessä tietoja luetteloiksi, joista on voi­ta­va helposti hakea tietoja silmäilemällä. Aakkostamisen merkitys on vähentynyt, kun tieto­tek­niik­ka on teh­nyt yhtä useammissa tilanteissa mahdolliseksi hakea tiedot suoraan eikä luet­te­loi­ta se­laa­mal­la.

Aakkostaminen on silti usein tarpeen. Sen oikeellisuudella saattaa olla huomattavakin mer­ki­tys esimerkiksi silloin, kun kokouksen osallistujista pitää tehdä aak­ko­sel­linen lista. Myös painetun kirjan aakkosellisella hakemistolla on suuri merkitys. Hakemisto on usein tarpeen myös e-kirjassa, koska hyvin tehdyssä hakemistossa on viittaukset tärkeimpiin kohtiin, joissa kukin hakusana esiintyy.

Aakkostussäännöt

Eri kielissä ja eri yhteyksissä on käytössä erilaisia aakkostustapoja. Esimerkiksi ö-kirjain on suomen kielessä erillinen kirjain aakkoston lopussa, kun taas saksassa se rinnastetaan aak­kos­tuk­ses­sa o-kirjaimeen ja erotetaan siitä vain niissä harvoissa tapauksissa, joissa niiden ero on peräkkäisten sanojen ainoa ero. Turkin kielessä taas ö on aakkostuksessa erillinen kirjain kuten suomessa, mutta sijoitetaan o:n jälkeen.

Vaikka suomen kielen perusaakkosten järjestys on varsin vakiintunut, on yksityiskohdissa ongelmia ja eroavuuksia. Lisäksi vieraiden kirjainten, numeroiden, välimerkkien ja erikois­merkkien huomioon ot­ta­mi­ses­sa on suuriakin eroja aakkostustavoissa.

Suomalainen aakkostusstandardi SFS 4600

Huonosti tunnettu ja heikosti noudatettu

Aakkostamista koskeva nykyinen kansallinen standardi SFS 4600 on sekava ja asiallisesti monin tavoin vanhentunut. Lisäksi se on huonosti tunnettu, ja sitä noudatetaan harvoin. Kuvaavaa on, että Kielitoimiston nimiopas kyllä suosittelee standardin mukaista aakkostusta, mutta ei itse noudata sitä.

Seuraavassa kuitenkin kuvataan standardin pääkohdat. Lisätietoja siitä on sivulla Aakkostus Suomessa <http://www.cs.tut.fi/~jkorpela/abc.html>.

Kirjainten järjestys

Suomalais-ruotsalaisen perusaakkoston kirjainten järjes­tys on tuttu: a b c d e f g h i j k l m n o p q r s t u v x y z å ä ö.

Kirjaimet v ja w on vanhastaan käsitetty suomalaisessa aakkostuksessa samaksi kir­jai­mek­si, toisin kuin esi­mer­kik­si englannin aakkostussäännöissä. Tämä johtuu siitä, että aiemmin w oli suomessa vain v-kirjaimen esitysmuoto.

Valta, Waltari, Virta

Aakkostamista koskevan standardin mukaan kuitenkin monikielisessä aineistossa voidaan v ja w aakkostaa erikseen, ja tätä noudatetaan varsin yleisesti. Tähän ovat vaikuttaneet vieraat nimet, jotka tulevat kielistä, joissa w:llä on selvästi erillinen asema. Moni­kieli­syy­den ehtoa on tulkittu väljästi: esimerkiksi puhelinluetteloissa on nykyisin yleisesti käytössä tämä aak­kos­tus­tapa. On todennäköistä, että myös normit muutetaan yleisesti sellaisiksi, että v:tä ja w:tä pidetään eri kirjaimina, varsinkin kun Ruotsissa on päädytty tällaiseen ratkaisuun v. 2005.

Valta, Virta, Waltari

Tarkkeiden vaikutus

Useimmat tarkemerkit (diakriittiset merkit) kuten aksentti jätetään huomiotta. Esim. é käsi­tel­lään siis aakkos­tuk­ses­sa kuten e. Sääntö koskee myös š- ja ž-kirjainta. Kuitenkin merkit å, ä ja ö toki kuuluvat vakiintuneille paikoilleen. Lisäksi ü ja ű aakkostetaan kuten y, ja kirjaimet õ ja ő aakkostetaan kuten ö.

Linna, Linné, Lintunen
saalis, šakki, samppanja, šeikki, sekki

Sanoittainen ja kirjaimittainen aakkostus

Ihmisten nimet aakkostetaan yleensä siten, että ensisijainen aakkostus on sukunimen mu­kaan, ja toissijaisesti otetaan huomioon etunimet. Muussa aakkostuksessa on käytössä kak­si vaihtoehtoista periaatetta silloin, kun aakkostettavat tiedot koostuvat useista sanoista:

Kansallinen standardi suosittelee ensisijaisesti sanoittaista aakkostusta, ja sitä myös yleisesti käytetään mm. puhelinluetteloissa. Toisaalta lukijat usein kokevat sen omituiseksi. Käytännön hankaluutena siinä on, että lukija ei aina tiedä, kirjoitetaanko hänen etsimänsä ilmaisu yhteen vai erikseen.

Suomen ympäristökeskus, Suomenlinna

Kirjaimittaista aakkostusta käytettäessä olisi järjestys esimerkissä päinvastainen eli aak­kos­tet­tai­siin ikään kuin kirjoitusasu olisi ”Suomenympäristökeskus”.

Muut merkit kuin kirjaimet

Standardin mukaan muut merkit kuin kirjaimet jätetään yleensä huomiotta.

A/B aakkostetaan kuten AB
e-kirja aakkostetaan kuten ekirja
Virta & Lahti aakkostetaan kuten Virta Lahti

Tähän on kuitenkin seuraavat poikkeukset:

Sukunimien etuliitteet

Ihmisten sukunimien etuliitteet tuottavat usein ongelmia aakkostuksessa. Niitä koskeva standardin osa on sekava ja epäjohdonmukainen, eikä lukijoiden voi olettaa tuntevan sitä. Toisaalta ongelma ei käytännössä useinkaan ole suuri, koska esimerkiksi von Fieandtit ovat varmaankin tottuneet etsimään nimeään sekä V-kirjaimen että F-kirjaimen kohdalta.

Sääntöjen mukaan jätetään useimmat meille tutut etuliitteet kuten ruotsin ”af, ranskan ”de”, hollannin ”van der” ja saksan ”von” huomiotta aakkostuksessa, eli esim. von Fieandt tulee aakkostaa F-kirjaimen kohdalle. Sen sijaan esimerkiksi brittiläisten nimien alussa oleva ”O’” (esim. ”O’Connor”) käsitetään osaksi itse nimeä (ja heittomerkki jätetään huomiotta aakkostuksessa).

Modernit aakkostusperiaatteet

Tasoittaisuus

Nykyaikainen ajattelu aakkostusasioissa perustuu tasoittaisuuteen:

Ajattelutapa etenee siis päinvastaiseen suuntaan kuin esimerkiksi standardissa SFS 4600, joka määrittelee vain kansallisesti tärkeimpien merkkien jär­jes­tyk­sen ja täydentää sitä lisäsäännöillä. Periaatteessa ero on vain muodollinen, mutta käy­tän­nös­sä SFS 4600 käsittelee merkkejä sitä epämääräisemmin ja huo­li­mat­to­mam­min, mitä enemmän mennään vanhan perusmerkistömme ulkopuolelle.

Unicode-aakkostussäännöt

Unicode-aakkostussäännöissä (Unicode Collation Algorithm) ylimmän tason perus­jär­jes­tys on melko samantapainen kuin suomalaisessa standardissa. Se voidaan yksin­ker­tais­taen kuvata näin:

  1. Välilyönti ja siihen rinnastettavat merkit.
  2. Välimerkit.
  3. Erikoismerkit (symbolit).
  4. Numerot.
  5. Latinalaiset kirjaimet.
  6. Kreikkalaiset kirjaimet.
  7. Muut kirjaimistot määrätyssä järjestyksessä.

Yksityiskohdissa eroja on hyvin paljon. Yleisesti Unicode-perusjärjestyksessä tarkkeellinen kirjain rinnastetaan tarkkeettomaan, ja esimerkiksi ä ja å käsitetään tällöin a:n tarkkeellisiksi muodoiksi. Tämä tietysti tekee kansalliset muutokset, ”deltat”, usein välttämättömiksi. Eri­koi­suu­te­na voi mainita, että thorn ž käsitetään omaksi kirjaimekseen, joka sijaitsee z:n jäl­jes­sä, kun taas esimerkiksi eth š rinnastetaan d-kirjaimeen.

Unicode-aakkosjärjestyksen suomalainen sovellus

Edellä kuvatulta pohjalta on laadittu standardi SFS-EN 13710, joka perustuu eurooppalaiseen standardiin, joka taas perustuu yleismaailmalliseen standardiin. Standardin kansallinen osuus on varsin suppea.

SFS-EN 13710:n mukaan kirjainten perusjärjestys on sama kuin SFS 4600:n mukaan, paitsi että thorn ž sijaitsee å:n edellä omana kirjaimenaan. Suomalainen perinne otetaan huomioon seuraavina poikkeamina kansainvälisistä standardeista:

Muutoin tarkkeet jätetään yleensä huomiotta, mikä osittain poikkeaa SFS 4600:sta. Pienten ja isojen kirjainten välillä ei yleensä tehdä eroa. Jos se on kuitenkin ainoa ero sanojen välillä, pienikirjaiminen sana tulee ensin. Aakkostus on kirjaimittaista. Lukuja ym. koskevat erikoissäännöt puuttuvat, joten luvut aakkostetaan merkkijonoina (esim. 100, 2, 2200, 23) eikä luku­arvon mukaan.

Seuraava esimerkki sisältää ilmauksia SFS-EN 13710:n mukaisessa aakkosjärjestyksessä.

.com
@-merkki
42
5
A/B
AB
Abba
Delaware
Šilas
OAU
œuvre
ohra
saalis
šakki
salainen
übermukava
Ylermi
Zorn
Žór
Åberg
Ęble
Äyräpää
Ųrsted
Öölanti
α

Unicode-aakkosjärjestyksestä on melko havain­nol­li­sia taulukoita Unicode-konsortion sivustossa Collation Charts. Se käyttää melko vaikeaa käsitteistöä, mutta sen taulukoita voi usein hyödyntää ilman syvällistä ymmärtämistä. Esimerkiksi kohdista Punctuation ja General-Symbol voi tarkistaa erikoismerkkien keskinäisen järjestyksen, jos joutuu käsin lajittelemaan aineistoa, jossa on tietotekniikan tms. erikoismerkkejä (esimerkiksi `^_ jne.).