Aakkosjärjestyksellä on merkitystä lähinnä järjestettäessä tietoja luetteloiksi, joista on voitava helposti hakea tietoja silmäilemällä. Aakkostamisen merkitys on vähentynyt, kun tietotekniikka on tehnyt yhtä useammissa tilanteissa mahdolliseksi hakea tiedot suoraan eikä luetteloita selaamalla.
Aakkostaminen on silti usein tarpeen. Sen oikeellisuudella saattaa olla huomattavakin merkitys esimerkiksi silloin, kun kokouksen osallistujista pitää tehdä aakkosellinen lista. Myös painetun kirjan aakkosellisella hakemistolla on suuri merkitys. Hakemisto on usein tarpeen myös e-kirjassa, koska hyvin tehdyssä hakemistossa on viittaukset tärkeimpiin kohtiin, joissa kukin hakusana esiintyy.
Eri kielissä ja eri yhteyksissä on käytössä erilaisia aakkostustapoja. Esimerkiksi ö-kirjain on suomen kielessä erillinen kirjain aakkoston lopussa, kun taas saksassa se rinnastetaan aakkostuksessa o-kirjaimeen ja erotetaan siitä vain niissä harvoissa tapauksissa, joissa niiden ero on peräkkäisten sanojen ainoa ero. Turkin kielessä taas ö on aakkostuksessa erillinen kirjain kuten suomessa, mutta sijoitetaan o:n jälkeen.
Vaikka suomen kielen perusaakkosten järjestys on varsin vakiintunut, on yksityiskohdissa ongelmia ja eroavuuksia. Lisäksi vieraiden kirjainten, numeroiden, välimerkkien ja erikoismerkkien huomioon ottamisessa on suuriakin eroja aakkostustavoissa.
Aakkostamista koskeva nykyinen kansallinen standardi SFS 4600 on sekava ja asiallisesti monin tavoin vanhentunut. Lisäksi se on huonosti tunnettu, ja sitä noudatetaan harvoin. Kuvaavaa on, että Kielitoimiston nimiopas kyllä suosittelee standardin mukaista aakkostusta, mutta ei itse noudata sitä.
Seuraavassa kuitenkin kuvataan standardin pääkohdat. Lisätietoja siitä on sivulla Aakkostus Suomessa <http://www.cs.tut.fi/~jkorpela/abc.html>.
Suomalais-ruotsalaisen perusaakkoston kirjainten järjestys on tuttu: a b c d e f g h i j k l m n o p q r s t u v x y z å ä ö.
Kirjaimet v ja w on vanhastaan käsitetty suomalaisessa aakkostuksessa samaksi kirjaimeksi, toisin kuin esimerkiksi englannin aakkostussäännöissä. Tämä johtuu siitä, että aiemmin w oli suomessa vain v-kirjaimen esitysmuoto.
Aakkostamista koskevan standardin mukaan kuitenkin monikielisessä aineistossa voidaan v ja w aakkostaa erikseen, ja tätä noudatetaan varsin yleisesti. Tähän ovat vaikuttaneet vieraat nimet, jotka tulevat kielistä, joissa w:llä on selvästi erillinen asema. Monikielisyyden ehtoa on tulkittu väljästi: esimerkiksi puhelinluetteloissa on nykyisin yleisesti käytössä tämä aakkostustapa. On todennäköistä, että myös normit muutetaan yleisesti sellaisiksi, että v:tä ja w:tä pidetään eri kirjaimina, varsinkin kun Ruotsissa on päädytty tällaiseen ratkaisuun v. 2005.
Useimmat tarkemerkit (diakriittiset merkit) kuten aksentti jätetään huomiotta. Esim. é käsitellään siis aakkostuksessa kuten e. Sääntö koskee myös š- ja ž-kirjainta. Kuitenkin merkit å, ä ja ö toki kuuluvat vakiintuneille paikoilleen. Lisäksi ü ja ű aakkostetaan kuten y, ja kirjaimet õ ja ő aakkostetaan kuten ö.
Ihmisten nimet aakkostetaan yleensä siten, että ensisijainen aakkostus on sukunimen mukaan, ja toissijaisesti otetaan huomioon etunimet. Muussa aakkostuksessa on käytössä kaksi vaihtoehtoista periaatetta silloin, kun aakkostettavat tiedot koostuvat useista sanoista:
Kansallinen standardi suosittelee ensisijaisesti sanoittaista aakkostusta, ja sitä myös yleisesti käytetään mm. puhelinluetteloissa. Toisaalta lukijat usein kokevat sen omituiseksi. Käytännön hankaluutena siinä on, että lukija ei aina tiedä, kirjoitetaanko hänen etsimänsä ilmaisu yhteen vai erikseen.
Kirjaimittaista aakkostusta käytettäessä olisi järjestys esimerkissä päinvastainen eli aakkostettaisiin ikään kuin kirjoitusasu olisi ”Suomenympäristökeskus”.
Standardin mukaan muut merkit kuin kirjaimet jätetään yleensä huomiotta.
Tähän on kuitenkin seuraavat poikkeukset:
Ihmisten sukunimien etuliitteet tuottavat usein ongelmia aakkostuksessa. Niitä koskeva standardin osa on sekava ja epäjohdonmukainen, eikä lukijoiden voi olettaa tuntevan sitä. Toisaalta ongelma ei käytännössä useinkaan ole suuri, koska esimerkiksi von Fieandtit ovat varmaankin tottuneet etsimään nimeään sekä V-kirjaimen että F-kirjaimen kohdalta.
Sääntöjen mukaan jätetään useimmat meille tutut etuliitteet kuten ruotsin ”af”, ranskan ”de”, hollannin ”van der” ja saksan ”von” huomiotta aakkostuksessa, eli esim. von Fieandt tulee aakkostaa F-kirjaimen kohdalle. Sen sijaan esimerkiksi brittiläisten nimien alussa oleva ”O’” (esim. ”O’Connor”) käsitetään osaksi itse nimeä (ja heittomerkki jätetään huomiotta aakkostuksessa).
Nykyaikainen ajattelu aakkostusasioissa perustuu tasoittaisuuteen:
Ajattelutapa etenee siis päinvastaiseen suuntaan kuin esimerkiksi standardissa SFS 4600, joka määrittelee vain kansallisesti tärkeimpien merkkien järjestyksen ja täydentää sitä lisäsäännöillä. Periaatteessa ero on vain muodollinen, mutta käytännössä SFS 4600 käsittelee merkkejä sitä epämääräisemmin ja huolimattomammin, mitä enemmän mennään vanhan perusmerkistömme ulkopuolelle.
Unicode-aakkostussäännöissä (Unicode Collation Algorithm) ylimmän tason perusjärjestys on melko samantapainen kuin suomalaisessa standardissa. Se voidaan yksinkertaistaen kuvata näin:
Yksityiskohdissa eroja on hyvin paljon. Yleisesti Unicode-perusjärjestyksessä tarkkeellinen kirjain rinnastetaan tarkkeettomaan, ja esimerkiksi ä ja å käsitetään tällöin a:n tarkkeellisiksi muodoiksi. Tämä tietysti tekee kansalliset muutokset, ”deltat”, usein välttämättömiksi. Erikoisuutena voi mainita, että thorn ž käsitetään omaksi kirjaimekseen, joka sijaitsee z:n jäljessä, kun taas esimerkiksi eth š rinnastetaan d-kirjaimeen.
Edellä kuvatulta pohjalta on laadittu standardi SFS-EN 13710, joka perustuu eurooppalaiseen standardiin, joka taas perustuu yleismaailmalliseen standardiin. Standardin kansallinen osuus on varsin suppea.
SFS-EN 13710:n mukaan kirjainten perusjärjestys on sama kuin SFS 4600:n mukaan, paitsi että thorn ž sijaitsee å:n edellä omana kirjaimenaan. Suomalainen perinne otetaan huomioon seuraavina poikkeamina kansainvälisistä standardeista:
Muutoin tarkkeet jätetään yleensä huomiotta, mikä osittain poikkeaa SFS 4600:sta. Pienten ja isojen kirjainten välillä ei yleensä tehdä eroa. Jos se on kuitenkin ainoa ero sanojen välillä, pienikirjaiminen sana tulee ensin. Aakkostus on kirjaimittaista. Lukuja ym. koskevat erikoissäännöt puuttuvat, joten luvut aakkostetaan merkkijonoina (esim. 100, 2, 2200, 23) eikä lukuarvon mukaan.
Seuraava esimerkki sisältää ilmauksia SFS-EN 13710:n mukaisessa aakkosjärjestyksessä.
Unicode-aakkosjärjestyksestä on melko havainnollisia taulukoita Unicode-konsortion sivustossa Collation Charts. Se käyttää melko vaikeaa käsitteistöä, mutta sen taulukoita voi usein hyödyntää ilman syvällistä ymmärtämistä. Esimerkiksi kohdista Punctuation ja General-Symbol voi tarkistaa erikoismerkkien keskinäisen järjestyksen, jos joutuu käsin lajittelemaan aineistoa, jossa on tietotekniikan tms. erikoismerkkejä (esimerkiksi `^_ jne.).