Path: news.cs.hut.fi!nntp.hut.fi!not-for-mail From: Jukka Korpela Newsgroups: sfnet.viestinta.nyyssit Subject: Re: Skandeista Date: Tue, 05 Sep 2000 06:37:05 +0300 Organization: Helsinki University of Technology Lines: 86 Message-ID: References: <39b25533.10543219@news.surfeu.fi> <%lvs5.15$ua1.7274@news.kpnqwest.fi> NNTP-Posting-Host: cc-dialin4-8.hut.fi Mime-Version: 1.0 Content-Type: text/plain; charset=ISO-8859-1 Content-Transfer-Encoding: 8bit X-Trace: nntp.hut.fi 968125163 15248 130.233.221.8 (5 Sep 2000 03:39:23 GMT) X-Complaints-To: usenet@nntp.hut.fi NNTP-Posting-Date: 5 Sep 2000 03:39:23 GMT X-Newsreader: Forte Agent 1.7/32.534 Xref: news.cs.hut.fi sfnet.viestinta.nyyssit:8856 jukka-news@narnia.tky.hut.fi (Jukka Suomela) wrote: >Skandeja lähetetään suomalaisten nyyssiartikkeleiden otsakkeissa >käytännössä kahdella eri tavalla: joko sellaisenaan Latin-1-koodattuina >tai sitten RFC2047:n mukaisesti enkoodattuna. (Molempia tapoja voidaan >perustella.) Sama voidaan sanoa artikkelien rungosta. Sielläkin ovat Internetin alkuperäisten standardien mukaan vain US-Ascii-merkit mahdollisia. Itse asiassa kannattaakin mahdollisimman pitkälle käyttää vain US-Asciita nyyseissä. Esimerkiksi englanninkielisiin ryhmiin ei pidä lähettää viestejä, joissa on muita merkkejä, ellei ole painavaa syytä. Yksikin merkki voi aiheuttaa paljon sotkua, varsinkin, jos lähettäjä ei tunne ohjelmaansa - hulluimmillaan yksi skandi tai muu ei-US-Ascii-merkki aiheuttaa koko artikkelin lähettämisen jollain omituisella tavalla koodautuneena. Mutta vain mahdollisimman pitkälle. Ei ole kohtuullista vaatia, että suomea, ruotsia tai saksaa, venäjästä tai kreikasta puhumattakaan, kirjoitettaisiin US-Asciita käyttäen (vaikka kaikenlaisia viritelmiä onkin kehitelty sitä varten). Otsakkeet ovat eri asemassa kuin runko, mutta Subject-rivin osalta pätevät samat perusnäkökohdat kuin yllä. Kuten kirjoitat, molempia tapoja voidaan perustella. Yleensä on syytä tiukasti pitää kiinni protokollasta - tarkoitan nyt niitä teknisiä konventioita, joiden varassa koko netti toimii. Ja protokollan mukaan, siis MIMEllä höystetyn viestisyntaksin mukaankaan, muut kuin Ascii-merkit eivät ole otsakkeissa sallittuja. Mutta sitten on muutama painava vasta-argumentti: - ISO-Latin-1-koodin mukaiset skandit toimivat käytännössä suomalaisten lukijoiden ruuduilla - rajoittuminen US-Asciihin on lähinnä jäännettä ajalta, jolloin oli vakavasti varauduttava siihen, että data kulkee 7-bittisen siirtotien kautta, mikä alkaa olla historiaa; luonnollisestikin se, mitä Asciihin kuulumattomat 8-bittiset oktetit tarkoittavat, jää erillisen sopimuksen varaan, mutta käytännössä se on Suomessa ISO-Latin-1 - sen sijaan RFC 2047:n mukainen merkkien koodaus otsikoissa aiheuttaa ongelmia paitsi mm. Forté Free Agentin käyttäjille myös luettaessa viestejä Dejan (ja luullakseni usean muunkin vastaavan järjestelmän) kautta. >>Aivan varmaahan on, ettei niitä skandeja ole _pakko_ sinne >> laittaa. Suomenkielessä on paljon valinnanvaraa. > >Tämä on minunkin mielestäni suositeltavaa. Valitaan otsikko, jossa ei >ole skandeja. Jos sellaista ei millään keksi, korvataan vain skandit >a:lla ja o:lla. Olen yleensä voimakkaasti korostanut, että merkkivalikoima on rajoitettava siihen, mikä luotettavasti toimii kussakin välineessä, vaikka se merkitsisi esimerkiksi typografisesti ala-arvoista esitystä tai vaatisi kömpelöitä korvikenotaatioita. Mutta raja kulkee jossakin, ja ajatus suomen kielen typistämisestä luopumalla ä:stä ja ö:stä tai niiden pisteistä menee liian pitkälle. Etenkin kun ne nyt alkavat olla melkoisen turvallisesti käytettävissä miltei kaikissa kansallisissa yhteyksissä. Tulemme toimeen ilman hattu-s:ää ja hattu-z:aa, vaikka kielitoimisto (perustellusti) korostaa niiden kuuluvan suomen kirjaimistoon. Tulemme nyyseissä mainiosti toimeen ilman euron symbolia. Selviämme ajatusviivattomuudesta käyttämällä yhdysmerkkiä alkeellisena korvikkeena. Siedämme sitä, että oikeiden lainaus- ja heittomerkkien tilalla joudutaan käyttämään "suoria" Ascii-merkkejä. Ja tietysti keksimme jotain ihmeellistä, kun olisi tarpeen kirjoittaa jokin venäjän sana tai matematiikan kaava. Ja jätämme ä:n ja ö:n pisteet pois meiliosoitteista, nyysiryhmien nimistä ja monesta muusta. Mutta rajansa kaikella. Ä-kirjaimen frekvenssi normaalissa suomenkielisessä tekstissä on on noin 5 %. Sen välttely viestejä kirjoitettaessa on äärimmäisen luonnotonta. Ja Subject-rivi on viesti, vieläpä hyvin tärkeä viesti. Otsikon muotoileminen fiksusti on ihan tarpeeksi vaikeaa ilman mitään kuviokelluntoja, joilla vältetään ä ja ö. Leikkinä on sellainen ihan hauskaa - vähän aikaa - että pitää olla käyttämättä jotakin kirjainta tai äännettä, mutta ei sotketa sitä normaaliin viestintään. Mitä siis jää vaihtoehdoiksi? Käytännön tasolla voimme kysyä: Kuinka monelle suomalaisten ryhmien lukijalle ISO-Latin-1:n mukaiset ä:n ja ö:n esitykset Subject-riveillä aiheuttavat todellisia ongelmia, ja moniko heistä selviäisi paremmin esim. QP-koodatuista skandeista siellä? -- Yucca, kaikkien alojen erikoisdiletantti Nyysiopas: http://www.hut.fi/u/jkorpela/nyysit/