VALUUTTOJEN NIMIIN JA VALUUTTASYMBOLEIHIN KOHDISTUVAT KANNANOTOT JA VASTAUKSIA
Tähän on sisällytetty Jukka K. Korpelalta saatu kannanotto.
Siinä esitettyjä näkökohtia otetaan huomioon valmisteltaessa uutta kannanottopyyntöä siinä vaiheessa, kun CLDR 1.4:n sisällön määrittelevä LDML 1.4 on valmistunut.
*
Jukka K. Korpelan kannanotto (21.8.2005):
Luonnosta arvioidessani päädyin asteittain yhä vahvemmin siihen käsitykseen, että käytettävissä on liian vähän tietoja valuuttojen nimien ja symbolien aiotusta käytöstä. Käsitystä vahvisti mm. tutustuminen siihen kirjavuuteen, joka vallitsee eri kielten määrittelyissä CLDR:ssä. Käsitykseni mukaan ei ole mielekästä tässä vaiheessa tarkistaa ja vahvistaa näitä tietoja, vaan rakentavinta olisi pyrkiä herättämään kansainvälinen keskustelu aiotusta käytöstä ja siihen pohjaavasta linjasta nimien ja symbolien määrittelemisestä. Erityisesti tämä koskee sitä, tulisiko valuutan nimen sisällyttää maannimi siten, kuin nyt on tehty suomen kielen ja usean muun kielen määrittelyissä mutta ei suinkaan kaikissa.
Valuuttayksikön lokalisoituun ilmaisemiseen voi nähdäkseni syntyä tarvetta lähinnä kolmessa tilanteissa:
1) Tekstissä, esimerkiksi "42 puntaa" tai "42 puntaan" Nykyiset CLDR-määrittelyt eivät sovellu tähän ainakaan suomen kielen
osalta, vaikka rajoituttaisiin tyyppiä "42 puntaa" oleviin ilmauksiin.
2) Taulukossa tai muussa tiiviissä esityksessä, jossa on tarvetta
lyhyeen, usein määrämittaiseen (esim. enintään kolme merkkiä) valuutan
ilmaukseen, esimerkiksi "42 £". Tähän ns. symbolikenttä
voisi osittain soveltua, mutta tällöin olisi tiedettävä, kuuluuko
ideaan yksikäsitteisyys. Suomenkielisessä esityksessä olisi "US$"
yleensä keinotekoisen näköinen eikä juuri parempi kuin "USD", ja "$"
olisi useimmiten riittävä. Sen yksikäsitteisyys voidaan kuitenkin
kyseenalaistaa. Esimerkiksi hinnastossa tarvitaan lyhyitä ilmauksia,
useimmiten niin, että yhdessä asiakirjassa on vain yksi valuutta.
Tällöin riittää lyhin mahdollinen ilmaus sille, ainakin jos
selityksissä mainitaan sen valuutan nimi, jota valuutta tarkoittaa.
3) Valikossa, jossa valitaan esimerkiksi laskutusvaluutta. Tällöin
käytännössä kyseeseen tulee yleensä vain muutama tavallinen valuutta.
Luonnollisinta olisi tällöin käyttää sellaisia nimiä kuin "euro",
"dollari" ja "punta". Luonnoksessa olevat pitkät nimet olisivat melko
kömpelöitä.
Näin ollen näyttäisi siltä, ettei luonnoksen isoimmalle osalle,
valuuttojen nimille, olisi juurikaan järkevää käyttöä tietotekniikassa.
Analyysini voi olla väärä, mutta mihin ne sitten on tarkoitettu? Jos
tarkoitus on, että niitä käytetään generoitaessa sellaisia selityksiä
kuin "$ = Yhdysvaltain dollari = USD", niin silloin luonnoksessa
valittu linja on järkevä.
Sihteerin pikakommentti: Valuuttojen suomenkielisille nimille aiottu
tärkein käyttö on valuuttakoodien tulkitsemisessa käyttäjälle, ei
niinkään hakutekijänä valikossa.
Esitän kuitenkin joukon yleisiä huomautuksia, joista eräistä uskoakseni ilmenee, miksi päädyin mainittuun käsitykseen. Huomautuksissa ehkä ilmeneviä ristiriitoja en tässä ryhdy selittelemään, koska ne osaltaan ilmentävät juuri hämmennystä ja nykyisten CLDR-määrittelyjen monitulkintaisuutta.
Esitän niiden jälkeen myös yksityiskohtaisia ehdotuksia ja huomautuksia siltä varalta, että varsinaiseen tarkistustyöhön kuitenkin ryhdytään.
Yleisiä huomautuksia
- Ehdotettu linja, jossa ns. symboli-kentässä on vain harvojen valuuttojen kohdalla mitään, vaikuttaa oikealta. Sitä voisi harkita vielä tiukennettavaksi. Useimmiten ei lyhenteiden, valuuttamerkkien tai näiden yhdistelmien käyttö ole perusteltua, koska tällaiset merkinnät (esim. AU$, Tkr) eivät ole kovin laajassa käytössä varsinkaan nykyisin.
- Toisaalta kannanottopyynnöstä tai CLDR:n kuvauksesta ei ilmene,
mihin kyseisessä kentässä olevia merkkijonoja (teknisesti:
currency-elementin sisältämän symbol-elementin arvoa) on tarkoitus
käyttää. LDML:n määrittelyssä on esimerkki, jossa sekä USD:tä että
PTE:tä vastaa "$" ja JPY:tä vastaa "¥" (joka on myös juanin merkki).
Symbolilta ei siis vaadita yksikäsitteisyyttä. Tämän takia on
kyseenalaista, miten laajasti symboleita voi käyttää tulostuksessa.
Toisaalta valuuttojen nimet ovat pituutensa takia ilmeisen huonoja
useimpiin tulosteisiin. Sitä paitsi sellaista käyttöä varten olisi
kehitettävä keinot saada nimi oikeaan muotoon (jotta vältytään esim.
tulosteelta "42 Yhdysvaltain dollari"). Aiotun käytön tekee vielä
hämärämmäksi se, että LDML:n esimerkeissä on mm. USD:n nimenä "Dollar",
joka ei yksikäsitteisesti yksilöi valuuttaa.
Sihteerin pikakommentti: Symbolilta vaaditaan yksikäsitteisyys kunkin
paikallismäärityksen puitteissa.
- Käytännössä CLDR-määrittelyjä ei juuri tultanekaan käyttämään rahamäärien tulostuksessa, joten valuuttojen nimillä ja symboleilla on merkitystä lähinnä käännöstyössä. Tämänkään takia ei symboleita ole syytä määritellä kuin hyvin harkitusti.
- Yksi looginen vaihtoehto olisi poistaa kaikki kyseiset symbolimäärittelyt toistaiseksi sillä perusteella, ettei niitä voi valita järkevästi, ellei tiedetä niiden tarkoitettua käyttöä. Käytännössä tämä merkitsisi yleisten oletusarvojen käyttöä, jolloin muutamat harvat valuutat ilmaistaan valuuttasymboleilla ja muut kolmikirjainkoodeilla. Tämä välttäisi sekavuuden tilanteissa, joissa esiintyy useita valuuttoja: olisi ikävää, jos kahden merkintätavan rinnalla olisi kolmaskin ja niistä ulkonäöltäänkin poikkeava, lyhenteitä käyttävä. Vielä johdonmukaisempaa olisi määritellä samoin perustein, että myös kyseisten valuuttasymbolien tilalla käytetään kolmikirjainkoodeja. Tällöin tietysti herää kysymys, onko valuuttojen symbolien lokalisointi lainkaan mielekästä.
- Jos valuuttojen lokalisoidut symbolit määriteltäisiin CLDR:ssä käytettäviksi vain yhteyksissä, joissa esiintyy yhtä valuuttayksikköä, tilanne muuttuisi. (Tämä sisältäisi ajatuksen, että taulukoissa yms., joissa voi esiintyä monia valuuttayksiköitä, käytettäisiin lokalisoimatonta vaihtoehtoa eli kolmikirjainkoodeja.) Tällöin voitaisiin ehkä lähteä siitä, että tavoitteena on myös kehittää suomenkieliseen tekstiin sopivia lyhenteitä, joiden ei tarvitsekaan olla selittämättä selviä. Tällöin ei myöskään tarvittaisi yksikäsitteisyyttä, vaan esimerkiksi "$" voisi toimia monen eri valuutan symbolina. Kyse ei siis tällöin olisi vain yleisesti tunnetuista symboleista vaan myös sellaisista, jotka olisivat ainakin selitettyinä ymmärrettäviä ja mieleenjääviä (esim. AU$). Esimerkiksi "rpl" olisi ehkä useammille ymmärrettävämpi kuin "RUB" ja "zl" (poikkiviivan kera tai ilman) ymmärrettävämpi kuin "PLN". Toisaalta tällöin olisi ilmeisesti vältettävä valuuttojen (lyhyiden) nimien käyttöä, koska nimen liittäminen luvun perään tuottaa suomen sääntöjen vastataisen ilmauksen. Olisi houkuttelevaa määritellä esimerkiksi LVL:n symboliksi "lati", mutta tämä johtaisi käytännössä sellaisiin ilmauksiin kuin "42 lati" (pro "42 latia").
- Ehdotuksessa on valuuttojen nimissä järjestelmällisesti mukana maannimi, jos kyseessä on jonkin valtion valuutta. Tämän tarpeellisuus on kyseenalaista ainakin silloin, kun valuutan lyhyt nimi kuten "afgaani" on yksikäsitteinen. Muiden kielten määrittelyissä on ilmeisesti enimmäkseen lähdetty siitä, että maannimi on mukana vain, jos se on tarpeen valuuttojen erottamiseen toisista. Ks. http://www.unicode.org/cldr/data/diff/by_type/numbers_currencies.html. Maannimen pitäminen alussa olisi ehkä perusteltua, jos valuutannimiä käytetään valikoissa. Sellainen käyttö ei kuitenkaan ole mielekästä, jos monien (ehkä useimpien) kielten määrittelyissä ei kuitenkaan ole maannimeä mukana, ainakaan alussa (vaan on esim. "drachme" tai "dracma griego").
- Sekä tässä aineistossa että muussa kotoistamistyössä tulee eteen
kysymys vierassanojen kirjoitusasusta silloin, kun niitä käytetään
selvästi sitaattilainoina. Periaatteessahan tällöin tulisi säilyttää
alkuperäinen kirjoitusasu täysin, tarkkeita myöten. Esimerkiksi puolan
rahayksikön nimessä tulisi täten olla poikkiviiva l:n päällä (kuten
suomenkielisissä hakuteoksissa saattaa olla, vaikkakaan ei juuri
normaalissa kielenkäytössä). Asu "zloty" ei siis ole sitaattilainoja
koskevien sääntöjen mukainen, mutta se ei myöskään ole suomen
ortografiaan mukautettu asu. Tähän kaipaisin jonkinlaista
periaatteellista kannanottoa. Johdonmukaista linjaa (joko
sitaattilaina-asu tai lainasanan asu, joka tässä tapauksessa kai olisi
Suomessa tavallista ääntämystä vastaten "sloti") voi kyllä olla vaikea
ajaa, varsinkin tällaisessa aineistossa, jossa tavoitellaan
ymmärrettävyyttä eikä oikeakielisyyttä.
Sihteerin pikakommentti tähän ja muihin merkkikysymyksiin liittyen:
CLDR-määrityksissä pyritään siihen, että eri displayName-kentissä (ml.
valuuttojen nimissä) esiintyvät merkit myös sisältyvät ainakin
auxiliary-tyypin exemplarCharacters -määrittelyyn. Tämän laajuus on
toisaalta ollut kritiikin kohteena.
- Ehdotan sh:n korvaamista hattu-s:llä sanassa "shillinki". Tämä koskee useita valuuttoja (ATS, KES, SOS, TZS, UGS, UGX). Vaikka "shillinki" on vielä yleinen, hattu-s:llinen muoto on myös laajasti käytössä (ja sen rinnalla suomalaistetumpi asu "sillinki"). Kun nimen tunnistettavuudessa ei liene mainittavaa eroa, olisi etusijalle asetettava kielen yleisten sääntöjen mukainen kirjoitusasu; "shillinki" on eräänlainen sitaattilainan ja yleislainan sekoitus.
- Vuosilukuvälien merkinnöissä tulisi käyttää suomen kirjoitussääntöjen mukaisesti ajatusviivaa, ei yhdysmerkkiä, vuosilukujen välissä.
Valuuttakohtaisia huomautuksia
Valuuttoja käsitellään tässä luonnoksen mukaisessa järjestyksessä ja viitaten niihin kolmikirjaimisilla koodeilla (luonnoksen taulukon 1. sarake).
BAD
Pidän taivutusta "Bosnian ja Hertsegovinan dinaari" paljon
luonnollisempana kuin kielitoimiston suosituksen mukaista taivutusta,
jossa maannimen
alkuosaa ei taivuteta, "Bosnia ja Hertsegovinan dinaari". Kuitenkaan ei
kielitoimiston suosituksista pitäisi poiketa kuin tietoisesti,
harkitusti ja perustellusta syystä, joten jos luonnoksessa oleva muoto
säilytetään, tulisi tämä kannanotto perusteluineen saattaa
kielitoimiston tietoon. Luonnollisin ratkaisu olisi yhdistelmänimen
"Bosnia-Hertsegovina" ja siten nimen "Bosnia-Hertsegovinan dinaari"
käyttö; tämä vaatisi muutoksen maiden nimien luetteloon.
BAM
Vrt. edelliseen kohtaan.
BOV
Ehdotan kirjoitusasua "MVDOL" pro "mvdol". Kyseessä alkukirjainlyhenne, joka luetaan kirjaimittain.
CNY
Ehdotukseni: Kiinan juan.
Perustelu: Lisäosan "renminbi" käyttö on tarpeetonta ja hämmentävää. Se
ei tarkenna mitään, mutta se voi johtaa lukijan kysymään, onko
Kiinan juan renminbi jotenkin eri asia kuin Kiinan juan, joka on
monelle tuttu ilmaus, joskin ehkä virallisen romanisaation (pinyinin)
mukaisessa asussa "yuan". Arvioni mukaan "yuan" on suomenkielisessä
tekstissä jonkin verran
yleisempi kuin "juan", joten ymmärrettävyysperiaatteen pohjalta voisi
perustella myös nimeä "Kiinan yuan". Tämä on myös oikea asu,
jos nimi "yuan" käsitetään sitaattilainaksi.
DDM
Ehdotukseni: Itä-Saksan markka.
Suomessa ei käytetty sanaa "ostmark", joten miksi nyt käytettäisiin?
Sitä paitsi jos halutaan ottaa nimi suoraan saksasta, niin silloin kai
pitäisi käyttää saksan ortografiaa: "Ostmark".
GBP
Ehdotukseni: Ison-Britannian punta
Tätä nimeä myös käytetään, joskin harvemmin kuin nimeä "Englannin
punta".
Kun kuitenkin maiden nimistössä on päädytty "Isoon-Britanniaan", vaikka
tiedetään "Englannin" olevan yleisempi, tulisi tässä noudattaa samaa
linjaa.
(Leikillisenä vaihtoehtona voisi heittää esiin myös vanhan sanan
"puntasterlinki", joka on itsessään yksikäsitteinen ilman maannimeä.)
MDL
Ehdotukseni: Moldovan lei.
Perustelut ovat koodin ROL kohdalla.
NIC
Nimestä puuttuu aksentti: córdoba. Tässä aksentti on erityisen tarpeellinen,
koska se voi estää väärän ääntämyksen.
NIO
Tästäkin puuttuu aksentti: córdoba.
PLN
Yleishuomautuksessani esittämini perustein ehdotan harkittavaksi
zloty-sanan muuttamista sitaattilainan kirjoitusasuun eli poikkiviivan
lisäämistä l-kirjaimeen.
PLZ
Tätä koskee tietysti sama kuin PLN:ää.
ROL
Ehdotukseni: Romanian vanha lei.
Suomen kielessä käytetään sekä sanaa "leu" että sanaa "lei", joka on romaniankielinen monikkomuoto. Kumpikin esiintyy
myös virallistyyppisissä yhteyksissä. Sana "lei" on aiheellista
asettaa etusijalle, koska se ei aiheuta isoja ongelmia taivutuksessa, kun taas sana "leu" monikkovartaloiset muodot ovat lähinnä
mahdottomia (vrt. esim. "maksaa leillä" ~ "maksaa leuilla"). Jos valuutan nimi esiintyy yksinään ilman adjektiivia "vanha",
tai "uusi", se tulkitaan nykyistä valuuttaa tarkoittavaksi, joten selvennys on paikallaan, varsinkin kun rahanuudistus on tuore
(kesältä 2005).
RON
Ehdotukseni: Romanian uusi lei.
Sanasta "lei" ks. edellistä kohtaa.
STD
Príncipe-sanasta puuttuu akuutti aksentti ensimmäisen i:n päältä.
TOP
Nimessä "pa'anga" tulisi varmaankin olla suomen kielen ortografian
mukainen heittomerkki (U+2019) tai tarkkeenomainen heittomerkki
(U+02BC),
ei Ascii-heittomerkkiä (U+0027). Käsittääkseni kyseessä on
glottaaliklusiilin merkki, joten Unicode-standardin mukaan sen
tulisi olla U+U2BC. Näin näyttäisi CLDR:ssä olevankin, mutta koska
kotoistushankkeen dokumentteja varmaankin tullaan Suomessa käyttämään
tietolähteinä, tulisi kirjoitusasun niissäkin olla oikea.
(Käytännössä joudutaan usein korvaamaan U+02BC heittomerkillä tai jopa
U+0027:llä, mutta tämä tulisi tehdä vasta siellä, missä siihen on
pakko,
ei perusaineistossa.)
TRL
Ehdotukseni: Turkin vanha liira.
Jos valuutan nimi esiintyy yksinään ilman adjektiivia "vanha", tai "uusi", se tulkitaan nykyistä valuuttaa tarkoittavaksi.
TTD
Kielitoimiston kannan mukainen asu olisi "Trinidad ja Tobagon dollari".
Vrt. BAD:stä huomauttamaani.
UAH
Ehdotan tarkistettavaksi, vastaako kirjoitusasu "hryvnia" viralliseksi katsottavaa ukrainankielisen nimen suomalaista
translitteraatiota.
UAK
Ehdotan tarkistettavaksi, vastaako kirjoitusasu "karbovanetz" viralliseksi katsottavaa ukrainankielisen nimen suomalaista
translitteraatiota.
UYU
Ehdotus: Uruguayn peso.
Luonnoksessa oleva "Uruguayn peso uruguayo" on tautologinen ja
tautofoninen ja aivan liian hankala käytössä olevan valuutan nimeksi.
Nimi eroaa UYP:n nimestä sillä, että jälkimmäiseen sisältyy aikamäärite.
VEB
Nimeen "bolivar" tulisi lisätä akuutti aksentti i:n päälle: "bolívar". Tarkkeen pois jättämiselle ei liene perustetta.
XFO
Sanat "kulta frangi" tulee kirjoittaa yhdyssanaksi "kultafrangi".
--
Jukka "Yucca" Korpela, http://www.cs.tut.fi/~jkorpela/
16.1.2006