Kotoistus > Kannanottopyynnöt > Päättyneet > Kommentteja CLDR 1.6:n uusista ja muuttuneista arvoista
Tehdyt toimenpiteet

Kommentteja CLDR 1.6:n uusista ja muuttuneista arvoista

Oheen kerääntyvät kotoistushankkeen jäsenten kommentit työryhmän CLDR-suositusehdotuksista sekä työryhmän vastaukset.

Jukka K. Korpela

29.4.2008


Huomautan, että sivulla http://www.csc.fi/sivut/kotoistus/kannanotot_html/avoimet
oleva taulukko on hämmentävästi muotoiltu, koska siinä ei ole selvää
kappalejakoa tai vastaavaa eikä siten ole selvää, mitkä
Esitys-sarakkeessa olevat rivit kuuluvat keskenään yhteen. Päivämäärien
satunnaiselta näyttävä sijoittelu aiheuttaa lisävaikeuksia.

Asiakirja ”Kotoistustyöryhmän suositusehdotuksia (CLDR 1.6)”,
http://www.csc.fi/sivut/kotoistus/kannanotot_html/avoimet/Kotoistustyoryhman-suositusehdotuksia-080428
vaikuttaa varsin sekavalta: se tuntuu argumentoivan joitakin ehdotuksia
vastaan mainitsematta niitä.

Lisäksi se selittää pitkästi Bliss-symbolien olemusta, vaikka tässä
yhteydessä ainoa merkitsevä ongelma on ortografinen: Bliss-symbolit vai
blisssymbolit? Tämäkin ongelma ratkeaa helposti, koska kolme ässää
peräkkäin ei ole käytännöllistä.

Pitkästi on selitetty myös kahden pienen alueen nimien ortografista
vaihtelua, joka osoittaa lähinnä vain kielenkäytön huolimattomuutta.
Tässähän on olennaista vain se, noudatetaanko ranskan vai englannin
kirjoitusasua, ja tällaiset kysymykset kai on jo ratkaistu yleisissä
linjauksissa, joskin varmaankin vain implisiittisesti: lähtökohtana on
alkuperäiseksi katsottava kieli, ei englanti.

Kirjoitusjärjestelmien nimiä -kohdassa ensimmäiseksi herättää
ihmetystä ”valtakunnanaramealainen”. Muodollisesti sana on oikein
muodostettu, mutta en usko, että sitä on käytetty tai tullaan käyttämään
suomessa. Suomessa ei juuri taida esiintyä valtakunnan-alkuisia sanoja
kuin joissakin erikoisissa merkityksissä, esimerkiksi ”valtakunnansali”.
Ihmetystä herättää sekin, että englanninkielinen nimi on varsinaisesti
sama kuin tunnus eli koodi ja sen jäljessä vain on sulkeissa selitys: ”Armi
(Imperial Aramaic)”. Ehdotan, että suomenkielistä vastinetta ei
määritellä, jolloin CLDR-periaatteiden mukaan nimeksi tulee tunnus (”Armi”),
jos se esiintyy automaattisesti generoitavassa suomenkielisessä
esityksessä (mikä lienee hyvin teoreettinen mahdollisuus).

Prti-koodia vastaavaksi esitettyä sanaa ”piirtokirjoituspartilainen” en
ymmärrä. Missä vaiheessa parthialainen on muuttunut partilaiseksi?

Zmth on englanniksi ”Zmth (Mathematical notation)”, mikä on hiukan outoa
(miksi koodi on mukana?), mutta hiukan outoa on sekin, että suomalainen
käännös on pelkkä adjektiivi. Kyse on kuitenkin kirjoitusjärjestelmän
nimestä, ja kun englannissakin on substantiivi, voisi suomeksi sanoa ”Matemaattinen
merkintä”.

Muunnelmia-kohdassa esitetään joukko suomalaisesta näkökulmasta täysin
merkityksettömiä murteiden yms. nimiä, jotka asiakirjan mukaan lisäksi
ovat merkitykseltään hämäriä. Ehdotan, että niille ei määritellä nimiä
suomalaisissa asetuksissa. Näidenkin osalta esiintyminen on lähinnä
teoreettinen mahdollisuus, ja kyse olisi joka tapauksessa erikoisalan
asioista, jolloin lukijan voi olettaa tuntevan tai selvittävän koodien
merkitykset (jos hän käyttää suomalaisia määrittelyjä).

Muuten olen sitä mieltä, että suomalaisten tulisi vaatia CLDR-työssä
määriteltävien koodien _merkityksen_ tarkempaa määrittelemistä silloin,
kun merkitys ei ole ilmeinen. Sellainen ajatus, jonka mukaan pelkkä
englanninkielinen ilmaus, joka lisäksi on usein hämärä ja jopa
harhaanjohtava, olisi riittävä koodin määrittelemiseksi CLDR-työssä, on
pahan luokan kulttuurista vinoutuneisuutta, englantikeskeisyyttä – ja
lisäksi siis varsin epäkäytännöllistä. Kun kukaan ei tiedä, mitä jokin
koodi oikeasti tarkoittaa, on lokalisoitujen nimien määrittely arpapeliä
ja koodin hyödyllisyys sangen kyseenalainen.

Merkitystä on kuitenkin seuraavilla:

BAKU1926
Tämä ei ole ”Turkin yhtenäistetty latinalainen aakkosto”, varsinkaan kun
ensimmäinen versaalialkuisuus veisi ajatukset Turkkiin maana eikä turkin
kieleen. Kyseessä on Bakussa vuonna 1926 pidetyssä konferenssissa
päätetty aakkosto kaikkia turkkilaisia kieliä varten. ”Turkkilainen”
olisi siis parempi:
Yhtenäistetty turkkilainen latinalainen aakkosto
tai ehkä vielä paremmin
Yhtenäinen turkkilaisten kielten latinalainen aakkosto

SCOTLAND
Ehdotettu vastine ”skotlanninenglanti” on hyväksyttävissä, vaikka siitä
puuttuukin sanan ”Standard” sisältämä merkitys. Tarkin vastine olisi
luullakseni ”skotlanninenglannin yleiskieli”. En tiedä, miksi on
määritelty juuri Standard-muodolle oma tunnuksensa (ehkä siksi, että
kielikoodin ja maakoodin yhdistelmän ajatellaan tarkoittavan
skotlanninenglantia yleisesti?), mutta kun niin on, niin ehkäpä
suomennoksen pitäisi vastata kyseistä rajausta.


Työryhmän vastauksia

30.4.2008


Bliss-symbolit
Kuten todettua, ehdotettu arvo on oikein. Perustelut eivät ole osa CLDR-tietokantaa, ne ovat tarjolla ainoastaan kotoistushankkeen jäsenten tiedoksi äänestysvaiheen ajan.

Saint-Barthélemy ja Saint-Martin
Ranskankielisten nimien valinta perustuu painettuihin lähteisiin.

Valtakunnanaramealainen
Sana on käytössä olevaa suomea. Englanninnokset ovat kotoistustyöryhmän lisäämiä selvennöksiä, sillä työmme alkaessa saatavilla olivat ainoastaan arvojen nelikirjaimiset lyhenteet. Tietokantaan ne eivät sisälly.

Piirtokirjoituspartilainen vs. -parthialainen
Tämä on totta. Mikäli vasta-argumentteja ei määräaikaan mennessä ilmene, arvo muutetaan "parthialaiseksi".

Mathematical notation
"Mathematical notation" on jälleen työryhmän selvennös, joka ei perustu tietokantaan vaan muuta kautta hankittuun tietoon. Adjektiivimuotoinen arvo on linjassa muiden kirjotusjärjestelmien kanssa.

Muunnelmat
Tällaisten arvojen määrittämisen tarpeellisuus on toki kyseenalaista, mutta olisi järjetöntä jättää ne sisällyttämättä tässä vaiheessa, kun määritys on jo suoritettu.

Koodien merkityksen tarkempi määritteleminen
Pitää paikkansa. Tosin näissäkään tapauksissa uudet suomenkieliset arvot eivät perustu työryhmän vaan alojen ammattilaisten aiemmin tekemiin käännöksiin.

BAKU1926
Aiheellista. Työryhmä hyväksyy "yhtenäistetyn turkkilainen latinalaisen aakkoston".

Skotlanninenglanti
Yleiskieli olisi varteenotettava vaihtoehto siinä tapauksessa, että skotlanninenglannille olisi määritelty myös muita muotoja. Näin ei kuitenkaan toistaiseksi ole.