BCP 47 ja ISO 639: peamised erinevused ja kasutusalad

Statistikaameti keelte klassifikaator

Stastistikaameti keelte klassifikaator põhineb ISO 639-2 standardil, sisaldades kolmetähelisi keelekoode.

Keelte klassifikaatori originaalne avaldamiskoht on Statistikaameti klassifikaatorite keskkonda (vt Keelte klassifikaator).

Keelte klassifikaator on kasutusel vanemates tervise infosüsteemi dokumentides ja vormingutes ning seetõttu on see avaldatud ka TEHIKu terminoloogiaserveris. Uuemad FHIR teenused eeldavad tihti BCP 47 kasutamist tulenevalt FHIR spetsifikatsioonist.

ISO 639

ISO 639 “Codes for the Representation of Names of Languages” eesmärk on keelte ühtne identifitseerimine koodide abil. See koosneb mitmest osast:

  • ISO 639-1: kahetähelised koodid (nt en = inglise, et = eesti),

  • ISO 639-2 ja 639-3: kolmetähelised koodid (nt eng = inglise, est = eesti), kusjuures 639-3 hõlmab kõiki teadaolevaid keeli ja dialekte.

ISO 639 keskendub ainult keele enda määratlemisele ning on kasulik näiteks andmebaasides ja süsteemides, kus on vaja keelt lihtsalt identifitseerida.

IETF BCP 47

BCP 47 on laiem keele tähistamise süsteem, mida arendab IETF ja mis põhineb muuhulgas ISO 639 keelekoodidel.

BCP 47 täiendab ISO 639 koodistikku järmiselt:

  • Kirjasüsteemi koodid (nt Hans – lihtsustatud hiina kiri, ISO 15924),
  • Riikide koodid (nt US – Ameerika Ühendriigid, ISO 3166-1 alpha 2) või regioonide koodid (nt EU, Euroopa Liit, UN M.49),
  • Varieerimise ja laiendamise võimalus, et tähistada näiteks murdeid või erivajadusi.

Näited BCP 47 keeletähistustest:

  • en-US – inglise keel Ameerikas,
  • fr-CA – prantsuse keel Kanadas,
  • sr-Cyrl-ME – serbia keel kirillitsa tähestikus Montenegros.

Olulised erinevused:

Ulatus:

ISO 639 tegeleb ainult keelte koodidega.

BCP 47 kombineerib keele, kirja, piirkonna ja muud aspektid üheks keeletähiseks.

Detailitase:

ISO 639 on lihtne ja sobib keele põhituvastuseks.

BCP 47 on paindlikum ja täpsem, võimaldades paremat lokaliseerimist.

Kasutuskohad:

ISO 639 kasutatakse sageli süsteemide sisemistes keelevalikutes.

BCP 47 on levinud veebitehnoloogiates (nt HTML, HTTP päised) ja rakendustes, kus on täpsemalt vaja määratleda keelekasutuse kontekst.

Viimati uuendatud 29.05.2025