CLAコード

ページ名:CLAコード
CLaKIS標準 :  BERN CC1
CLAコード
CLA v1番号CLaKIS CC2015-1
提案日2015/7/21
発行日2015/7/21
執筆者おかゆ, Yuhr
CLA v2番号CLaKIS CC2021-1
提案日2021/8/5
発行日2021/8/5
執筆者佐藤陽花
CLA v1
CLA v2
仕様書CL-KIITA/CLACode_SRI  :spec/cla_old.md
CLA v3番号CLaKIS CC2021-2
CLaKIS CC2021-3
CLaKIS CC2021-4
CLaKIS CC2021-5
提案日2021/8/17
発行日2021/9/2
(SD: 未発行)
執筆者佐藤陽花, Ziphil,
フルヒト, Xirdim,
AI, ѕkytomo
仕様書CL-KIITA/CLACode_SRI  :spec/cla_code.md


CLA (ConLAng) コードとは、ISO 639 に倣い、各人工言語のコードを規定するものである。このコードを用いることで、辞典データなどのデータベース上で人工言語を取り扱いやすくなる。

初版 (CLA v1) は 2015 年 7 月 21 日におかゆ氏により提案され、それ以降 Google Form を利用して申請および承認がなされていた。(改訂に伴い申請受付が停止された。ただし既に承認されたコードは現在も有効)。

この状況を受け、佐藤陽花氏による私案 (後述) をもとに、佐藤陽花氏, Ziphil 氏, Xirdim 氏, フルヒト氏を始めとするメンバーによって、第 3 版 (CLA v3) が考案された。

2021 年 8 月 31 日には、CLA v3 のコードを申請および一覧できるサイト Conlang Portal がオープンし、また、2021 年 9 月 2 日には CLA v3 仕様書が発行された。

目次

CLA v1

概要

CLA コードは 3 文字および 5 文字の ASCII ラテン小文字で規定される。初めの 3 文字はその言語に割り当てられたコードを表し、後ろの 2 文字は (存在すれば) その言語の属する人工言語語族 (世界や作者などによる暫定的な分類) に割り当てられたコードを表す。特に重複などの無い限りは、3 文字のみで表記することができる。

ある言語のコードを決定する際には、その言語名をその言語によって綴ったものをさらにラテン小文字転写したものをもとに、重複のないよう決定する。

申請

以下の Google Form により申請できた。

https://docs.google.com/forms/d/1hIGV5PnCTZZIABk6K2pomHGfjLW8aL5cvNfYlPxS338/viewform

懸念

  • ISO コードとの衝突する。CLA コードを第三者が見た時に ISO コードと勘違いされる可能性がある。
  • 略号の競合で喧嘩が起こる可能性がある。
  • 開発中止となった人工言語の CLA コードの処理をどうするか。
  • 語族コードに対する抵抗感。世界を用意していない言語は少なからずあり、作者名においても同じ人間がそれぞれの言語を作る際に統一した名前を用いているとは限らない。ひとつの救済策として「無所属/未定コード」を用意する方法がある。「**」をそれとすることで、そのような言語の申請のハードルを下げられるかもしれない。もちろん、「**」はもっとも広い語族となりうるため、その中で言語コードの衝突が起こる可能性も他に比べて高くなる。そのため、「**」語族の言語は、衝突が起こりうる際、委員会から語族コードの決定要請がなされる(この救済策は草稿段階である)。

一覧

ver 0.6 (2015/07/22)

順番は申請順。

言語名CLA言語コードCLA語族コード
シャレイア語 (qixaléh)xalzp
ロジバン (lojban)jbolg
クレリカ (qreriqa)qrehr
アルテナ語 (altenam qeras)altll
シヴァン (xivan)xivam
アルカ (arka)arkrx
(三代目)リパライン語 (lineparine)lpalp
ヴェフィス語(四代目リパライン語) (Vaifise)veflp
ver 0.7 (2015/07/25)

順番は申請順。新たに追加されたコードだけを掲載する。

言語名CLA言語コードCLA語族コード
ワコファル語 (wakofal syal)wkfll
モヤシ語 (kistel) [ver 0.9 にて改定]ktlmc
イジェール語 (Etube Id'erin)idzid
トキポナ (toki Pona)tpn**
ver 0.8 (2015/08/13)

順番は申請順。新たに追加されたコードだけを掲載する。

言語名CLA言語コードCLA語族コード
カルコレーシュ語 (Calcoradetár)calca
ver 0.9 (2016/01/17)

順番は申請順。新たに追加されたコードだけを掲載する。

言語名CLA言語コードCLA語族コード
凪霧(nagili)altrx
ヴォルヘモ(Volxemo [ver 0.95 にて改定]vlmvl
モヤシ語(moiacis)micmc
レテシミ語(letesimi)lsmmc
ver 0.95 (2016/10/12)

順番は申請順。新たに追加されたコードだけを掲載する。

言語名CLA言語コードCLA語族コード
ビウ語(biwe)biwvl
ヴォレモ(Volxemo)vlmvl
ver 2017-11-13

順番は申請順。新たに追加されたコードだけを掲載する。

言語名CLA言語コードCLA語族コード
フィダーヌス語(Fidánasa Uduhos) [ver 2021-08-03にて改定]fidut
レクステンス(lekustens)lstls
ver 2021-08-03

順番は申請順。新たに追加されたコードだけを掲載する。

言語名CLA言語コードCLA語族コード
フィダーヌス語(Heb Fidana)fidht
ミ・デア語(Żea Mi-Dea)nklmd
アポート語(uptohgikulecsepi)uptni
デーレ語(aulakk derle)delet
ボウニム語(bohnimik)bnmxr
オ゛ェジュルニョェーッ語(Ƣeznē'bix)fezfb

CLA v2

CLA v1 に対する上記の懸念を解決するため、オ゛ェジュルニョェーッ語の創作を率いる佐藤陽花氏により提案された私案である。なお運用には至っていない(ただし例示としてオ゛ェジュルニョェーッ語にのみコードが付与されている(fez/fb))。


開発中止となった人工言語の CLA コードの処理

ISO コードにおける消滅言語の取扱いに倣い、存属する。

略号の競合で喧嘩が起こる可能性

各言語各製作者の代表より構成される常設委員会を創設し、この常設委員会が CLA コードを管理する。常設委員会に属する裁定部会が仲裁・裁定・処理を行う。

「無所属/未定コード」の処理

上記常設委員会の設立のほか、「無所属/未定コード」に関連する以下のような CLA コードのコード定義の変更を行う。

  • 語族領域 ... それぞれの言語(群)ごとの設定や世界観に伴った語族によってコードを付与するための領域。/をプレフィックスとし、ASCII ラテン小文字 2 字の語族コードが充てられる。
  • 製作者領域 ... 語族別ではなく、製作者/製作団体のコード附与を希望する製作者/製作団体に付与するための領域。~ をプレフィックスとし、ASCII ラテン小文字 2 字の製作者コードが充てられる。
  • 無所属領域 ...語族領域にも製作者領域にも属さないことを希望した言語のための領域。#** が充てられる。
  • 未定領域 ... どのコード付与を希望するか未だ決まっていない言語のためのための領域。?** が充てられる。

CLA v3

概要

上記の CLA v1 の問題を受け、新たに制定された CLA コードである。Conlang Portal で管理されている。

CLA v3 は、以下の 4 階層構成になっている。

  • 製作者コード (3 桁) … 製作者や製作団体を表す階層。
  • 語族コード (3 桁) … 同一の製作者や製作団体が作る複数の言語をグループ化するための階層。世界観や語族などが相当する。
  • 言語コード (2 桁) … 言語を表す階層。
  • 方言コード (2 桁) … 言語に方言変種がある場合に、その方言を表す階層。

コードを表記する際は、これらを逆順に _ で繋げて表記する。例えば、製作者コードが ccc, 語族コードが fff, 言語コードが ll, 方言コードが dd であれば、コード全体は dd_ll_fff_ccc となる。

語族コードと方言コードは指定しないことが可能で、その場合は ~ で表す。

言語コード体系識別コード

CLaKIS標準 :  BERN CC2
言語コード体系識別コード
番号CLaKIS CC2021-6
提案日2021/8/17
発行日2021/9/2
執筆者佐藤陽花
仕様書CL-KIITA/CLACode_SRI  :spec/sys_disc.md

注意:全ての言語コードの完全上位概念であるので、原則としてマッピングすることはできない。

言語コードをデータ記述ファイルやプログラム上に記載するとき、或いは文書上で表記するときにどの言語コード体系に準拠して記載されているかを示し、判別するための 4 字コード。書式は[a-z]{3}[a-z0-9]であり、主なものは次の通り。

  • iso1 自然言語:ISO639-1
  • iso2 自然言語:ISO639-2
  • iso3 自然言語:ISO639-3
  • cla1 人工言語:CLA コード、従来版
  • cla2 人工言語:CLA コード、私案版
  • cla3 人工言語:CLA コード、正規改訂版
  • glot 自然言語:Glottolog
  • ietf 自然言語:IETF 言語タグ
  • lisr 自然言語:Lingasphere Register
  • verb 人工言語:Verbix

システムでどのコード体系のどの版を受け入れるかは個別のシステムごとに指定される

推奨は iso1,iso3,cla1,cla3 の 4 種

記法

各種言語コードとともに記載する場合は、プリフィックスとして言語コードに前置し、一つのコードとして扱う。この場合、余分な空白等は加えず、また識別コードを{ }で囲う。

  • ex1) {cla3}~_fz_fzb_brl: CLA コード改訂版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード
  • ex2) {cla1}fez_fb: CLA コード従来版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード
  • ex3) {cla2}fez/fb: CLA コード私案版によるオ゛ェジュルニョェーッ語(Ƣeznē'bix)の言語コード

懸念解決の実際

CLA v1 に対する上記の懸念は、CLA v3の制定時に次のように解決された(CLA v2における提案を基にしたものである)。

ISO コードとの関係について

  • 懸念:ISO コードとの衝突する。CLA コードを第三者が見た時に ISO コードと勘違いされる可能性がある。
  • v2提案:なし

言語コード体系識別コードの制定により解決された。

開発中止となった人工言語の CLA コードの処理

  • 懸念:開発中止となった人工言語の CLA コードの処理をどうするか。
  • v2提案:ISO コードにおける消滅言語の取扱いに倣い、存属する。

v2提案が変更なく採用されたことにより解決された。

略号の競合で喧嘩が起こる可能性

  • 懸念:略号の競合で喧嘩が起こる可能性がある。
  • v2提案:各言語各製作者の代表より構成される常設委員会を創設し、この常設委員会が CLA コードを管理する。常設委員会に属する裁定部会が仲裁・裁定・処理を行う。

CLA コードを管理する組織は、提案による常設委員会でなく、SCJ傘下の情報関連事業部門であるCL-KIITAのCLA コード部門となった。CL-KIITAの機構・システムにより解決された。

「無所属/未定コード」の処理

  • 懸念:語族コードに対する抵抗感。世界を用意していない言語は少なからずあり、作者名においても同じ人間がそれぞれの言語を作る際に統一した名前を用いているとは限らない。
  • v2提案:上記常設委員会の設立のほか、「無所属/未定コード」に関連する CLA コードのコード定義の変更を行う。

CLA v3に記載された通りコード全体を4階層構成としたことにより解決された。



特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。

シェアボタン: このページをSNSに投稿するのに便利です。


最近更新されたページ

左メニュー

左メニューサンプル左メニューはヘッダーメニューの【編集】>【左メニューを編集する】をクリックすると編集できます。ご自由に編集してください。掲示板雑談・質問・相談掲示板更新履歴最近のコメントカウン...

黙字

黙字とは、表音文字[1]を使用する言語に於いて、綴られているにもかかわらず発音されない文字のことである。サイレントとも言う。自然言語に於ける黙字自然言語に於いては主に以下のような歴史的な理由で黙字が存...

類型論

言語類型論抱合語孤立語膠着語屈折語総合的言語分析的言語特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

音韻論

音韻弁別的素性音素母音子音音節アクセントイントネーション韻律特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

音韻規則記述言語

音韻規則記述言語(PRDL; Phonetic Rule Description Language)とは、デネブさんによって提唱された、言語音の条件異音などを簡潔に記述するためのドメイン固有言語である...

音韻

ここでは、自然言語において起こり得る音韻の変化について説明する。目次1 母音関連1.1 母音調和1.2 ウムラウト1.3 アクセントのある音節の母音が変化する2 子音関連2.1 語中の有声音、無声音の...

音声記号の入力方法

芸術言語研究(カテゴリー)芸術言語の創り方・芸術言語の哲学このページの対象言語Se分類芸術言語モユネ分類ART音声記号の入力方法では,各種音声記号を入力する方法について解説する。目次1 文字コード1....

音声学

音声国際音声記号(IPA)国際音声記号への拡張調音調音部位調音方法特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

韓国日本語2

通り韓国日本語2.jpg特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

韓国日本語

写真の通り韓国日本語.jpg特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

集合化造語法

集合化造語法とは、短期間にたくさんの単語を作るための意味を創造する手法である。補完造語法と合わせることでより効果的になる。概要・方法この造語法の流れは以下の二つの手順で意味をあらかじめ考えておく必要が...

限定性と修正性

限定性と修正性は動詞の性質を示す用語である。言語の特徴を探る手掛かりとなる。簡単な内容は表1に記載表 1限定性修正性格の指定未定義文脈依存修飾必須任意抽象度高低限定性動詞に含まれる項が未定義で指定する...

関係方式

関係方式とは、辞書の保存方式の一つである。クノーツアクアにより提唱された。説明この方式では語句に含まれる意味や用法をカード毎に分割し、それらを組み合わせて辞書を作っていく。カードは形式毎に異なる種類の...

関与原理

関与原理(英: relatedness principle)とは、おかゆの発案による、意味役割の標示に関する原理である。関与原理は、関与という意味役割を提示する。これはいわば、あらゆる具体的な意味役割...

遺伝造語法

遺伝造語法とは、カルノス・アクアが考案した造語法の一種である。発端は、生物の遺伝の選択を造語にも生かせないか?というところからである。目次1 方法2 特徴3 用法・用量4 関連記事方法まず、何らかの共...

達丸漢字

写真2枚漢字1.jpg追記ほとんどなさそうです特に記載のない限り、コミュニティのコンテンツはCC BY-SAライセンスの下で利用可能です。...

達丸日本語

達丸日本語.jpgまず最初に達丸日本語から書きはじ‘めます。更新していく予定です 2023 4/1 (土) 21:24 現在 3つあります  googleplay アプリのcloudy で作成中ですま...

造語論

造語論とは、人工言語を制作する際の考え方の一つで、語句を作る際の考え方である。目次1 クノーツ法1.1 題目(テーマ)1.2 対象(ターゲット)1.3 目的(コンセプト)1.3.1 語法(ヴィジョン)...

辞書の読み物性

辞書の読み物性とは人工言語の辞書の読みごたえに関する指標の一つである。本来は "Fafs falira sashimi"氏が2014年に考案し、2015年7月に辞書の情報密度を表す数値として提案した。...

転写

転写とは、ある言語の発音を他の文字体系で表記することである。例えば日本の固有名詞(地名や人名など)をローマ字表記したり、英語圏の固有名詞をカタカナ表記したりすることなどである。あくまでも発音に基づいて...