HTML文書でタイ語を扱う方法をご紹介します。
HTML文書全体をタイ語で記述する場合には、html要素のlang属性にタイ語(th)を指定する。
<html lang="th">
言語に加えて、国(タイ)を指定することもできる。
<html lang="th-TH">
ただし、これはイギリス英語やアメリカ英語など、複数の国で使われている言語を指定する方法である。タイ語はタイでしか使われていないので、言語の指定だけで充分である。
HTML文書の一部にだけタイ語を使う場合には、必要な要素のlang属性にタイ語を指定する。
<span lang="th">สวัสดีครับ</span>
タイ語の発音は、通常のアルファベットに加えて、次に示す発音記号を使って表す。
文字 | Unicode | 文字参照 | 説明 |
---|---|---|---|
ʔ | U+0294 | ʔ | อ |
ŋ | U+014B | ŋ | ง |
ɯ | U+026F | ɯ | -ึ |
ɛ | U+025B | ɛ | แ-ะ |
ɔ | U+0254 | ɔ | เ-าะ |
ə | U+0259 | ə | เ-อะ |
á | U+0301 | ́ | 高声(構成文字) |
ǎ | U+030C | ̌ | 上声(構成文字) |
â | U+0302 | ̂ | 下声(構成文字) |
à | U+0300 | ̀ | 低声(構成文字) |
á | U+00E1 | á | 上声 |
これらに併せて、ローマ字も発音記号として使われる。
構成文字(composing character)とは、単独で使う文字ではなく、他の文字に付加する文字である。
sawàtdii khráp
sawàtdii khâ
文字 | Unicode | 文字参照 | 説明 |
---|---|---|---|
ก | U+0E01 | ก | 鶏のk |
ข | U+0E02 | ข | 卵のkh |
ฃ | U+0E03 | ฃ | 瓶のkh |
ค | U+0E04 | ค | 水牛のkh |
ฅ | U+0E05 | ฅ | 人のkh |
ฆ | U+0E06 | ฆ | 鐘のkh |
ง | U+0E07 | ง | 蛇のng |
จ | U+0E08 | จ | 皿のc |
ฉ | U+0E09 | ฉ | シンバルのch |
ช | U+0E0A | ช | 象のch |
ซ | U+0E0B | ซ | 鎖のs |
ฌ | U+0E0C | ฌ | 樹のch |
ญ | U+0E0D | ญ | 女のy |
ฎ | U+0E0E | ฎ | 冠のk |
ฏ | U+0E0F | ฏ | 水牛操作棒のt |
ฐ | U+0E10 | ฐ | 礎台のth |
ฑ | U+0E11 | ฑ | モントー夫人のth |
ฒ | U+0E12 | ฒ | 老人のth |
ณ | U+0E13 | ณ | 少年僧のn |
ด | U+0E14 | ด | 子供のd |
ต | U+0E15 | ต | 亀のt |
ถ | U+0E16 | ถ | 袋のth |
ท | U+0E17 | ท | 軍人のth |
ธ | U+0E18 | ธ | 旗のth |
น | U+0E19 | น | 鼠のn |
บ | U+0E1A | บ | 木の葉のb |
ป | U+0E1B | ป | 魚のp |
ผ | U+0E1C | ผ | 蜜蜂のph |
ฝ | U+0E1D | ฝ | 蓋のf |
พ | U+0E1E | พ | 脚付き盆のph |
ฟ | U+0E1F | ฟ | 歯のf |
ภ | U+0E20 | ภ | ジャンク船のph |
ม | U+0E21 | ม | 馬のm |
ย | U+0E22 | ย | 夜叉のy |
ร | U+0E23 | ร | 船のr |
ฤ | U+0E24 | ฤ | |
ล | U+0E25 | ล | 猿のl |
ฦ | U+0E26 | ฦ | |
ว | U+0E27 | ว | 指輪のw |
ศ | U+0E28 | ศ | 四阿(あずまや)のs |
ษ | U+0E29 | ษ | 仙人のs |
ส | U+0E2A | ส | 虎のs |
ห | U+0E2B | ห | 箱のh |
ฬ | U+0E2C | ฬ | 雄凧のl |
อ | U+0E2D | อ | 洗面器のʔ ʔɔɔ ʔàaŋ |
ฮ | U+0E2E | ฮ | 梟のh |
ฯ | U+0E2F | ฯ | 省略記号 |
กะ | U+0E30 | ะ | a |
ั | U+0E31 | ั | |
กา | U+0E32 | า | aa |
กำ | U+0E33 | ำ | am |
กิ | U+0E34 | ิ | i |
กี | U+0E35 | ี | ii |
กึ | U+0E36 | ึ | ɯ |
กื | U+0E37 | ื | ɯɯ |
กุ | U+0E38 | ุ | u |
กู | U+0E39 | ู | uu |
อฺ | U+0E3A | ฺ | 構成文字 |
฿ | U+0E3F | ฿ | タイバーツ |
เก | U+0E40 | เ | ee |
แก | U+0E41 | แ | ɛɛ |
โก | U+0E42 | โ | oo |
ใก | U+0E43 | ใ | ay |
ไก | U+0E44 | ไ | ay |
ๅ | U+0E45 | ๅ | |
ๆ | U+0E46 | ๆ | 踊り字(日本語の々に相当) |
็ | U+0E47 | ็ | |
ก่ | U+0E48 | ่ | 第一声調符号 |
ก้ | U+0E49 | ้ | 第二声調符号 |
ก๊ | U+0E4A | ๊ | 第三声調符号 |
ก๋ | U+0E4B | ๋ | 第四声調符号 |
ก์ | U+0E4C | ์ | 黙示記号 |
ํ | U+0E4D | ํ | |
๎ | U+0E4E | ๎ | |
๏ | U+0E4F | ๏ | 節の始まり |
๚ | U+0E5A | ๚ | 章の終わり |
๛ | U+0E5B | ๛ | 文の終わり |
構成文字(composing character)とは、単独で使う文字ではなく、他の文字に付加する文字である。
タイではアラビア数字も使われているが、伝統的なタイ数字も使われている。
文字 | Unicode | 文字参照 | 説明 |
---|---|---|---|
๐ | U+0E50 | ๐ | 0 |
๑ | U+0E51 | ๑ | 1 |
๒ | U+0E52 | ๒ | 2 |
๓ | U+0E53 | ๓ | 3 |
๔ | U+0E54 | ๔ | 4 |
๕ | U+0E55 | ๕ | 5 |
๖ | U+0E56 | ๖ | 6 |
๗ | U+0E57 | ๗ | 7 |
๘ | U+0E58 | ๘ | 8 |
๙ | U+0E59 | ๙ | 9 |
฿๑๐๐
Unicode, Inc. 2023. UAX #15: Unicode Normalization Forms