HTML文書でタイ語を扱う方法をご紹介します。
HTML文書全体をタイ語で記述する場合には、html要素のlang属性にタイ語(th)を指定する。
<html lang="th">
言語に加えて、国(タイ)を指定することもできる。
<html lang="th-TH">
ただし、これはイギリス英語やアメリカ英語など、複数の国で使われている言語を指定する方法である。タイ語はタイでしか使われていないので、言語の指定だけで充分である。
HTML文書の一部にだけタイ語を使う場合には、必要な要素のlang属性にタイ語を指定する。
<span lang="th">สวัสดีครับ</span>
タイ語の発音は、通常のアルファベットに加えて、次に示す発音記号を使って表す。
| 文字 | Unicode | 文字参照 | 説明 |
|---|---|---|---|
| ʔ | U+0294 | ʔ | อ |
| ŋ | U+014B | ŋ | ง |
| ɯ | U+026F | ɯ | -ึ |
| ɛ | U+025B | ɛ | แ-ะ |
| ɔ | U+0254 | ɔ | เ-าะ |
| ə | U+0259 | ə | เ-อะ |
| á | U+0301 | ́ | 高声(構成文字) |
| ǎ | U+030C | ̌ | 上声(構成文字) |
| â | U+0302 | ̂ | 下声(構成文字) |
| à | U+0300 | ̀ | 低声(構成文字) |
| á | U+00E1 | á | 上声 |
これらに併せて、ローマ字も発音記号として使われる。
構成文字(composing character)とは、単独で使う文字ではなく、他の文字に付加する文字である。
sawàtdii khráp
sawàtdii khâ
| 文字 | Unicode | 文字参照 | 説明 |
|---|---|---|---|
| ก | U+0E01 | ก | 鶏のk |
| ข | U+0E02 | ข | 卵のkh |
| ฃ | U+0E03 | ฃ | 瓶のkh |
| ค | U+0E04 | ค | 水牛のkh |
| ฅ | U+0E05 | ฅ | 人のkh |
| ฆ | U+0E06 | ฆ | 鐘のkh |
| ง | U+0E07 | ง | 蛇のng |
| จ | U+0E08 | จ | 皿のc |
| ฉ | U+0E09 | ฉ | シンバルのch |
| ช | U+0E0A | ช | 象のch |
| ซ | U+0E0B | ซ | 鎖のs |
| ฌ | U+0E0C | ฌ | 樹のch |
| ญ | U+0E0D | ญ | 女のy |
| ฎ | U+0E0E | ฎ | 冠のk |
| ฏ | U+0E0F | ฏ | 水牛操作棒のt |
| ฐ | U+0E10 | ฐ | 礎台のth |
| ฑ | U+0E11 | ฑ | モントー夫人のth |
| ฒ | U+0E12 | ฒ | 老人のth |
| ณ | U+0E13 | ณ | 少年僧のn |
| ด | U+0E14 | ด | 子供のd |
| ต | U+0E15 | ต | 亀のt |
| ถ | U+0E16 | ถ | 袋のth |
| ท | U+0E17 | ท | 軍人のth |
| ธ | U+0E18 | ธ | 旗のth |
| น | U+0E19 | น | 鼠のn |
| บ | U+0E1A | บ | 木の葉のb |
| ป | U+0E1B | ป | 魚のp |
| ผ | U+0E1C | ผ | 蜜蜂のph |
| ฝ | U+0E1D | ฝ | 蓋のf |
| พ | U+0E1E | พ | 脚付き盆のph |
| ฟ | U+0E1F | ฟ | 歯のf |
| ภ | U+0E20 | ภ | ジャンク船のph |
| ม | U+0E21 | ม | 馬のm |
| ย | U+0E22 | ย | 夜叉のy |
| ร | U+0E23 | ร | 船のr |
| ฤ | U+0E24 | ฤ | |
| ล | U+0E25 | ล | 猿のl |
| ฦ | U+0E26 | ฦ | |
| ว | U+0E27 | ว | 指輪のw |
| ศ | U+0E28 | ศ | 四阿(あずまや)のs |
| ษ | U+0E29 | ษ | 仙人のs |
| ส | U+0E2A | ส | 虎のs |
| ห | U+0E2B | ห | 箱のh |
| ฬ | U+0E2C | ฬ | 雄凧のl |
| อ | U+0E2D | อ | 洗面器のʔ ʔɔɔ ʔàaŋ |
| ฮ | U+0E2E | ฮ | 梟のh |
| ฯ | U+0E2F | ฯ | 省略記号 |
| กะ | U+0E30 | ะ | a |
| ั | U+0E31 | ั | |
| กา | U+0E32 | า | aa |
| กำ | U+0E33 | ำ | am |
| กิ | U+0E34 | ิ | i |
| กี | U+0E35 | ี | ii |
| กึ | U+0E36 | ึ | ɯ |
| กื | U+0E37 | ื | ɯɯ |
| กุ | U+0E38 | ุ | u |
| กู | U+0E39 | ู | uu |
| อฺ | U+0E3A | ฺ | 構成文字 |
| ฿ | U+0E3F | ฿ | タイバーツ |
| เก | U+0E40 | เ | ee |
| แก | U+0E41 | แ | ɛɛ |
| โก | U+0E42 | โ | oo |
| ใก | U+0E43 | ใ | ay |
| ไก | U+0E44 | ไ | ay |
| ๅ | U+0E45 | ๅ | |
| ๆ | U+0E46 | ๆ | 踊り字(日本語の々に相当) |
| ็ | U+0E47 | ็ | |
| ก่ | U+0E48 | ่ | 第一声調符号 |
| ก้ | U+0E49 | ้ | 第二声調符号 |
| ก๊ | U+0E4A | ๊ | 第三声調符号 |
| ก๋ | U+0E4B | ๋ | 第四声調符号 |
| ก์ | U+0E4C | ์ | 黙示記号 |
| ํ | U+0E4D | ํ | |
| ๎ | U+0E4E | ๎ | |
| ๏ | U+0E4F | ๏ | 節の始まり |
| ๚ | U+0E5A | ๚ | 章の終わり |
| ๛ | U+0E5B | ๛ | 文の終わり |
構成文字(composing character)とは、単独で使う文字ではなく、他の文字に付加する文字である。
タイではアラビア数字も使われているが、伝統的なタイ数字も使われている。
| 文字 | Unicode | 文字参照 | 説明 |
|---|---|---|---|
| ๐ | U+0E50 | ๐ | 0 |
| ๑ | U+0E51 | ๑ | 1 |
| ๒ | U+0E52 | ๒ | 2 |
| ๓ | U+0E53 | ๓ | 3 |
| ๔ | U+0E54 | ๔ | 4 |
| ๕ | U+0E55 | ๕ | 5 |
| ๖ | U+0E56 | ๖ | 6 |
| ๗ | U+0E57 | ๗ | 7 |
| ๘ | U+0E58 | ๘ | 8 |
| ๙ | U+0E59 | ๙ | 9 |
฿๑๐๐
Unicode, Inc. 2023. UAX #15: Unicode Normalization Forms