HarmonyでサポートされているEncoding一覧

  Encoding 備考 
  文字集合と
文字符号化 が一体化
文字符号化
   Big5 Big5(中国語名:大五碼あるいは五大碼)は、繁体字中国語の文字コード(文字集合)で、台湾・香港・マカオといった繁体字圏で最も一般的に使われている。  Big5は文字集合と符号化方式が一体化している。
   Big5-HKSCS    
   CESU-8   UTF-8 はサロゲートペアを1個の32bit値に変換して、その32bit値を4個の8bit値に変換する正規の符号化です。 一方 CESU-8 はサロゲートペアを2個の16bit値のまま、それぞれを3個の8bit値に変換する符号化です。 古いアプリケーションの互換性用に用意された符号化です。
    EUC-JP EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)は日本語の文字を扱う場合に利用されてきた符号化方式のひとつである。
   EUC-KR   朝鮮語向けのISO/IEC 2022のサブセットで8ビット符号の拡張法を用いている、EUCの一種。
   GB18030 GB 18030は、中華人民共和国(中国)が制定した文字コード(文字セット)の国家規格である。簡体字のほか、Unicodeに含まれる繁体字や日本、韓国などで使われる漢字をも含む。
   GB2312   中華人民共和国の国家規格として定められた簡体字中国語の符号化文字集合
   GBK GBK は、中華人民共和国で使われている簡体字用の文字コード GB 2312 の拡張版である
   IBM-Thai    
   IBM00858    
   IBM00863    
   IBM00864    
   IBM00865    
   IBM00866    
   IBM00868    
   IBM00869    
   IBM00870    
   IBM00871    
   IBM00918    
   IBM001140    
   IBM001141    
   IBM001142    
   IBM001143    
   IBM001145    
   IBM001146    
   IBM001147    
   IBM001148    
   IBM001149    
   IBM037    
   IBM0126    
   IBM0147    
   IBM273    
   IBM277    
   IBM278    
   IBM280    
   IBM284    
   IBM285    
   IBM290    
   IBM297    
   IBM420    
   IBM424    
   IBM437    
   IBM500    
   IBM775    
   IBM850    
   IBM852    
   IBM855    
   IBM857    
   IBM860    
   IBM861    
   IBM862    
  ISO-2022-CN 複数の言語文字(文字集合)を切り替えて利用するISO-2022のサブセット規格で、支那語文字コードの符号化を規定した仕様。支那語環境のIRCや電子メールなどで使われることがある。
    ISO-2022-JP ISO-2022-JPは、インターネット上(特に電子メール)などで使われる日本の文字用の文字符号化方式。ISO/IEC 2022のエスケープシーケンスを利用して文字集合を切り替える7ビットのコードであることを特徴とする。俗に「JISコード」と呼ばれることもある。
  ISO-2022-JP-2  
    ISO-2022-KR  
   ISO-8859-1   ISO/IEC 8859は、ISOとIECによって規定された文字集合の規格で、8ビットで文字が表現されるうちの右半分(GR領域)用に用意されたシングルバイト文字コード。ISO/IEC 8859には複数の種類が存在しており、枝番によって区別される。
(Latin-1) 西欧言語
   ISO-8859-13   (Latin-7) バルト海沿岸地域を網羅するISO/IEC 8859-10(Latin-6)の後継
   ISO-8889-15 (Latin-9) 西欧言語でISO/IEC 8859-1(Latin-1)の後継
   ISO-8859-2 (Latin-2) 東欧言語
   ISO-8859-3 (Latin-3) その他のラテン文字言語
   ISO-8859-4 (Latin-4) 北欧言語 (既に古い仕様)
   ISO-8859-5
   ISO-8859-6
   ISO-8859-7
   ISO-8859-8
   ISO-8859-9
   JIS_X0201 JIS X 0201はラテン文字用図形文字集合と片仮名用図形文字集合のふたつの文字集合よりなっている。規格名称は7ビット及び8ビットの情報交換用符号化文字集合。名称が示す通り、7ビット符号と8ビット符号での運用が予定されている。 ASCIIと比較すると2文字が異なっており、92番の文字にバックスラッシュ ('\') の替わりに円記号 ('¥') が、126番にチルダ ('~') の替わりにオーバーライン ('‾') が割り当てられている。初版は1969年6月1日の制定
   JIS_X0212-1990 ・ JIS X 0212は、JIS X 0208:1983に含まれない文字を集めた、6067字の符号化文字集合を規定するJIS である。1990年10月1日に制定され、JIS X 0208と組み合わせて利用される。 JIS X 0208との重複はない。 JIS補助漢字の通称がある。
・ 国文学研究資料館の書誌データベース構築における研究成果に基づいた文字選定を行っており、学問研究向きの文字集合となっている。
   KOI8-R KOI8-Rはロシア語のキリル文字を扱うよう設計された、8ビットの文字コードである。
   KOI8-U KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。
    Shift_JIS Shift_JISは、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ1997年にJIS X 0208で標準化された。
   TIS-620    
   US-ASCII    
    UTF-16  
  UTF-16BE  
    UTF-16LE  
    UTF-32  
    UTF-32BE  
    UTF-32LE  
  UTF-8  
   windows-1250    
   windows-1251    
   windows-1252    
   windows-1253    
   windows-1254    
   windows-1255    
   windows-1256    
   windows-1257    
   windows-1258   Windows-1258 is a code page used in Microsoft Windows to represent Vietnamese texts. Windows-1258 is compatible with neither the Vietnamese standard (TCVN 5712 / VSCII), nor the various other encodings in use in practice (VISCII, VNI, VPS).
   windows-31j   JIS X 0201とJIS X 0208からなるShift_JISに、独自の拡張文字を追加した文字コード(CCS)と文字コードの符号化方法(CES)である。
   x-Big5-HKSCS-2001    
   x-Big5-Solaris    
   x-euc-jp-linux    
   x-EUC-TW    
   x-eucJP-Open    
   x-IBM1006    
   x-IBM1025    
   x-IBM1046    
   x-IBM1097    
   x-IBM1098    
   x-IBM1112    
   x-IBM1122    
   x-IBM1123    
   x-IBM1124    
   x-IBM1166    
   x-IBM1364    
   x-IBM1381    
   x-IBM1383    
   x-IBM300    
   x-IBM33722    
   x-IBM737    
   x-IBM833    
   x-IBM834    
   x-IBM856    
   x-IBM874    
   x-IBM875    
   x-IBM921    
   x-IBM922    
   x-IBM930    
   x-IBM933    
   x-IBM935    
   x-IBM937    
   x-IBM939    
   x-IBM942    
   x-IBM942C    
   x-IBM943    
   x-IBM943C    
   x-IBM948    
   x-IBM949    
   x-IBM949C    
   x-IBM950    
   x-IBM964    
   x-IBM970    
   x-ISCII91    
   x-ISO-2022-CN-CNS    
   x-ISO-2022-CN-GB    
   x-iso-8859-11    
   x-JIS0208  
   x-JISAutoDetect    
   x-Johab    
   x-MacArabic    
   x-MacCentralEurope    
   x-MacCroation    
   x-MacCyrillic    
   x-MacDingbat    
   x-MacGreek    
   x-MacHebrew    
   x-MacIceland    
   x-MacRoman    
   x-MacSymbol    
   x-MacThai    
   x-MacTurkish    
   x-MacUkraine    
   x-MS932-0213    
   x-MS950-HKSCS    
   x-MS950-HKSCS-XP    
   x-mswin-936    
   x-PCK    
   x-SJIS_0213    
   x-UTF-16LE-BOM    
   x-UTF-32BE-BOM    
   x-UTF-32LE-BOM    
   x-windows-50220    
   x-windows-50221    
   x-windows-874    
   x-windows-949    
   x-windows-950    
   x-windows-iso2022jp