UTF-8 encoding (see RFC 2279) ============================= An asterisk (*) represents an arbitrary hexadecimal digit. One octet encoding: Unicode UTF-8 ------------------- 00 0* 0* 00 1* 1* 00 2* 2* 00 3* 3* 00 4* 4* 00 5* 5* 00 6* 6* 00 7* 7* Two octets encoding: Unicode UTF-8 ------------------- 00 8* C2 8* 00 9* C2 9* 00 A* C2 A* 00 B* C2 B* 00 C* C3 8* 00 D* C3 9* 00 E* C3 A* 00 F* C3 B* 01 0* C4 8* 01 1* C4 9* 01 2* C4 A* 01 3* C4 B* 01 4* C5 8* 01 5* C5 9* 01 6* C5 A* 01 7* C5 B* 01 8* C6 8* 01 9* C6 9* 01 A* C6 A* 01 B* C6 B* 01 C* C7 8* 01 D* C7 9* 01 E* C7 A* 01 F* C7 B* 02 0* C8 8* 02 1* C8 9* 02 2* C8 A* 02 3* C8 B* 02 4* C9 8* 02 5* C9 9* 02 6* C9 A* 02 7* C9 B* 02 8* CA 8* 02 9* CA 9* 02 A* CA A* 02 B* CA B* 02 C* CB 8* 02 D* CB 9* 02 E* CB A* 02 F* CB B* 03 0* CC 8* 03 1* CC 9* 03 2* CC A* 03 3* CC B* 03 4* CD 8* 03 5* CD 9* 03 6* CD A* 03 7* CD B* 03 8* CE 8* 03 9* CE 9* 03 A* CE A* 03 B* CE B* 03 C* CF 8* 03 D* CF 9* 03 E* CF A* 03 F* CF B* 04 0* D0 8* 04 1* D0 9* 04 2* D0 A* 04 3* D0 B* 04 4* D1 8* 04 5* D1 9* 04 6* D1 A* 04 7* D1 B* 04 8* D2 8* 04 9* D2 9* 04 A* D2 A* 04 B* D2 B* 04 C* D3 8* 04 D* D3 9* 04 E* D3 A* 04 F* D3 B* 05 0* D4 8* 05 1* D4 9* 05 2* D4 A* 05 3* D4 B* 05 4* D5 8* 05 5* D5 9* 05 6* D5 A* 05 7* D5 B* 05 8* D6 8* 05 9* D6 9* 05 A* D6 A* 05 B* D6 B* 05 C* D7 8* 05 D* D7 9* 05 E* D7 A* 05 F* D7 B* 06 0* D8 8* 06 1* D8 9* 06 2* D8 A* 06 3* D8 B* 06 4* D9 8* 06 5* D9 9* 06 6* D9 A* 06 7* D9 B* 06 8* DA 8* 06 9* DA 9* 06 A* DA A* 06 B* DA B* 06 C* DB 8* 06 D* DB 9* 06 E* DB A* 06 F* DB B* 07 0* DC 8* 07 1* DC 9* 07 2* DC A* 07 3* DC B* 07 4* DD 8* 07 5* DD 9* 07 6* DD A* 07 7* DD B* 07 8* DE 8* 07 9* DE 9* 07 A* DE A* 07 B* DE B* 07 C* DF 8* 07 D* DF 9* 07 E* DF A* 07 F* DF B* Three octets encoding: Unicode UTF-8 ------------------- 08 0* E0 A0 8* 08 1* E0 A0 9* etc. etc.