PHP programozás során (de nyilván másutt is sokszor) szükséges tudni, hogy milyen kóddal szerepelnek a magyar ékezetes betűk.
Ehhez jól jöhez az alábbi táblázat. Köszönet érte: http://sbin.hu/samples/doc/utf8/part3.html
Karakter | CP437 | CP850 | CP852 | CWI-2 | Latin-1 | Latin-2 | Windows-1252 | Windows-1250 | Unicode (hex) | UTF-8 |
Á | - | 181 | 181 | 143 | 193 | 193 | 193 | 193 | 193 (C1) | 195 129 (C3 81) |
É | 144 | 144 | 144 | 144 | 201 | 201 | 201 | 201 | 201 (C9) | 195 137 (C3 89) |
Í | - | 214 | 214 | 141 | 205 | 205 | 205 | 205 | 205 (CD) | 195 141 (C3 8D) |
Ó | - | 224 | 224 | 149 | 211 | 211 | 211 | 211 | 211 (D3) | 195 147 (C3 93) |
Ö | 153 | 153 | 153 | 153 | 214 | 214 | 214 | 214 | 214 (D6) | 195 150 (C3 96) |
Ő | - | - | 138 | 167 | - | 213 | - | 213 | 336 (150) | 197 144 (C5 90) |
Ú | - | 233 | 233 | 151 | 218 | 218 | 218 | 218 | 218 (DA) | 195 154 (C3 9A) |
Ü | 154 | 154 | 154 | 154 | 220 | 220 | 220 | 220 | 220 (DC) | 195 156 (C3 9C) |
Ű | - | - | 235 | 152 | - | 219 | - | 219 | 368 (170) | 197 176 (C5 B0) |
Ô (kalapos) | - | 226 | 226 | - | 212 | 212 | 212 | 212 | 212 (D4) | 195 148 (C3 94) |
Õ (hullámos) | - | 229 | - | - | 213 | - | 213 | - | 213 (D5) | 195 149 (C3 95) |
Û (kalapos) | - | 234 | - | - | 219 | - | 219 | - | 219 (DB) | 195 155 (C3 9B) |
Ũ (hullámos) | - | - | - | - | - | - | - | - | 360 (168) | 197 168 (C5 A8) |
á | 160 | 160 | 160 | 160 | 225 | 225 | 225 | 225 | 225 (E1) | 195 161 (C3 A1) |
é | 130 | 130 | 130 | 130 | 233 | 233 | 233 | 233 | 233 (E9) | 195 169 (C3 A9) |
í | 161 | 161 | 161 | 161 | 237 | 237 | 237 | 237 | 237 (ED) | 195 173 (C3 AD) |
ó | 162 | 162 | 162 | 162 | 243 | 243 | 243 | 243 | 243 (F3) | 195 179 (C3 B3) |
ö | 148 | 148 | 148 | 148 | 246 | 246 | 246 | 246 | 246 (F6) | 195 182 (C3 B6) |
ő | - | - | 139 | 147 | - | 245 | - | 245 | 337 (151) | 197 145 (C5 91) |
ú | 163 | 163 | 163 | 163 | 250 | 250 | 250 | 250 | 250 (FA) | 195 186 (C3 BA) |
ü | 129 | 129 | 129 | 129 | 252 | 252 | 252 | 252 | 252 (FC) | 195 188 (C3 BC) |
ű | - | - | 251 | 150 | - | 251 | - | 251 | 369 (171) | 197 177 (C5 B1) |
ô (kalapos) | 147 | 147 | 147 | - | 244 | 244 | 244 | 244 | 244 (F4) | 195 180 (C3 B4) |
õ (hullámos) | - | 228 | - | - | 245 | - | 245 | - | 245 (F5) | 195 181 (C3 B5) |
û (kalapos) | 150 | 150 | - | - | 251 | - | 251 | - | 251 (FB) | 195 187 (C3 BB) |
ũ (hullámos) | - | - | - | - | - | - | - | - | 361 (169) | 197 169 (C5 A9) |
– (nagykötőjel) | - | - | - | - | - | - | 150 | 150 | 8211 (2013) | 226 128 147 |
„ (nyitó idézőjel) | - | - | - | - | - | - | 132 | 132 | 8222 (201E) | 226 128 158 |
” (csukó idézőjel) | - | - | - | - | - | - | 148 | 148 | 8221 (201D) | 226 128 157 |
’ (aposztróf) | - | - | - | - | - | - | 146 | 146 | 8217 (2019) | 226 128 153 |
És egy függvény, amely a cseréket PHP-ben végrehajtja UTF-8 kódolásról Latin1-re, azaz Windows-1252-re, ahol nincsenek őŐűŰ betűk - ezeket a függvény átalakítja jobb híján öÖüÜ-re:
function kodcsere($szoveg) {
$mit = array("\xC3\x81","\xC3\x89","\xC3\x8D","\xC3\x93","\xC3\x96","\xC5\x90","\xC3\x9A","\xC3\x9C","\xC5\xB0","\xC3\x94","\xC3\x95","\xC3\x9B","\xC5\xA8","\xC3\xA1","\xC3\xA9","\xC3\xAD","\xC3\xB3","\xC3\xB6","\xC5\x91","\xC3\xBA","\xC3\xBC","\xC5\xB1","\xC3\xB4","\xC3\xB5","\xC3\xBB","\xC5\xA9");
$mire = array("Á","É","Í","Ó","Ö","Ö","Ú","Ü","Ü","Ô","Õ","Û","Ü","á","é","í","ó","ö","ö","ú","ü","ü","ô","õ","û","ü");
$szoveg = str_replace($mit, $mire, $szoveg);
return $szoveg;
}
Ha magyar ékezetes karaktereken túl más is érdekel :-) : Filozófia, kultúra, önkéntesség