37- ترميز HTML (مجموعات الأحرف)
لعرض صفحة HTML بشكل صحيح، يجب على متصفح الإنترنت معرفة مجموعة الأحرف المستخدمة فيها.
يتم تحديد مجموعة الأحرف باستخدام صفة charset
داخل عنصر meta
:
<meta charset="UTF-8">
مواصفات HTML5 تشجع مطوري الويب على استخدام مجموعة أحرف UTF-8.
تغطي UTF-8 تقريبًا كل الحروف والرموز في العالم!
مجموعة أحرف ASCII: اللغة الأساسية للإنترنت في البداية
كانت ASCII هي أول معيار لترميز الأحرف على الإنترنت. وقد حددت 128 حرفًا مختلفًا يمكن استخدامها عبر الإنترنت، بما في ذلك:
- حروف اللغة الإنجليزية (A-Z)
- الأرقام (0-9)
- رموز خاصة مثل ! $ + – ( ) @ < >.
لعبت ASCII دورًا فعالًا في تأسيس وإنماء شبكة الإنترنت العالمية، حيث وفرت أرضية مشتركة لتبادل المعلومات بين الأجهزة المختلفة.
مع الوقت، وبعد ظهور الحاجة لعرض لغات وثقافات متنوعة عبر الإنترنت، تطورت مجموعات أحرف أوسع وأشمل من ASCII، مثل UTF-8، لتستوعب الحروف والرموز الخاصة بلغات ومجالات متعددة.
مجموعة أحرف ANSI (Windows-1252): لغة Windows الأبكر
كانت مجموعة أحرف ANSI (Windows-1252) هي المستخدمة في نظام تشغيل Windows في السابق. وتتميز بالمواصفات التالية:
- تتطابق مع ASCII تمامًا بالنسبة لأول 127 حرفًا.
- تحتوي على رموز خاصة إضافية بين الحرفين 128 و 159.
- تتوافق مع UTF-8 بالنسبة للحروف من 160 إلى 255.
لعبت هذه المجموعة دورًا مهمًا في تطوير أنظمة التشغيل واستخدام الحاسوب الشخصي، ولكن مع تزايد التنوع اللغوي والثقافي على الإنترنت، انتقل استخدام Windows إلى مجموعات أحرف أوسع مثل UTF-8 لتوفير دعم أفضل لعرض مختلف اللغات والرموز.
<meta charset="Windows-1252">
مجموعة أحرف ISO-8859-1: معيار HTML 4 ومساحة أوسع للرموز
تُعدّ مجموعة أحرف ISO-8859-1 معيارًا قديمًا استُخدم لتشفير النصوص في لغة HTML 4. وقد أتاحت دعمًا لـ 256 رمزًا حرفيًا مختلفًا. بالإضافة إلى ذلك، دعمت HTML 4 أيضًا مجموعة أحرف UTF-8 الأوسع نطاقًا.
يتميز ISO-8859-1 بالمواصفات التالية:
- متطابقة بالكامل مع ASCII بالنسبة لأول 127 حرفًا.
- لا تستخدم الرموز المخصصة الواقعة بين الحرفين 128 و 159 (وهي تختلف عن الرموز الخاصة في ANSI).
- متطابقة مع كل من ANSI و UTF-8 بالنسبة للحروف من 160 إلى 255.
بينما ساهمت ISO-8859-1 في توسيع مساحة الحروف والرموز المتاحة في صفحات الويب مقارنةً بـ ASCII، إلا أن ظهور الحاجة لدعم لغات ورموز أكثر تنوعًا أدى إلى تفضيل استخدام مجموعات أحرف أحدث وأكثر قدرة مثل UTF-8 التي تُعدّ معيارًا أساسيًا في HTML الحديث لتقديم تجربة ويب شاملة وداعمة للغات والحروف والرموز من مختلف الثقافات.
HTML 4
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
HTML 5
<meta charset="ISO-8859-1">
مجموعة أحرف UTF-8: عالم أوسع للغة والرموز على شبكة الإنترنت
تتميز مجموعة أحرف UTF-8 بالمرونة والقوة التي تجعلها الخيار المفضل في عالم الويب الحديث، وذلك بفضل خصائصها التالية:
- توافق واسع: تتطابق UTF-8 تمامًا مع مجموعة أحرف ASCII بالنسبة لأول 127 حرفًا، مما يضمن توافقها مع المحتوى القديم على الإنترنت.
- استخدام فعال للمساحة: لا تستخدم UTF-8 الرموز المخصصة في نطاق 128 إلى 159، مما يسمح لها بتخصيص مساحة أكبر لترميز لغات ورموز أخرى.
- توافق مع معايير سابقة: تتطابق UTF-8 مع كل من ANSI و 8859-1 بالنسبة للحروف من 160 إلى 255، مما يسهل الانتقال من معايير الترميز القديمة إلى الجديدة.
- اتساع غير محدود: تمتد UTF-8 لتشمل أكثر من 10 آلاف حرف، وهذا يتيح لها استيعاب لغات ورموز من مختلف أنحاء العالم، بما في ذلك العربية والهندية والصينية وغيرها.
بفضل هذه المزايا، أصبحت UTF-8 معيارًا أساسيًا في تقنيات الويب الحديثة، بما في ذلك HTML5 و CSS3. فهي تتيح للمطورين إنشاء صفحات ويب غنية وداعمة للمحتوى متعدد اللغات والرموز، مما يوفر تجربة أفضل للمستخدمين من جميع الثقافات والخلفيات اللغوية.
<meta charset="UTF-8">
“Differences Between Character Sets”
الجدول التالي يوضح الاختلافات بين مجموعات الأحرف الموضحة أعلاه:
الرقم | ASCII | ANSI | 8859 | UTF‑8 |
---|---|---|---|---|
32 | ||||
33 | ! | ! | ! | ! |
34 | “ | “ | “ | “ |
35 | # | # | # | # |
36 | $ | $ | $ | $ |
37 | % | % | % | % |
38 | & | & | & | & |
39 | ‘ | ‘ | ‘ | ‘ |
40 | ( | ( | ( | ( |
41 | ) | ) | ) | ) |
42 | * | * | * | * |
43 | + | + | + | + |
44 | , | , | , | , |
45 | – | – | – | – |
46 | . | . | . | . |
47 | / | / | / | / |
48 | 0 | 0 | 0 | 0 |
49 | 1 | 1 | 1 | 1 |
50 | 2 | 2 | 2 | 2 |
51 | 3 | 3 | 3 | 3 |
52 | 4 | 4 | 4 | 4 |
53 | 5 | 5 | 5 | 5 |
54 | 6 | 6 | 6 | 6 |
55 | 7 | 7 | 7 | 7 |
56 | 8 | 8 | 8 | 8 |
57 | 9 | 9 | 9 | 9 |
58 | : | : | : | : |
59 | ; | ; | ; | ; |
60 | < | < | < | < |
61 | = | = | = | = |
62 | > | > | > | > |
63 | ? | ? | ? | ? |
64 | @ | @ | @ | @ |
65 | A | A | A | A |
66 | B | B | B | B |
67 | C | C | C | C |
68 | D | D | D | D |
69 | E | E | E | E |
70 | F | F | F | F |
71 | G | G | G | G |
72 | H | H | H | H |
73 | I | I | I | I |
74 | J | J | J | J |
75 | K | K | K | K |
76 | L | L | L | L |
77 | M | M | M | M |
78 | N | N | N | N |
79 | O | O | O | O |
80 | P | P | P | P |
81 | Q | Q | Q | Q |
82 | R | R | R | R |
83 | S | S | S | S |
84 | T | T | T | T |
85 | U | U | U | U |
86 | V | V | V | V |
87 | W | W | W | W |
88 | X | X | X | X |
89 | Y | Y | Y | Y |
90 | Z | Z | Z | Z |
91 | [ | [ | [ | [ |
92 | \ | \ | \ | \ |
93 | ] | ] | ] | ] |
94 | ^ | ^ | ^ | ^ |
95 | _ | _ | _ | _ |
96 | ` | ` | ` | ` |
97 | a | a | a | a |
98 | b | b | b | b |
99 | c | c | c | c |
100 | d | d | d | d |
101 | e | e | e | e |
102 | f | f | f | f |
103 | g | g | g | g |
104 | h | h | h | h |
105 | i | i | i | i |
106 | j | j | j | j |
107 | k | k | k | k |
108 | l | l | l | l |
109 | m | m | m | m |
110 | n | n | n | n |
111 | o | o | o | o |
112 | p | p | p | p |
113 | q | q | q | q |
114 | r | r | r | r |
115 | s | s | s | s |
116 | t | t | t | t |
117 | u | u | u | u |
118 | v | v | v | v |
119 | w | w | w | w |
120 | x | x | x | x |
121 | y | y | y | y |
122 | z | z | z | z |
123 | { | { | { | { |
124 | | | | | | | | |
125 | } | } | } | } |
126 | ~ | ~ | ~ | ~ |
127 | DEL | |||
128 | € | |||
129 | | | | |
130 | ‚ | |||
131 | ƒ | |||
132 | „ | |||
133 | … | |||
134 | † | |||
135 | ‡ | |||
136 | ˆ | |||
137 | ‰ | |||
138 | Š | |||
139 | ‹ | |||
140 | Œ | |||
141 | | | | |
142 | Ž | |||
143 | | | | |
144 | | | | |
145 | ‘ | |||
146 | ’ | |||
147 | “ | |||
148 | ” | |||
149 | • | |||
150 | – | |||
151 | — | |||
152 | ˜ | |||
153 | ™ | |||
154 | š | |||
155 | › | |||
156 | œ | |||
157 | | | | |
158 | ž | |||
159 | Ÿ | |||
160 | ||||
161 | ¡ | ¡ | ¡ | |
162 | ¢ | ¢ | ¢ | |
163 | £ | £ | £ | |
164 | ¤ | ¤ | ¤ | |
165 | ¥ | ¥ | ¥ | |
166 | ¦ | ¦ | ¦ | |
167 | § | § | § | |
168 | ¨ | ¨ | ¨ | |
169 | © | © | © | |
170 | ª | ª | ª | |
171 | « | « | « | |
172 | ¬ | ¬ | ¬ | |
173 | | | | |
174 | ® | ® | ® | |
175 | ¯ | ¯ | ¯ | |
176 | ° | ° | ° | |
177 | ± | ± | ± | |
178 | ² | ² | ² | |
179 | ³ | ³ | ³ | |
180 | ´ | ´ | ´ | |
181 | µ | µ | µ | |
182 | ¶ | ¶ | ¶ | |
183 | · | · | · | |
184 | ¸ | ¸ | ¸ | |
185 | ¹ | ¹ | ¹ | |
186 | º | º | º | |
187 | » | » | » | |
188 | ¼ | ¼ | ¼ | |
189 | ½ | ½ | ½ | |
190 | ¾ | ¾ | ¾ | |
191 | ¿ | ¿ | ¿ | |
192 | À | À | À | |
193 | Á | Á | Á | |
194 | Â | Â | Â | |
195 | Ã | Ã | Ã | |
196 | Ä | Ä | Ä | |
197 | Å | Å | Å | |
198 | Æ | Æ | Æ | |
199 | Ç | Ç | Ç | |
200 | È | È | È | |
201 | É | É | É | |
202 | Ê | Ê | Ê | |
203 | Ë | Ë | Ë | |
204 | Ì | Ì | Ì | |
205 | Í | Í | Í | |
206 | Î | Î | Î | |
207 | Ï | Ï | Ï | |
208 | Ð | Ð | Ð | |
209 | Ñ | Ñ | Ñ | |
210 | Ò | Ò | Ò | |
211 | Ó | Ó | Ó | |
212 | Ô | Ô | Ô | |
213 | Õ | Õ | Õ | |
214 | Ö | Ö | Ö | |
215 | × | × | × | |
216 | Ø | Ø | Ø | |
217 | Ù | Ù | Ù | |
218 | Ú | Ú | Ú | |
219 | Û | Û | Û | |
220 | Ü | Ü | Ü | |
221 | Ý | Ý | Ý | |
222 | Þ | Þ | Þ | |
223 | ß | ß | ß | |
224 | à | à | à | |
225 | á | á | á | |
226 | â | â | â | |
227 | ã | ã | ã | |
228 | ä | ä | ä | |
229 | å | å | å | |
230 | æ | æ | æ | |
231 | ç | ç | ç | |
232 | è | è | è | |
233 | é | é | é | |
234 | ê | ê | ê | |
235 | ë | ë | ë | |
236 | ì | ì | ì | |
237 | í | í | í | |
238 | î | î | î | |
239 | ï | ï | ï | |
240 | ð | ð | ð | |
241 | ñ | ñ | ñ | |
242 | ò | ò | ò | |
243 | ó | ó | ó | |
244 | ô | ô | ô | |
245 | õ | õ | õ | |
246 | ö | ö | ö | |
247 | ÷ | ÷ | ÷ | |
248 | ø | ø | ø | |
249 | ù | ù | ù | |
250 | ú | ú | ú | |
251 | û | û | û | |
252 | ü | ü | ü | |
253 | ý | ý | ý | |
254 | þ | þ | þ | |
255 | ÿ | ÿ | ÿ |