ASCII
ASCII, “American Standard Code for Information Interchange” yani “Amerikan Standart Bilgi Değişim Kodu”nun kısaltmasıdır ve metin verisi ile bilgi alışverişi için bir karakter seti standardını tanımlar. Karakter kodlamaları (ya da kod sayfaları), harfler ve diğer metin karakterlerinin yanı sıra veri transferi için kullanılan kontrol kodlarının nasıl ikilik (bit ve byte) formatında kodlanacağını belirler.
ASCII, Unicode, ISO-8859-1 ve Windows 1252 ile birlikte en önemli karakter seti standartlarından biridir. Web sayfalarında uzun süre baskın olan bu kodlama, 2007 yılında Unicode kodlaması UTF-8 ile yer değiştirmiştir. Ancak, hala bazı alanlarda ASCII kodu geçerliliğini korumaktadır. Bu alanlarda yalnızca ASCII karakterleri kullanılmasına izin verilmektedir.
ASCII Kodu ve Tarihçesi
ASCII’nin tarihi, telgraf ve Morse kodu gibi erken iletişim sistemlerine dayanmaktadır. 1901-1932 yılları arasında Yeni Zelandalı mucit Donald Murray tarafından geliştirilen 5-bit Murray kodu, bu tarihlerde ASCII’nin öncüsü olmuştur. İlk ASCII versiyonu, 1963 yılında Amerikan Standartlar Derneği (ASA) tarafından yayımlanmıştır. Bu dernek, daha sonra Amerikan Ulusal Standartlar Enstitüsü (ANSI) adını almıştır. 1968 yılında ise hala geçerli olan ASCII karakter seti yayımlanmıştır.
7-Bit ASCII Karakter Seti
ASCII kodu, sadece yedi bit kullanarak 128 farklı karakteri kodlayabilmektedir. Bu set, İngilizce alfabesinin büyük ve küçük harfleri, en yaygın noktalama işaretleri, matematiksel semboller ve veri transferi ile metin biçimlendirmesi için 33 kontrol kodunu içerir.
ASCII’nin içereceği karakter grupları şunlardır:
- 0-32 ve 127: Veri transferi için kontrol kodları ve boşluk, sekme, satır sonu gibi işaretler.
- 48-57: Rakamlar.
- 65-90: Büyük harfler.
- 97-122: Küçük harfler.
- 33-47, 58-64, 91-96, 123-126: Noktalama işaretleri, matematiksel semboller ve parantezler gibi diğer karakterler.
ASCII, ülkeye özel özel karakterleri (örneğin, Almanca umlaut’lar ya da aksan işaretleri) içermemektedir.
Genişletilmiş Karakter Setleri: ISO-8859
ASCII, yalnızca İngilizce alfabesini içerdiğinden, birçok bölgesel özel karakteri kapsamak için çeşitli genişletilmiş karakter setleri geliştirilmiştir. Windows-1252 ve ISO-8859-1, bu genişletmelerin başında gelir. Her ikisi de 8-bitlik ASCII genişletmeleri olup, çok sayıda bölgesel özel karakteri içerir. Tarihi gelişmeler nedeniyle, her iki standart da genellikle “ANSI karakter setleri” olarak adlandırılmaktadır. Ancak, ANSI bu setleri resmi olarak standartlaştırmamıştır.
ISO-8859, her biri farklı bir dil ve bölgeye hitap eden bir dizi karakter setini kapsar. Örneğin, ISO-8859-7, Latin ve Yunan alfabesini içerirken, ISO-8859-4, İskandinav ve Baltık dillerine özgü karakterleri içerir.
ASCII, Unicode ve UTF-8
ISO-8859 standartları birçok dili kapsasa da, tüm dillerin dahil edilmesi mümkün olmamıştır. Ayrıca, farklı karakter setleri birbirleriyle uyumsuz olduğundan, bu durum kafa karışıklığına yol açmıştır. 1988 yılında, tüm karakter setlerini tek bir standarda birleştirmek için ilk planlar yapılmış ve 1991’de Unicode’un ilk versiyonu yayımlanmıştır.
Unicode, bir milyondan fazla karakteri görüntülemeyi sağlar ve giderek diğer karakter setlerinin yerini alır. UTF-8, şu anda Dünya Çapında Ağ’da (World Wide Web) en yaygın kullanılan metin formatıdır ve ASCII ile uyumludur, çünkü ilk 128 karakter aynıdır.
ASCII ve SEO
ASCII ve ISO-8859 uzun süre internetin metin karakter setleri arasında önemli bir yer tutsa da, günümüzde artık web üzerinde geçerli sayılmamaktadır. W3C (World Wide Web Consortium) tarafından yayımlanan resmi yönergelere göre, tüm web siteleri için UTF-8 kodlama kullanılması önerilmektedir.
Unicode, web sayfalarındaki metinlerin yanı sıra meta açıklamalarda da kullanılabilir. Örneğin, onay işaretleri, kalp simgeleri, yıldızlar, zarf ve para birimi sembolleri gibi karakterler, okuyucularda bilinçaltı etkiler yaratabilir. Onay işaretleri ve kalp simgeleri onay duygusu yaratırken, zarf ve telefon simgeleri iletişime geçmeye teşvik eder. Bu, doğrudan arama motoru sıralamalarına etki etmez, ancak tıklama oranlarını artırarak daha fazla ziyaretçi ve müşteri kazanılmasına katkı sağlar.
ASCII Karakter Kümesi
ASCII karakter kümesindeki kontrol karakterleri ve yazdırılabilir karakterlerin, onluk (decimal), onaltılık (hexadecimal) ve sekizlik (octal) sayı sistemlerindeki karşılıklarını içeren tablo aşağıda listelenmiştir.
SEO ile ilgili anahtar kelimeler ve kelime öbeklerinde ise bazı simgelerden kaçınılması önemlidir. Ülkeye özgü harfler ve aksanlar sorun teşkil etmezken, alışılmadık özel karakterler, ayırıcı simgeler, emojiler ve piktogramlar anahtar kelime tanımını zorlaştırabilir.
Char. | Decimal | Hexadecimal | Octal |
---|---|---|---|
NUL | 0 | 0x00 | 000 |
SOH | 1 | 0x01 | 001 |
STX | 2 | 0x02 | 002 |
ETX | 3 | 0x03 | 003 |
EOT | 4 | 0x04 | 004 |
ENQ | 5 | 0x05 | 005 |
ACK | 6 | 0x06 | 006 |
BEL | 7 | 0x07 | 007 |
BS | 8 | 0x08 | 010 |
HT | 9 | 0x09 | 011 |
LF | 10 | 0x0A | 012 |
VT | 11 | 0x0B | 013 |
FF | 12 | 0x0C | 014 |
CR | 13 | 0x0D | 015 |
SO | 14 | 0x0E | 016 |
SI | 15 | 0x0F | 017 |
DLE | 16 | 0x10 | 020 |
DC1 | 17 | 0x11 | 021 |
DC2 | 18 | 0x12 | 022 |
DC3 | 19 | 0x13 | 023 |
DC4 | 20 | 0x14 | 024 |
NAK | 21 | 0x15 | 025 |
SYN | 22 | 0x16 | 026 |
ETB | 23 | 0x17 | 027 |
CAN | 24 | 0x18 | 030 |
EM | 25 | 0x19 | 031 |
SUB | 26 | 0x1A | 032 |
ESC | 27 | 0x1B | 033 |
FS | 28 | 0x1C | 034 |
GS | 29 | 0x1D | 035 |
RS | 30 | 0x1E | 036 |
US | 31 | 0x1F | 037 |
SP | 32 | 0x20 | 040 |
! | 33 | 0x21 | 041 |
“ | 34 | 0x22 | 042 |
# | 35 | 0x23 | 043 |
$ | 36 | 0x24 | 044 |
% | 37 | 0x25 | 045 |
& | 38 | 0x26 | 046 |
‘ | 39 | 0x27 | 047 |
( | 40 | 0x28 | 050 |
) | 41 | 0x29 | 051 |
* | 42 | 0x2A | 052 |
+ | 43 | 0x2B | 053 |
, | 44 | 0x2C | 054 |
– | 45 | 0x2D | 055 |
. | 46 | 0x2E | 056 |
/ | 47 | 0x2F | 057 |
0 | 48 | 0x30 | 060 |
1 | 49 | 0x31 | 061 |
2 | 50 | 0x32 | 062 |
3 | 51 | 0x33 | 063 |
4 | 52 | 0x34 | 064 |
5 | 53 | 0x35 | 065 |
6 | 54 | 0x36 | 066 |
7 | 55 | 0x37 | 067 |
8 | 56 | 0x38 | 070 |
9 | 57 | 0x39 | 071 |
: | 58 | 0x3A | 072 |
; | 59 | 0x3B | 073 |
< | 60 | 0x3C | 074 |
= | 61 | 0x3D | 075 |
> | 62 | 0x3E | 076 |
? | 63 | 0x3F | 077 |
@ | 64 | 0x40 | 100 |
A | 65 | 0x41 | 101 |
B | 66 | 0x42 | 102 |
C | 67 | 0x43 | 103 |
D | 68 | 0x44 | 104 |
E | 69 | 0x45 | 105 |
F | 70 | 0x46 | 106 |
G | 71 | 0x47 | 107 |
H | 72 | 0x48 | 110 |
I | 73 | 0x49 | 111 |
J | 74 | 0x4A | 112 |
K | 75 | 0x4B | 113 |
L | 76 | 0x4C | 114 |
M | 77 | 0x4D | 115 |
N | 78 | 0x4E | 116 |
O | 79 | 0x4F | 117 |
P | 80 | 0x50 | 120 |
Q | 81 | 0x51 | 121 |
R | 82 | 0x52 | 122 |
S | 83 | 0x53 | 123 |
T | 84 | 0x54 | 124 |
U | 85 | 0x55 | 125 |
V | 86 | 0x56 | 126 |
W | 87 | 0x57 | 127 |
X | 88 | 0x58 | 130 |
Y | 89 | 0x59 | 131 |
Z | 90 | 0x5A | 132 |
[ | 91 | 0x5B | 133 |
\ | 92 | 0x5C | 134 |
] | 93 | 0x5D | 135 |
^ | 94 | 0x5E | 136 |
_ | 95 | 0x5F | 137 |
` | 96 | 0x60 | 140 |
a | 97 | 0x61 | 141 |
b | 98 | 0x62 | 142 |
c | 99 | 0x63 | 143 |
d | 100 | 0x64 | 144 |
e | 101 | 0x65 | 145 |
f | 102 | 0x66 | 146 |
g | 103 | 0x67 | 147 |
h | 104 | 0x68 | 150 |
i | 105 | 0x69 | 151 |
j | 106 | 0x6A | 152 |
k | 107 | 0x6B | 153 |
l | 108 | 0x6C | 154 |
m | 109 | 0x6D | 155 |
n | 110 | 0x6E | 156 |
o | 111 | 0x6F | 157 |
p | 112 | 0x70 | 160 |
q | 113 | 0x71 | 161 |
r | 114 | 0x72 | 162 |
s | 115 | 0x73 | 163 |
t | 116 | 0x74 | 164 |
u | 117 | 0x75 | 165 |
v | 118 | 0x76 | 166 |
w | 119 | 0x77 | 167 |
x | 120 | 0x78 | 170 |
y | 121 | 0x79 | 171 |
z | 122 | 0x7A | 172 |
{ | 123 | 0x7B | 173 |
| | 124 | 0x7C | 174 |
} | 125 | 0x7D | 175 |
~ | 126 | 0x7E | 176 |
DEL | 127 | 0x7F | 177 |