🍋
Menu
General

UTF-8

UTF-8 (Unicode Transformation Format 8-bit)

Web'in baskın karakter kodlamasıdır; karakter başına bir ila dört bayt kullanarak Unicode standardındaki her karakteri temsil edebilir ve ASCII ile geriye dönük uyumlu kalır.

Teknik Detay

UTF-8 değişken genişlikli bir kodlamadır: ASCII karakterler (U+0000-U+007F) ASCII değerleriyle aynı bir bayt kullanır, böylece herhangi bir ASCII metin geçerli UTF-8'dir. İki bayt Latin, Yunan, Kiril ve Arap alfabelerini (U+0080-U+07FF), üç bayt çoğu CJK karakterini (U+0800-U+FFFF), dört bayt ise emoji ve nadir yazı sistemlerini (U+10000-U+10FFFF) kapsar. Web sayfalarının %98'inden fazlası UTF-8 kullanır. BOM (Bayt Sırası İşareti, EF BB BF) isteğe bağlıdır ve Windows bağlamları dışında genellikle önerilmez.

Ornek

```javascript
// UTF-8: file processing example
const file = document.getElementById('fileInput').files[0];
const reader = new FileReader();
reader.onload = (e) => {
  const data = e.target.result;
  console.log(`Loaded: ${file.name} (${file.size} bytes)`);
};
reader.readAsArrayBuffer(file);
```

Ilgili Terimler