Unicode в глубину¶

Серия технических статей о стандарте Unicode — от основ до внутреннего устройства библиотек.

О проекте

Этот сайт и все статьи на нём сгенерированы нейросетью Claude Sonnet 4.6 (Anthropic) в диалоге с автором. Материалы прошли редакцию и проверку, но могут содержать неточности — всегда сверяйтесь с официальной документацией Unicode.

О серии¶

Unicode — это не просто «поддержка разных языков». Это сложный стандарт с базой данных символов, алгоритмами нормализации, сортировки, разбиения текста на кластеры. Эта серия разбирает Unicode изнутри: файлы стандарта, алгоритмы, реализации в Python и Node.js, исходники библиотеки ICU.

Каждая статья содержит встроенные примеры кода с ожидаемым выводом. JavaScript-примеры можно запустить прямо в браузере — кнопкой «▶ Запустить».

Ресурсы¶

Ссылки на спецификации, UCD-файлы, документацию библиотек — в разделе Ресурсы.

Unicode в глубину¶

О серии¶

Статьи¶

1. Основы Unicode: кодовые точки, плоскости, блоки ¶

2. Unicode Character Database (UCD): файлы и структура ¶

3. Кодировки: UTF-8, UTF-16, UTF-32 ¶

4. Графемные кластеры: что видит пользователь ¶

5. Нормализация Unicode: NFD, NFC, NFKD, NFKC ¶

6. Коллация: Unicode Collation Algorithm и CLDR ¶

7. Unicode на практике: Linux, инструменты, исходники ICU ¶

Ресурсы¶

Unicode в глубину¶

О серии¶

Статьи¶

1. Основы Unicode: кодовые точки, плоскости, блоки¶

2. Unicode Character Database (UCD): файлы и структура¶

3. Кодировки: UTF-8, UTF-16, UTF-32¶

4. Графемные кластеры: что видит пользователь¶

5. Нормализация Unicode: NFD, NFC, NFKD, NFKC¶

6. Коллация: Unicode Collation Algorithm и CLDR¶

7. Unicode на практике: Linux, инструменты, исходники ICU¶

Ресурсы¶

1. Основы Unicode: кодовые точки, плоскости, блоки ¶

2. Unicode Character Database (UCD): файлы и структура ¶

3. Кодировки: UTF-8, UTF-16, UTF-32 ¶

4. Графемные кластеры: что видит пользователь ¶

5. Нормализация Unicode: NFD, NFC, NFKD, NFKC ¶

6. Коллация: Unicode Collation Algorithm и CLDR ¶

7. Unicode на практике: Linux, инструменты, исходники ICU ¶