📘 SMOG Readability Analysis - індекс читабельності тексту

Вставте український текст у поле нижче — калькулятор розрахує індекс читабельності за адаптованим алгоритмом SMOG (Simple Measure of Gobbledygook) для української мови. Додатково ви побачите базові метрики (слова, речення, середні довжини), частку багатоскладових слів та візуальну підсвітку складних слів у двох режимах (4 склади та 5+ складів).
Рекомендований обсяг тексту: до 30 000 символів. Статистика оновлюється автоматично.
Введіть щонайменше кілька речень українською мовою (≈80+ слів), щоб побачити індекс алгоритму.
Алгоритм читабельності (адаптація SMOG)
Після аналізу тут з'явиться числове значення індексу та коротка інтерпретація рівня складності тексту.
Може містити орієнтовну похибку для текстів із дуже короткими або дуже довгими реченнями.
СЛОВА / РЕЧЕННЯ
Загальна кількість слів і речень у тексті з урахуванням базової обробки скорочень та чисел.
Можлива похибка під час обробки діалогів, вигуків та фрагментованого мовлення.
СЕРЕДНЯ ДОВЖИНА
Середня кількість літер у слові та слів у реченні (орієнтовне навантаження на читача).
Показник є орієнтовним: стилістичні конструкції можуть впливати на результат.
% СКЛАДНИХ СЛІВ (4+ СКЛАДИ)
Частка слів із 4 або більше складами, які враховуються у розрахунку індексу.
Можлива похибка для власних назв, діалектів та слів з апострофом.

Підсвітка складних слів

Нижче відображається копія вашого тексту з підсвіткою складних слів. Ви можете вибрати режим підсвічування: тільки слова з 4 складів або тільки слова з 5+ складів. Підсвітка є орієнтовною: окремі слова можуть мати різну кількість складів залежно від вимови.

Як читати індекс

Алгоритм оцінює складність українського тексту на основі адаптованого принципу SMOG (Simple Measure of Gobbledygook). Це підхід, який був розроблений для англомовних текстів і показує, наскільки текст «важко» сприймати читачеві, враховуючи:

  • частку багатоскладових слів (4+ склади);
  • середню довжину слів;
  • середню довжину речень;
  • ритм та загальну «щільність» мовлення.

SMOG добре працює як якісний індикатор читабельності, особливо для художніх, публіцистичних, освітніх та інформаційних текстів. Алгоритм не розпізнає контекст або стиль, але дуже точно ловить лексичне навантаження — тобто те, наскільки мозку потрібно «працювати» при читанні.

Інтерпретація індексу

  • < 6 — дуже проста мова: короткі речення, мінімум складних слів. Легко читається дітьми та широкою аудиторією без підготовки.
  • 6–7.5 — проста мова: плавний, доступний текст. Підходить для блогів, новин, SEO-матеріалів та повсякденного читання.
  • 7.6–9 — помірна складність: помітно більше довших слів і складніших конструкцій. Комфортно сприймається дорослими читачами та учнями старших класів.
  • 9–11 — підвищена складність: щільний текст, вимагає уваги. Підходить для освітніх матеріалів, оглядових статей, професійного контенту.
  • 11–13 — висока складність: довгі речення, абстрактні формулювання, значна частка слів із 4+ складами. Підходить для підготовленої аудиторії.
  • > 13 — дуже висока складність: текст насичений термінами та складними синтаксичними конструкціями. Орієнтований на вузьких спеціалістів або академічне середовище.

Чому SMOG працює

SMOG ґрунтується на тому, що слова з великою кількістю складів найчастіше відповідають за складність змісту. Вони вказують на:

  • абстрактні поняття;
  • професійні терміни;
  • іноземні запозичення;
  • складні описи.

Саме вони найбільше «навантажують» читача — тому SMOG використовує їх як головний сигнал складності.

Поширені запитання (FAQ)

1. Що саме вимірює індекс SMOG?

Алгоритм оцінює лексичне навантаження тексту: частку багатоскладових слів, середню довжину слів та речень. Це дає уявлення про те, наскільки легко або складно читачеві сприймати текст.

2. Чому SMOG потребує адаптації під українську?

Українська мова має довші слова, більше голосних і іншу структуру складів, тому оригінальна англійська формула завищує складність. Адаптація коригує ці відмінності та дає реалістичні результати.

3. Чому індекс може бути неточним для дуже коротких текстів?

Алгоритм працює найкраще зі звичайними абзацами. Тексти з 1–2 речень не мають достатньої статистики, тому індекс у таких випадках варто сприймати як приблизний.

4. Чи враховує алгоритм стиль, емоції або контекст?

Ні. SMOG оцінює лише формальні мовні параметри: довжину слів та речень. Він не аналізує іронію, тон, гумор або художні прийоми.

5. Чому підсвітка складних слів може відрізнятися від індексу?

Підсвітка працює за вибраним режимом (4 склади або 5+ складів), тоді як індекс використовує поріг 3+ склади. Це дозволяє одночасно бачити і точний розрахунок, і окремо — найскладніші слова тексту.

6. Чи підходить SMOG для технічних або наукових текстів?

Так, але варто враховувати, що такі тексти містять багато термінів, які природно підвищують індекс. Це не означає «погану» читабельність — лише високе лексичне навантаження.

7. Чи можна використовувати цей індекс для SEO?

Так. Багато редакцій і блогів оптимізують тексти за читабельністю, щоб покращити утримання уваги та поведінкові фактори. Індекс допомагає знайти місця, які можуть ускладнювати сприйняття.