LSI — Latent Semantic Indexing (латентно-семантичний індекс) дозволяє проводити пошуковим системам семантичний аналіз тексту на релевантність (відповідність) тематиці. LSI слова – це слова пов’язані за змістом з основний темою тексту.
Уточнення: іноді зустрічається інформація про те, що слова LSI це синоніми основного запиту. Але це зовсім так. Будь-які слова, які зустрічаються в результатах пошуку за основним запитом і мають загальний зміст, є ключами LSI.
Приблизно в середині 1960 р. був вперше описаний метод факторного аналізу (аналіз впливу окремих факторів на результативний показник). У 1988 році було опубліковано основну статтю з технології LSI: «Удосконалення пошуку інформації за допомогою прихованої семантичної індексації». А вже за рік було видано оригінальний патент.
З того часу технологія LSI використовувалася і для оцінки знань студентів, призначення статей рецензентам, аналізу неструктурованого тексту розвідкою США. На певному етапі розвитку пошукові системи взяли за основу технології латентного семантичного індексування.
У 2009 році співробітники пошукової системи провели дослідження розміщеної в Ру сегменті Інтернету інформації. Вийшла величезна цифра у 140 террабайт тексту (картинки та відео у підрахунку обсягу не враховувалися). Для того, щоб отримати перші місця в такому величезному обсязі інформації, SEO-фахівці вигадували нові методи просування. На перших місцях видачі почали з’являтись переспамлені тексти. Перевантажені SEO-ключами тексти не несли сенсу та користі для користувачів.
Співробітники контролю якості в пошукових системах почали терміново шукати шляхи вирішення. У 2011 році Google запустив алгоритм Panda, головною метою якого було розпізнавання та зниження низькоякісного контенту на сайтах. При цьому збільшувався рейтинг сайтів із якісним контентом. У 2013 році в Google впровадили новий алгоритм “Hummingbird” (Колібрі).
Завдяки цим алгоритмам пошукові системи почали краще розуміти як контент, а й контекст сторінок.
Щоб зрозуміти логіку роботи пошукових систем, розберемо приклад: якщо ввести в пошуковий рядок слово «тачки», які сторінки повинна пошукова система видати користувачеві?
- автомобілі
- садові тачки
- популярний мультфільм
Варіантів сторінок із різним контентом може бути багато. Пошуковій системі необхідно розуміти, що описує та чи інша сторінка.
Як пошукова система визначає контекст? Саме тут пошукові системи приймають рішення на основі латентно-семантичного індексу. Коли пошукова система бачить на сторінці слова: блискавка, онлайн, дивитися, cars, маквін і т.д. відразу розуміє, що ця сторінка про популярний мультфільм. Якщо на сторінці є слова: магазин, доставка, недорого, ціна і т.д. зрозуміло, що сторінка про будівельні або садові тачки.
Дуже важливо використовувати LSI слова у тексті статті та контенту на сайті. Так ви допоможете пошуковій системі точніше визначити зміст сторінки. Зібрані за заданою тематикою слова LSI дозволяють побудувати структуру тексту, і максимально повно розкрити інформацію.
Раніше за основу роботи брався SEO-копірайтинг. Основна вимога – це ключові запити, їх щільність на сторінці, розташування тексту, види входження тощо. Тексти написані по SEO технічним завданням рідко були красивими, легко читаються і часто не мали корисної інформації.
За методикою LSI велику важливість набули варіанти використання ключових слів, слова, що задають тематику, доречність їх використання та структура тексту.
Якщо раніше необхідно було описати мультфільм про Вінні Пуха, то в текст, куди можна і не можна вставляти слова Вінні Пух і все! Зараз дуже важливо використовувати слова: п’ятачок, сова, хвіст, рушниця, неправильні бджоли тощо. Саме за цими словами пошукова система визначить якість тексту.
- Розкриття теми. Чим точніше і повніше розкрито тему, тим більше користі він принесе відвідувачеві. Чим краще текст розкриває певну тему, тим більше шансів потрапити в ТОП видачі.
- Орієнтація на потреби ЦА (цільової аудиторії). Один із важливих критеріїв – задоволення потреб відвідувачів. Пошукові системи аналізують поведінкові чинники відвідувачів. Тексти, на яких люди не затримуються, знижуються в пошуковій видачі. Створення дійсно захоплюючого та корисного контенту, який зацікавить відвідувача та відповість на всі його питання на тему, дасть сайту дуже хороші поведінкові показники та допоможе вийти сторінці в ТОП.
- Відсутність води. Зайві слова, позбавлені смислового навантаження, звороти мови, що ускладнюють речення, ускладнюють розуміння сенсу тексту. Особливо важливим останнім часом є можливість передати головну думку тексту. Для перевірки текстів варто використовувати такі інструменти як Главред і Тургенєв.
Для кожного пошукового запиту буде свій певний набір фраз LSI. Знайти ці слова та фрази досить легко. Ось список основних інструментів:
- Підказки пошукових систем Google. Введіть початок пошукового запиту та пошуковик видасть вам список підказок, що люди шукають найчастіше в рамках основного запиту.
- Поради. Після пошуку за ключовим словом внизу сторінки пошуковики виводять блок, що люди шукають разом з основним запитом.
- Arsenkin інструменти. Використовуючи цей інструмент, дозволяє знайти додаткові LSI ключі.
- Pixel Tools – Технічне завдання для копірайтерів. Простий і зручний інструмент який дозволяє для зазначеного запиту та регіону зібрати слова, що задають тематику.
Співробітники пошукових систем постійно рекомендують писати тексти для людей, а не для пошукових систем. Це частково правильно і перетинається з технікою використання слів LSI. Але водночас пошукові системи часто накладають фільтри на тексти, написані непрофесійними копірайтерами. Створити статтю, яка враховує всі нюанси (використання слів, що задають тематику, кількість ключів, різні технічні аспекти) непідготовленому автору досить складно.