Регулярные выражения RegExp SEO-специалистов

Регулярные выражения RegExp SEO-специалистов изображение поста

Мы знаем, о чем вы подумали. Будто у всех специалистов SEO есть секретный язык жестов, на котором они общаются между собой. И да, и нет – не исключено, что некоторые «сеошники» так и общаются, но мы сегодня будем говорить об особых конструкциях для поиска вхождений в текстовой строке. Они то и называются регулярными выражениями.

На самом деле, RegExp – невероятно полезная штука, с помощью которой можно быстро «вытянуть» из текста телефоны и адреса e-mail, абсолютно любые куски текста. Чтобы вам было понятнее и как можно больше информации отложилось в голове, мы рассмотрим один такой пример использовании регулярных выражений в настройке редиректа на сайте.

Начнем, пожалуй, с самого главного – разбора синтаксиса RegExp

«^» – называется карет, галочка или циркумфлекс. Обозначает начало строки. Например, вам нужно найти все ключевые конструкции, которые начинаются со слова «купить». Тогда вам нужно ввести в строку поиска  ^купить. Например, эту особенность можно использовать в фильтрах Google Analytics:

Пример использования регулярного выражения в Google Analytics

«$» — всем знакомый знак доллара. Конец строки.

Тут все понятно: конструкция квартиры$ найдет все фразы, которые заканчиваются на слово «квартиры».

«?» — вопросительный знак. Обозначает необязательную встречаемость последнего символа.

Представьте, что вы ищите ключевое слово «купить лестницу» с учетом возможной опечатки. Тогда вы вводите «купить лест?ницу» с вопросительным знаком и получаете все ключевые слова, в которых встречаются фразы «купить лестницу» и «купить лесницу».

«( )» — круглые скобки. Обозначают группировку конструкций

Точно так же, как в математике, круглые скобки используются в регулярных выражениях для группировки. Допустим, вам нужно всех пользователей из папки «domain.com/blog» перенаправить на поддомен blog.domain.com. Для этого вы прописываете:

RewriteRule ^blog/(.*)$ http://blog.domain.com/$1 [R=301,L]

В данном случае, правило ^blog/(.*)$ означает, что адрес будет начинаться с blog/. После него идет какая-то последовательность символов, которую вы объединяете в скобки, после чего используете переменную $1 для постраничного редиректа на поддомен.

«|» — вертикальная линия. Оператор «ИЛИ».

Если в текущем поиске вам нужно перечислить определенные варианты (например, купить и куплю), достаточно ввести:

купить|куплю

«{ }» — фигурные скобки. Обозначают повторение символа несколько раз.

Зачем «сеошнику» фигурные скобки? Их используют для четкого указания, сколько раз должен встречаться один или несколько символов. Если в искомом тексте вам нужно найти почтовый индекс, который состоит из 6 цифр и начинается на 14, используйте выражение:

14[0-9]{4}

Здесь 14 означает первые цифры индекса, 4 – повторение последовательности чисел четыре раза, 6 – общая длина, которая получится.

«\» — обратный слеш. Речь идет об экранировании служебных символов

Хотите найти точку во время поиска? Нет ничего невозможно – экранируйте ее с помощью знака «\.» К примеру, в том же Google Analytics можно настроить использование внутреннего поиска. Например, если вы видите в URL конструкцию «/?q=», человек использует поиск.

Использование регулярных выражений в настройке целей

Конечно, существуют десятки других символов, позволяющих оперировать регулярными выражениями. Полный список таких символов вы найдете в Википедии, перейдя по ссылке: https://ru.wikipedia.org/wiki/ Регулярные выражения. Впрочем, вышеперечисленных выше символов с лихвой хватит для решения основных задач по SEO.

Комментарии