Программа KMPlayer – бесплатный проигрыватель для Windows 7, XP и Vista, который точно справится с любым распространенным видеоформатом скачать можно тут http://softdam.ru/kmplayer/.

   Формула ранжирования. Ее восстановление

 Рассматривая эту задачу с математической точки зрения, можно определить следующие входные данные:

  •  Характеристики каждого сайта – набор векторов;
  •  Параметры, с помощью которых оценивается сайт – координаты вектора.
  •  Сама задача относится к классу оценки порядковой регрессии.

   Был разработана система, позволяющая восстановить ранжирование сайта, а также спрогнозировать возможные изменения при корректировках в параметрах сайта. Определение происходить с некоторой долей погрешности.

   Сначала необходимо найти направление, по которому нужно проектировать объекты выборки. Их может быть много. Необходимо определить какое позволит создать самое большое отдаление объектов друг от друга.

   При выборе стратегии обучения было рассмотрено 2 варианта:

  1. Полная стратегия
  2. Сокращенная стратегия

   Был выбран 2 вариант, который учитывает порядок 2 соответствующих элементов. Результат подхода на различных выборках показал очень хорошие результаты.

   Чтобы произвести необходимые корректировки параметров сайта необходимо провести эксперимент на базе признаков по тексту:

  1. Собрать данные о сайтах из Топ 20 по необходимому запросу
  2. Стандартизировать данные с помощью специального алгоритма
  3. Выполнить алгоритм определения релевантности. Метод квадратичного программирования
  4. Сортирование значений, полученных в ходе анализа
  5. Сделать вывод

в результате изменений, значение сайта в топе переместилось с 50 позиции до 20.

   Измерение по тематике

   В ходе работы подтвердилась значимость тематики. Это близость темы статьи ко всему сайту. Определить это отношение возможно с помощью расчетов: косинус между векторами, которые соответствуют тематике текста, схожего запроса и всего сайта. Эта модель была взята за основу программы, которая может определить схожесть тематики.

   Добиться положительной динамики можно без потерь благодаря схеме «поддомен+домен».

   Естественность текста

 Проблема состоит из 2 факторов:

  •  Замена русских букв на латиницу
  •  Генерация контента

 1 фактор легко определяется, так как слова с иностранными буквами являются в интернете редкими в употреблении. Благодаря инвертированию частоты их можно найти.

 2 фактор определяется также с помощью формулы. Вводится величина, которая является критической. Делается подсчет слов, чья характеристика превышает критическую.

Больше информации о веб технологиях можно узнать из нашего перечня всех статей на сайте:

Добавить комментарий


Яндекс.Метрика