Импорт статей с HTML источников

Ранее мы с вами рассмотрели импорт новостей с RSS/Atom источников. Пришло время познакомиться с граббингом с HTML источников. Но перед этим нам нужно понять, что такое HTML источник. Для граббера источник - это просто обновляющийся список новостей, в котором можно выявить следующие данные по каждой статье:
  1. адрес конечной статьи
  2. название
  3. краткое описание
  4. возможно, некоторые другие дополнительные данные
Очевидно, что HTML источник - это тот же RSS или Atom фид, только с нестандартным шаблоном парсинга. Поэтому, при использовании HTML источника нам требуется указывать шаблон для него. HTML шаблон для HTML источника выявляется совершенно аналогично описанному способу выявления шаблона для категории, за тем лишь исключением, что теперь у нас имеется больше переменных: {date} - дата; {name} - название; {link} - адрес к полному описанию статьи; {description} - краткое описание; {category} - категория публикации; {null} - ненужный контент; Добавление HTML источника совершенно аналогично добавлению RSS/Atom источника, только теперь требуется указать ещё и шаблон для парсинга. Проверить правильность указания шаблона для парсинга HTML источника можно в разделе "Тест HTML источника"