Новая версия парсера статей FDE Grabber 7.7

Дорогие друзья, извещаем о том, что доступен для покупки, скачивания и тестирования парсер новостей FDE Grabber 7.7 В новую версию вошли следующие изменения и дополнения:

  1. Улучшен встроенный синонимайзер - теперь можно указывать не только слова по отдельности, но и целые фразы, включая знаки пунктуации.
  2. Значительно улучшена точность системы автоматического распознавания категорий (рубрик), к которым относится данный текст по набору указанных ключевых слов;
  3. Добавлена поддержка публикации через xml-rpc для сайтов, работающих ТОЛЬКО по безопасному протоколу https (например wordpress.com)
  4. Оптимизировано поведение парсера новостей при неоднозначных настройках, например, если в настройках категории источников получение краткой новости указано из полной, путём обрезки, а картинка есть только в исходной краткой (а в полной новости её нет), то граббер, теперь всё равно получит картинку.
  5. Добавлен хак, который обеспечивает корректировку заглавных букв. Так, если в результате каких-либо произведённых замен, корректировок или просто ошибки на сайте-источнике слова в предложениях начинаются не с заглавных букв, то применив данный хак можно это исправить.

Исправлены все найденные недочёты и недоработки прошлых версий.

Вышла новая версия парсера новостей FDE Grabber 7.7, читать далее...

Доступна новая версия граббера новостей FDE Grabber 7.2

Дорогие друзья, извещаем о том, что доступна для покупки, скачивания и тестирования новая версия парсера статей и новостей FDE Grabber 7.2 Среди новых возможностей и дополнений можно отметить следующие:
  • поддержка новых тегов при составлении шаблонов для граббера (как при настройке категорий источников, так и при настройке источников)
  • поддержка новой версии системы управления сообществами InstantCMS 2.x.

Поддержка новых тегов при составлении шаблонов для граббера

При составлении шаблонов теперь имеется возможность наряду со старым способом выделения в шаблоне полезного контента сделать это и новым способом. Рассмотрим простой пример. Допустим определённый нами шаблон имеет вид: usual_pattenЗдесь видно, что полезный контент будет собираться в тег {description}
Но что, если нам требуется производить захват и обрамляющего дескриптора <div id=»pageContent»>…</div>?
- для таких случаев мы предусмотрели новый способ указания шаблонов с помощью обрамляющих парных тегов, например {x_description}…{/x_description}: extended_patternМы видим, что в полученном с помощью данного шаблона контенте будут содержаться и обрамляющие дескрипторы:  <div id=»pageContent»>…</div> Там, где содержимое изменяется произвольно и оно нам не нужно, мы указали тег {null}

Поддержка InstantCMS 2.x

При добавлении сайта в парсер новостей теперь можно выбрать несколько типов публикации, связанных с новой версией InstantCMS 2.x: instant_cms_2xxxСейчас доступны такие типы публикации:
  • публикация в раздел блогов
  • публикация в раздел новостей
  • публикация в раздел со статьями
Исправлены мелкие недочёты и недоработки прошлых версий

Доступна новая версия граббера новостей FDE Grabber 7.2, читать далее...