Новая версия парсера статей FDE Grabber 7.7

Дорогие друзья, извещаем о том, что доступен для покупки, скачивания и тестирования парсер новостей FDE Grabber 7.7 В новую версию вошли следующие изменения и дополнения:

  1. Улучшен встроенный синонимайзер - теперь можно указывать не только слова по отдельности, но и целые фразы, включая знаки пунктуации.
  2. Значительно улучшена точность системы автоматического распознавания категорий (рубрик), к которым относится данный текст по набору указанных ключевых слов;
  3. Добавлена поддержка публикации через xml-rpc для сайтов, работающих ТОЛЬКО по безопасному протоколу https (например wordpress.com)
  4. Оптимизировано поведение парсера новостей при неоднозначных настройках, например, если в настройках категории источников получение краткой новости указано из полной, путём обрезки, а картинка есть только в исходной краткой (а в полной новости её нет), то граббер, теперь всё равно получит картинку.
  5. Добавлен хак, который обеспечивает корректировку заглавных букв. Так, если в результате каких-либо произведённых замен, корректировок или просто ошибки на сайте-источнике слова в предложениях начинаются не с заглавных букв, то применив данный хак можно это исправить.

Исправлены все найденные недочёты и недоработки прошлых версий.

Вышла новая версия парсера новостей FDE Grabber 7.7, читать далее...

Промо-акция

fde_2015_promo Дорогие друзья, извещаем о том, что в период с 25 октября 2014 года по 15 января 2015 года, в рамках нашей промо-акции, стоимость лицензии на использование системы импорта новостей FDE Grabber будет составлять 55.5 USD. При покупке нашей системы в данный период вы можете сэкономить 33.3 USD:

Текущая стоимость: 88.8 USD Стоимость в период промо акции: 55.5 USD Экономия: 88.8 USD - 55.5 USD = 33.3 USD
Не упустите свой шанс приобрести полноценную лицензию на качественный продукт по выгодной цене!

Промо-акция, читать далее...

Доступна новая версия граббера новостей FDE Grabber 7.4

Дорогие друзья, извещаем о том, что доступна для покупки, скачивания и тестирования новая версия парсера контента FDE Grabber 7.4 Изменения и дополнения, вошедшие в новую версию системы импорта статей:

Добавлен новый модуль для работы с тегами

В граббере появился новый раздел для работы с тегами, которые могут сопоставляться с той или иной новостью. При добавлении тега можно указать его название, список ключевых слов, по которым новости будут сопоставляться с данным тегом, а также возможность использования стеммера Портера (что позволяет не склонять ключевые слова), а также сайт, для которого этот тег будет доступен: tagsНапример, если указать набор ключевых слов:
Ай-Петри, Алупка, Алушта, Армянск, Балаклава, Бахчисарай, Веселое, Гаспра, Гурзуф, Джанкой, Евпатория, Инкерман, Керчь, Клепинино, Коктебель, Кореиз, Красноперекопск, Ленино, Массандра, Мискхор, Нижнегорский, Орджоникидзе, Партенит, Раздольное, Саки, Севастополь, Симеиз, Симферополь, Старый Крым, Судак, Феодосия, Форос, Черноморское, Щёлкино, Ялта, Крым
и озаглавить его под общим тегом «Крым», то данный тег будет сопоставляться с новостями, в которых содержатся данные ключевые слова.

Добавлен новый модуль для работы с ключевыми словами

Кроме того, в новой версии парсера контента добавлен раздел, полностью аналогичный модулю для работы с тегами, только ориентированный на работу с ключевыми словами, которые могут указываться в метатеге статьи:
<meta name=»keywords» content=»Новости, события, вести, …»>
keywordsОтметим, что возможность указания ключевых слов доступна не во всех CMS/способах публикации, с которыми работает граббер, а лишь некоторых, например компонент для Joomla K2, Instant CMS, DataLife Engine и т,д.

При работе с сайтом теперь можно указать способ, по которому должны получаться теги и ключевые слова

Ранее граббер мог получать теги/ключевые слова, сопоставляющиеся с данной новостью только путём разбиения её заголовка на слова, например если заголовок выглядел так «В Крыму проведут перепись населения«, то ключевые слова/теги, которые он получал выглядели, как «Крыму«, «проведут«, «перепись«, «населения«, но теперь появилась возможность задействовать модули для работы с тегами и ключевыми словами и получать их более точно и гибко: sitesПарсер контента теперь может получать теги и ключевые слова как из заголовка, так и из подготовленных заблаговременно записей через модули для работы с тегами и ключевыми словами, а также путём комбинирования данных способов.

Исправлены недочёты и недоработки прошлых версий системы импорта новостей

Доступна новая версия граббера новостей FDE Grabber 7.4, читать далее...

Доступна новая версия граббера новостей FDE Grabber 7.2

Дорогие друзья, извещаем о том, что доступна для покупки, скачивания и тестирования новая версия парсера статей и новостей FDE Grabber 7.2 Среди новых возможностей и дополнений можно отметить следующие:
  • поддержка новых тегов при составлении шаблонов для граббера (как при настройке категорий источников, так и при настройке источников)
  • поддержка новой версии системы управления сообществами InstantCMS 2.x.

Поддержка новых тегов при составлении шаблонов для граббера

При составлении шаблонов теперь имеется возможность наряду со старым способом выделения в шаблоне полезного контента сделать это и новым способом. Рассмотрим простой пример. Допустим определённый нами шаблон имеет вид: usual_pattenЗдесь видно, что полезный контент будет собираться в тег {description}
Но что, если нам требуется производить захват и обрамляющего дескриптора <div id=»pageContent»>…</div>?
- для таких случаев мы предусмотрели новый способ указания шаблонов с помощью обрамляющих парных тегов, например {x_description}…{/x_description}: extended_patternМы видим, что в полученном с помощью данного шаблона контенте будут содержаться и обрамляющие дескрипторы:  <div id=»pageContent»>…</div> Там, где содержимое изменяется произвольно и оно нам не нужно, мы указали тег {null}

Поддержка InstantCMS 2.x

При добавлении сайта в парсер новостей теперь можно выбрать несколько типов публикации, связанных с новой версией InstantCMS 2.x: instant_cms_2xxxСейчас доступны такие типы публикации:
  • публикация в раздел блогов
  • публикация в раздел новостей
  • публикация в раздел со статьями
Исправлены мелкие недочёты и недоработки прошлых версий

Доступна новая версия граббера новостей FDE Grabber 7.2, читать далее...

FDE Grabber 7.1 — работа с разных IPv4 адресов

Дорогие друзья, извещаем о том, что доступна для покупки, скачивания и тестирования новая версия парсера контента FDE Grabber 7.1 Изменения и дополнения:

Работа с разных IPv4 адресов/сетевых интерфейсов

В настройках системы импорта новостей добавлено указание списка IP адресов или имён сетевых интерфейсов, разделённых через запятую, через которые будет работать парсер (через них будут производиться внешние запросы к сайтам). ipv4_external_queriesЕсли ваш сервер имеет несколько выделенных IP адресов, то можно указать их в настройках системы импорта новостей, и она будет вести запросы через них по очереди.

Возможность явного указания IP адреса, через который  должна вестись проверка лицензии системы импорта новостей FDE Grabber

В настройках граббера новостей теперь имеется возможность указать явно IP адрес или имя сетевого интерфейса через который будет вестись проверка лицензии. ipv4_grabber_licenseЭто может понадобиться, когда ваш сервер имеет несколько выделенных IPv4 адресов или сетевых карт.

Путь к директории с кешем парсера новостей вынесен в конфиг

Для более гибкой настройки парсера статей путь к папке кеша теперь можно указать/изменить в параметрах системы (Настройки -> вкладка "Файлы и картинки" -> "Путь к папке для кеша"). cache_rootЭто необходимо в случае, когда нужно указать произвольный путь к папкам, например, если администратор хочет оптимизировать и ускорить работу путём использования RAM дисков (дисков, которые работают в оперативной памяти компьютера), что, несомненно может значительно повлиять и повысить производительность сервера. На Unix/Linux системах можно использовать tmpfs, рекомендуемые статьи по теме: Использование tmpfs в MySQL, Using tmpfs for /tmp. На Windows системах можно воспользоваться программой RAMDisk от компании Dataram (диски, объёмом до 4 ГБ можно создать бесплатно).

Возможность экспорта/импорта настроек сайтов с помощью датафайлов

Данная функция полностью аналогична уже полюбившейся многими нашими пользователями возможности экспорта/импорта параметров, которая есть в настройках источников и настройках категорий источников. sites_export_import

Исправлены недочёты и недоработки прошлых версий

FDE Grabber 7.1 — работа с разных IPv4 адресов, читать далее...

Новая версия граббера новостей FDE Grabber 7.0

Дорогие друзья, извещаем о том, что доступна для покупки, скачивания и обновления новая версия парсера контента FDE Grabber 7.0 Новый функционал и изменения:

Добавлена возможность работы со списком юзер-агентов (User Agent), от имени которых парсер новостей обращается к сайтам-источникам .

Для этого в системе создан новый раздел Юзер-агенты: user_agents_moduleВ данном модуле можно добавлять/редактировать/удалять юзер-агенты, а также изменить их статус. Кроме того, в новом модуле доступны функции массового изменения активности и добавления списка юзер-агентов, разделённых через перенос строки.

В разделе «Фейковых пользователей» добавлена возможность импорта списка имён пользователей, разделённых, через перенос строки:

mass_users_additionЕсли, например, требуется добавить сразу несколько новых пользователей, то достаточно указать их имена, через перенос строки:

mass_users_addition_2При редактировании категории источников граббера добавлено указание имени юзер-агента, с которым граббер будет обращаться к сайту-источнику:

user_agentЕсли поле оставить пустым, то парсер случайно выберет один из активных юзер-агентов из раздела «Юзер-агенты» и будет работать от данного имени.

Оптимизирован функционал, увеличена скорость работы, исправлены недочёты и недоработки прошлых версий.

Новая версия граббера новостей FDE Grabber 7.0, читать далее...

Вышла новая версия граббера - FDE Grabber 6.9

Дорогие друзья, сообщаем о том, что доступна для покупки и обновления новая версия граббера новостей FDE Grabber 6.9 В новой версии добавлена возможность обновления тех статей, которые уже были опубликованы. Так, если например некоторая статья была получена и опубликована, то можно настроить систему импорта новостей так, чтобы проверялось не обновилась ли данная статья на сайте-источнике и если обновилась, то заново её получать и обновлять. Для этого, в настройках категории граббера добавлены две дополнительные опции:

  • Обновлять статьи при обновлении источников
Следует учесть, что во втором случае будут делаться дополнительные запросы - граббер будет парсить заново уже полученные статьи, и проверять не обновилось ли их полное содержимое. Рассмотрим более подробно эти опции.

Проверка обновления статей при обновлении источников

source_updatesЕсли при обновлении источника, для статьи, которая была уже опубликована, изменился заголовок или краткое содержание, то статья будет считаться изменившейся и парсер попытается её заново получить и обновить на вашем сайте. В случае успешного парсинга он её заново опубликует, но при этом не будет создавать новую запись, а обновит старую. Все сопутствующие файлы и картинки также обновятся.

Дополнительная проверка обновления статей на изменение полного содержания

full_content_updateЕсли в текущий момент нет заданий на получение новых статей, то система импорта новостей перейдёт в режим обновления старых (если это требуется). В настройках категории источников указываются дополнительные данные: «Период обновления, в часах» — это промежуток времени, на протяжении которого, с момента после публикации, статья будет проверяться граббером на обновление; «» — это промежуток времени, через который парсер новостей будет проверять, не обновилась ли данная статья. В данный момент обновление статей работает для следующих типов публикации: DLE (Data Life Engine), NGCMS, WordPress (кроме публикации через протокол XML-RPC), Joomla, а также публикация в компонент K2, E107, Drupal, Danneo, Slaed, InstantCMS, FDE CMS Кроме того, исправлены мелкие недочёты и недоработки прошлых версий.

Вышла новая версия граббера - FDE Grabber 6.9, читать далее...

FDE Grabber 6.8 — увеличение скорости работы, модуль сброса пароля

Дорогие друзья, с радостью извещаем о том, что доступна для покупки, скачивания и обновления новая версия граббера новостей FDE Grabber 6.8 Мы проделали большую работу по оптимизации работы системы, и с большой гордостью рады представить новую версию, со значительно увеличенной скоростью работы и сниженной создаваемой нагрузкой на сервер, на котором расположена основная часть граббера. В среднем, на небольших объёмах контента прирост в скорости составляет 1.5-2 раза, на больших — от 2 до 3 раз. Добавлена возможность сброса забытого пароля: account_recoveryПроцесс сброса пароля состоит из двух частей:
  • заполнение формы с указанием логина или адреса электронной почты, отправка письма на связанный с аккаунтом e-mail адрес для подтверждения операции;
  • переход по ссылке, пришедшей в письме на связанный с аккаунтом e-mail адрес и, непосредственно, сам сброс пароля;
Для повышения безопасности и исключения возможности брутфорса логина и/или пароля, добавлена возможность логина в админцентр системы импорта новостей, с использованием каптчи (визуального кода). Для активации или отключения каптчи при логине следует зайти в настройки граббера, во вкладку «Основные настройки» и отметить или снять галочку «Использовать каптчу при логине«: use_captcha_1 При включённом режиме отображения каптчи при логине страница авторизации выглядит следующим образом: use_captcha_2Исправлены недочёты и недоработки прошлых версий.

FDE Grabber 6.8 — увеличение скорости работы, модуль сброса пароля, читать далее...

Новая версия граббера новостей FDE Grabber 6.7

Дорогие друзья, с радостью сообщаем о том, что доступна для покупки, обновления и скачивания новая версия граббера сайтов FDE Grabber 6.7 Новые возможности: В настройках системы импорта новостей (настройки->вкладка «граббинг») добавлена галочка Мягкое обновление источников. При её активации, граббер будет пытаться, по возможности, обращаться к источникам, так, чтобы предотвратить последовательное (подряд) получение данных от одного и того же хоста сайта-источника. Данная опция по умолчанию активирована и рекомендуется к дальнейшему применению: softy_feeds_recievingКроме того, в настройках граббера, добавлена опция Получать следующий источник только после окончания обхода пейджера у предыдущего. При её активации, если в парсере, например, имеется источник, в котором включен обход пейджера (или обход по параметру), то он будут обновляться и получаться до тех пор, пока не будет полностью завершён обход пейджера, и только после этого система перейдёт к обновлению следующего источника. В случае, если данную опцию, наоборот, отключить, то парсер будет обновлять источники по очереди, и обновление следующего источника произойдёт не по завершению обхода пейджера предыдущего источника, а лишь при завершении единичной итерации обхода: hard_paginationДобавлен функционал, позволяющий вести блокировку кронтабов граббера, для защиты от одновременного запуска, с помощью lock-файлов. Активировать использование блокировочных lock-файлов можно в настройках граббера новостей (настройки->вкладка «граббинг»), с помощью галочки: «Использовать блокировочные lock-файлы«. В дальнейшем, рекомендуется использовать данный функционал: crontab_lock_filesВ настройках категорий источников добавлена новая опция: ««. При её активации парсер новостей будет пытаться перед получением контента устранять ошибки, допущенные редактором сайта-источника: correct_tagsПри выводе списка полученных граббером статей добавлено выделение цветом (по бокам, аналогично тому, как это сделано при просмотре списков категорий  и источников граббера), соответствующее связанным категориям: colorizeИсправлены недочёты и недоработки прошлых версий.

Новая версия граббера новостей FDE Grabber 6.7, читать далее...

FDE Grabber 6.6 - новая версия граббера новостей

Дорогие друзья, извещаем о том, что уже доступна для скачивания, покупки или обновлений новая версия граббера новостей FDE Grabber 6.6 Среди изменений и дополнений можно выделить следующие:

Возможность указывать текстовые замены, а также замены с помощью регулярных выражений так, чтобы они применялись рекурсивно, до тех пор, пока будут находиться соответствия

Теперь в парсере новостей можно использовать замены регулярными выражениями и текстовые замены рекурсивно, например если необходимо изменить содержимое статьи или новости так, чтобы все картинки были изъяты из таблиц и вынесены из них, то можно использовать несложную замену, которая будет применена к тексту рекурсивно: #(<table[^<>]*>.*?)(<img[^<>]*>)(.*?</table>)#is  на \2\1\3 Ранее так можно было сделать лишь с помощью специального написанного для этого хака или указав это же выражение несколько раз (так, чтобы перекрыть все замены).

recursive_preg_replaceВозможность в обычных заменах, а также заменах с помощью регулярных выражений игнорировать пробелы и пробельные символы

Теперь не обязательно заботиться о том, чтобы в ваших заменах были указаны пробелы  и переносы строк точно также, как и в исходном тексте — теперь достаточно отметить галочку «не учитывать пробельные символы«:

space_ignoreВозможность выделения категорий источников и источников цветом

Для этого, в настройках категорий источников добавлена настройка ««: colorize Если выделения цветом указаны, то списки категорий и источников могут выглядеть так: colorize2

Возможность группировки списков источников по категориям

Теперь при выводе списков источников, для удобства восприятия, можно перегруппировать записи по категориям источников group_by_сategories

Исправлены ошибки и недочёты прошлых версий

FDE Grabber 6.6 - новая версия граббера новостей, читать далее...

Разделы сайта

Форум web-разработчиков