Spinn3r
Spinn3r — это сервис, который позволяет парсить данные из блогов, новостных лент, новостных каналов RSS и Atom, социальных сетей
Spinn3r предоставляет API для социальных сетей, блогов, новостей, видео и веб-контента в реальном времени для клиентов на любом языке и в больших объемах.
Особенности Spinn3r
- Spinn3r имеет «обновляемый» API, который делает 95 процентов работы по индексации. Это предполагает усовершенствованную защиту от спама и повышенный уровень безопасности данных.
- Spinn3r индексирует контент, как Google, и сохраняет извлеченные данные в файлах формата JSON.
- Инструмент постоянно сканирует сеть и находит обновления нужной информации из множества источников, пользователь всегда имеет обновляемую в реальном времени информацию.
- Консоль администрирования позволяет управлять процессом исследования; имеется полнотекстовый поиск.
- API полнотекстового поиска основан на Elasticsearch и предоставляет расширенные возможности поиска поверх высококачественного индекса контента.
- API позволяет искать произвольные текстовые строки, выполнять поиск со сложной логической логикой, использовать фильтры и другие расширенные функции, такие как агрегаты. Результаты затем возвращаются как обычные документы JSON.
- Classifier API позволяет разработчикам отправлять текст (или URL-адреса) и предоставлять метки для этого контента на основе нашей платформы машинного обучения. Например, если вы отправите новую историю о президентских выборах в США, вы получите обратно ярлыки для кандидатов или других тем, представляющих эту статью.
- Parser API обеспечивает разбор и обработку метаданных произвольных URL-адресов в Интернете. Кроме того, мы выполняем увеличение данных метаданных, включая определение пола, определение настроения и т. Д.
- Firehose API разработан для массового доступа к огромным объемам контента. На заказ 200-500Гб в сутки.
- Spinn3r использует простые HTTP-заголовки для аутентификации во всех наших APIS.
Аналоги и альтернативы для Spinn3r
Spinn3r - похожие продукты (инструменты, решения, сервисы)
ParseHub
ParseHub — это инструмент для парсинга сайтов и Интернет- магазинов, который предназначен...
Visual Scraper
VisualScraper – это ПО для парсинга больших объемов информации из сети
80legs
80legs – это веб-инструмент парсинга сайтов, который можно очень точно подстроить под...
Scraper
Scraper – это расширение для Chrome с ограниченными функциями парсинга данных
OutWit Hub
OutwitHub — это универсальный парсер данных, встроенный в веб-браузер для всех задач
Netpeak Spider
Десктопный инструмент для регулярного SEO-аудита, быстрого поиска ошибок, системного анализа и парсинга...
Comparser
Программа для изучения индексации сайта
Xenu’s Link Sleuth
Xenu или Xenu's Link Sleuth - это компьютерная программа, которая проверяет веб-сайты...
Idatica
Idatica — сервис, который позволяет парсить сайты, собирать, анализировать и очищать данные
DataOx
DataOx - это сервис для парсинга данных
Puppeteer
Высокоуровневый API для запуска, контроля и управления браузером — Chromium через NodeJS
Octoparse
Octoparse — это сервис для извлечения веб-данных
Apify
Apify - это универсальный магазин для всех ваших потребностей в очистке веб-страниц,...
Web Scraper
Web Scraper - это сервис для парсинга
Import.io
Import.io – онлайн-сервис для импорта данных с веб-страниц
Data Miner
Data Miner - это инструмент для парсинга веб-сайтов для профессиональных майнеров данных
Webhose.io
Webhose.io - это программное обеспечение для обработки данных, которое позволяет пользователям проводить...
Dexi.io
Dexi.io (ранее CloudScrape) - то инструмент для веб-обработки данных для профессионалов
Scrapinghub
Scrapinghub – это облачный инструмент парсинга данных, который помогает выбирать и собирать...
Блог, обзоры, новости
Парсинг сайтов — подборка
Инструменты web scraping (парсинг) разработаны для извлечения, сбора любой открытой информации с...
Отзывы
Отзывов пока нет.