Документация
Всё, что нужно знать, чтобы начать собирать данные с любого сайта
Быстрый старт
Чтобы настроить сбор данных, понадобится всего 4 шага. Весь процесс занимает пару минут и не требует написания кода.
Шаг 1. Укажите сайт
Вставьте ссылку на каталог или любую страницу со списком интересующих объектов — товаров, вакансий, объявлений, статей. Extracto автоматически определит тип источника.
Шаг 2. Выберите категории
ИИ проанализирует структуру сайта и покажет доступные категории. Отметьте нужные или выберите «Собираем все», чтобы обработать всё сразу.
Шаг 3. Добавьте пример товара
Откройте один из объектов и скопируйте его URL. Это позволит парсеру понять, какие поля есть на странице-образце и как их извлекать.
Шаг 4. Настройте поля
Укажите, какие поля собирать: название, цену, рейтинг, описание, характеристики. Extracto заполнит первый пример автоматически, а вы можете добавить или убрать нужные поля.
Форматы экспорта
Готовые данные можно скачать в любом удобном виде:
- CSV — для Excel, Google Sheets, Airtable
- JSON — для API-интеграций и разработчиков
- XLSX — готовая таблица с форматированием
Сложность сайтов
Стоимость рассчитывается исходя из сложности парсинга. Мы делим сайты на три категории:
Простой сайт
- Статические страницы без JavaScript
- До 1 000 страниц
- Без авторизации
- Стандартная структура данных
Средний сайт
- JS-рендеринг (React, Vue, Angular)
- До 10 000 страниц
- Пагинация или бесконечная прокрутка
- Вложенная структура данных
Сложный сайт
- Авторизация, личный кабинет
- Защита от парсинга (Cloudflare, капча)
- Динамические AJAX-запросы
- Нестандартная структура
Ограничения
Мы не извлекаем данные с сайтов, где это запрещено их robots.txt или условиями использования. Также мы не собираем персональные данные третьих лиц без правовых оснований. Подробности — в Условиях использования.
Нужна помощь?
Если что-то непонятно или ваш случай нестандартный — напишите нам, и мы поможем настроить сбор под вашу задачу.
- Telegram: @extracto_support
- Email: hello@extracto.app
- Личные консультации: sales@extracto.app