Каталог процессоров
Процессоры — это строительные блоки воронок в aiWarmUp. Каждый процессор выполняет одну задачу: поиск, обогащение, фильтрацию или интеграцию данных. Процессоры соединяются в цепочки, передавая данные от одного к другому через систему DataPackets.
Источники данных
Заголовок раздела «Источники данных»Процессоры-источники стоят в начале воронки и создают первичные данные для обработки. Они могут работать самостоятельно, без входных данных от других процессоров.
| Процессор | Код | Описание | Стоимость |
|---|---|---|---|
| File Upload | file-upload | Загрузка данных из CSV/Excel-файлов. Каждая строка файла становится отдельным DataPacket | Бесплатно |
| Yandex Search | yandex-search | Поиск компаний и сайтов через Яндекс по ключевым словам | Токены за запрос |
| HH Search | hh-search | Поиск вакансий и работодателей на HeadHunter. Мониторинг кадровой активности компаний | Бесплатно |
| Telegram Search | tg-search | Поиск сообщений в Telegram-каналах через TGStat API. Мониторинг упоминаний и трендов | Токены за запрос |
| EGRUL Search | egrul-search | Поиск компаний в ЕГРЮЛ по фильтрам: регион, ОКВЭД, статус, дата регистрации | Токены за запрос |
Обогащение данных о компаниях
Заголовок раздела «Обогащение данных о компаниях»Процессоры обогащения принимают данные от предыдущих процессоров и добавляют к ним дополнительную информацию из различных источников.
| Процессор | Код | Описание | Стоимость |
|---|---|---|---|
| Registry Search | registry-search | Поиск данных в государственных реестрах: финансы, руководство, виды деятельности, правовой статус | Токены за запрос |
| INN Search | inn-search | Поиск ИНН компании по названию или получение данных по ИНН из нескольких источников | Токены за запрос |
| Company Info V2 | company-info-v2 | Расширенная информация о компании: финансовые показатели, лицензии, госконтракты, проверки | Токены за запрос |
| Contact Search | contact-search | Поиск контактов ЛПР: email, телефоны, должности, профили в соцсетях | Токены за контакт |
Контент и аналитика
Заголовок раздела «Контент и аналитика»Процессоры для работы с контентом, веб-страницами и ИИ-анализом данных.
| Процессор | Код | Описание | Стоимость |
|---|---|---|---|
| Site Crawl | site-crawl | Краулинг веб-страниц с извлечением данных через ИИ или поиск в HTML-коде | Токены за страницу + GPT |
| AI Search | ai-search | ИИ-поиск информации в интернете с интерпретацией результатов | Токены за запрос |
| GPT Filter | gpt-filter | Фильтрация и классификация данных с помощью ИИ. Оценка релевантности по заданным критериям | Токены за обработку |
CRM-интеграция
Заголовок раздела «CRM-интеграция»Процессоры для двустороннего обмена данными с CRM-системой Bitrix24.
| Процессор | Код | Описание | Стоимость |
|---|---|---|---|
| CRM Search | crm-search | Поиск лидов, сделок, компаний и контактов в Bitrix24. Проверка дубликатов, получение связанных сущностей | Бесплатно |
| CRM Update | crm-update | Создание и обновление записей в Bitrix24: компании, контакты, лиды, сделки, реквизиты. Рекурсивная обработка связей | Бесплатно |
Типовые цепочки процессоров
Заголовок раздела «Типовые цепочки процессоров»Поиск и обогащение компаний из реестров
Заголовок раздела «Поиск и обогащение компаний из реестров»EGRUL Search --> Registry Search --> Company Info V2 --> Contact Search --> CRM UpdateНаходит компании по критериям в ЕГРЮЛ, обогащает данными из реестров, получает расширенную информацию и контакты ЛПР, затем передает все в CRM.
Обработка собственной базы
Заголовок раздела «Обработка собственной базы»File Upload --> INN Search --> Registry Search --> Contact Search --> GPT Filter --> CRM UpdateЗагружает список компаний из файла, находит ИНН по названиям, обогащает реестровыми данными, ищет контакты, фильтрует через ИИ и передает в CRM.
Мониторинг рынка труда
Заголовок раздела «Мониторинг рынка труда»HH Search --> GPT Filter --> Registry Search --> CRM UpdateМониторит вакансии, фильтрует работодателей по критериям через ИИ, обогащает данными из реестров и создает лиды в CRM.
Парсинг сайтов из поисковой выдачи
Заголовок раздела «Парсинг сайтов из поисковой выдачи»Yandex Search --> Site Crawl --> GPT Filter --> CRM UpdateИщет сайты по ключевым словам, извлекает контактные данные и описания, фильтрует релевантные результаты и передает в CRM.
Мониторинг Telegram-каналов
Заголовок раздела «Мониторинг Telegram-каналов»Telegram Search --> GPT Filter --> AI Search --> CRM UpdateНаходит релевантные посты в Telegram, фильтрует через ИИ, ищет дополнительную информацию о компаниях и создает лиды.
Проверка перед обновлением CRM
Заголовок раздела «Проверка перед обновлением CRM»File Upload --> CRM Search --> GPT Filter --> CRM UpdateЗагружает данные из файла, проверяет наличие в CRM, фильтрует по условиям и обновляет или создает записи.
Общие принципы работы с процессорами
Заголовок раздела «Общие принципы работы с процессорами»DataPackets
Заголовок раздела «DataPackets»Все процессоры обмениваются данными через DataPackets — структурированные единицы информации. Каждый DataPacket содержит payload (основные данные) и metadata (служебная информация). Один процессор может создать несколько выходных DataPackets из одного входного.
Переменные и цепочка данных
Заголовок раздела «Переменные и цепочка данных»Процессоры поддерживают переменные вида {{processorName.field}} для обращения к данным из предыдущих процессоров в цепочке. Переменные разрешаются автоматически на основе связей между процессорами и данных DataPackets.
Фильтрация входных данных
Заголовок раздела «Фильтрация входных данных»Большинство процессоров поддерживают фильтрацию входных пакетов перед обработкой. Фильтры задаются через SQL-подобные условия и применяются на уровне базы данных для максимальной производительности.
Обработка ошибок
Заголовок раздела «Обработка ошибок»Процессоры классифицируют ошибки на два типа:
- Критические — останавливают выполнение всего процессора (ошибки авторизации, недоступность API)
- Восстановимые — создают error-пакет для конкретной записи, процессор продолжает работу с остальными данными
Токены и стоимость
Заголовок раздела «Токены и стоимость»Операции с внешними API расходуют токены платформы. Стоимость каждой операции указана в документации процессора и отображается в логах выполнения. Бесплатные процессоры (File Upload, HH Search, CRM Search, CRM Update) не расходуют токены.