Для правильной настройки процессов Агента, важно понимать, как ИИ-Процессы Нейро42 работают с HTML, XML, датами, интервалами и бинарными файлами
Реальные бизнес-процессы редко ограничиваются только JSON-объектами. Вам придется обрабатывать HTML-разметку, XML документы, даты в десятках форматов, а иногда — файлы, изображения или PDF.
ИИ-Агенты Нейро42 и нативные узлы платформы позволяют работать с любыми типами данных, но требуют понимания базовых принципов.
Работа с HTML и XML
Что такое HTML и XML и зачем они встречаются в процессах?
HTML — язык разметки веб-страниц.
XML — формат структурированных данных, часто используемый в корпоративных сервисах, старых API, платежных шлюзах, ERP.
В ваших сценариях эти форматы встречаются, когда:
- вы парсите веб-страницы для мониторинга цен или новостей;
- интегрируетесь со старыми CRM/ERP;
- работаете с каталогами товаров, RSS, FEED, SOAP API.
HTML-узел: извлечение данных через CSS-селекторы
В Нейро42 HTML-узел позволяет брать структурированную информацию из HTML, используя CSS-селекторы — те же, что применяются в веб-разработке.
Идеально подходит для:
- веб-скрейпинга;
- мониторинга изменений на сайтах;
- извлечения элементов страницы (цены, заголовки, кнопки, рейтинги).
XML-узел: преобразование JSON — XML
Многие API возвращают данные в XML. Другие — принимают данные только в XML.
В Нейро42 XML-узел решает обе задачи:
- превращает XML в JSON для удобной обработки;
- собирает JSON обратно в XML перед отправкой.
Работа с датами, временем и интервалами
Даты — один из самых сложных типов данных. Они могут быть представлены в десятках форматов:
- 2025-11-30
- 30/11/2025
- November 30, 2025
- Unix timestamp: 1764514218
- 2025/11/30 08:30:00
ИИ-Агенты Нейро42 автоматически интерпретируют часть форматов, но при сложных задачах полезен Date & Time узел.
Что можно делать с Date & Time:
- конвертировать формат даты;
- добавлять/вычитать дни, месяцы, годы;
- округлять дату (до начала дня, к концу месяца, до ближайшего часа);
- сравнивать даты;
- вычислять интервалы;
- преобразовывать текст в timestamp и обратно.
Паузы, задержки и расписания
Иногда интеграции работают не мгновенно:
- CRM обновляет статус 15 секунд;
- API присылает данные партиями;
- внешняя система может быть недоступна.
Чтобы избежать ошибок, используйте:
Wait-узел, который останавливает выполнение до:
- фиксированного времени;
- времени/интервала (1 час, 5 минут);
- вебхук-события.
или Schedule Trigger, который запускает процесс:
- раз в N минут;
- раз в день;
- по cron-правилам;
- по часовой зоне (важно для глобальных команд).
Работа с бинарными файлами
До этого мы работали с текстом. Теперь — с файлами:
- изображения;
- PDF;
- документы;
- архивы;
- любые данные в бинарном формате.
В Нейро42 бинарные данные передаются через объект:
- Узлы для работы с файлами
- HTTP Request — получение/отправка файлов через API.
- Read / Write Files — доступно на self-hosted, т.е. используется для локальной обработки данных и обеспечивает чтение файлов по пути и запись файлов с диска.
- Convert to File — преобразует текст или JSON в файл.
- Extract From File — извлекает данные из PDF, изображений или других форматов.
Обратите внимание, что пути к файлам зависят от способа установки:
Способ запуска
- npm — ~/my_file.json
- Docker / облако — /tmp/my_file.json
- В контейнере путь относится к файловой системе контейнера, а не вашей хост-машины.