Обработка разных типов данных

Для правильной настройки процессов Агента, важно понимать, как ИИ-Процессы Нейро42 работают с HTML, XML, датами, интервалами и бинарными файлами

Реальные бизнес-процессы редко ограничиваются только JSON-объектами. Вам придется обрабатывать HTML-разметку, XML документы, даты в десятках форматов, а иногда — файлы, изображения или PDF.

ИИ-Агенты Нейро42 и нативные узлы платформы позволяют работать с любыми типами данных, но требуют понимания базовых принципов.

Работа с HTML и XML

Что такое HTML и XML и зачем они встречаются в процессах?

HTML — язык разметки веб-страниц.

XML — формат структурированных данных, часто используемый в корпоративных сервисах, старых API, платежных шлюзах, ERP.

В ваших сценариях эти форматы встречаются, когда:

  • вы парсите веб-страницы для мониторинга цен или новостей;
  • интегрируетесь со старыми CRM/ERP;
  • работаете с каталогами товаров, RSS, FEED, SOAP API.

 

HTML-узел: извлечение данных через CSS-селекторы

В Нейро42 HTML-узел позволяет брать структурированную информацию из HTML, используя CSS-селекторы — те же, что применяются в веб-разработке.

Идеально подходит для:

  • веб-скрейпинга;
  • мониторинга изменений на сайтах;
  • извлечения элементов страницы (цены, заголовки, кнопки, рейтинги).

 

XML-узел: преобразование JSON XML

Многие API возвращают данные в XML. Другие — принимают данные только в XML.

В Нейро42 XML-узел решает обе задачи:

  • превращает XML в JSON для удобной обработки;
  • собирает JSON обратно в XML перед отправкой.

 

Работа с датами, временем и интервалами

Даты — один из самых сложных типов данных. Они могут быть представлены в десятках форматов:

  • 2025-11-30
  • 30/11/2025
  • November 30, 2025
  • Unix timestamp: 1764514218
  • 2025/11/30 08:30:00

ИИ-Агенты Нейро42 автоматически интерпретируют часть форматов, но при сложных задачах полезен Date & Time узел.

Что можно делать с Date & Time:

  • конвертировать формат даты;
  • добавлять/вычитать дни, месяцы, годы;
  • округлять дату (до начала дня, к концу месяца, до ближайшего часа);
  • сравнивать даты;
  • вычислять интервалы;
  • преобразовывать текст в timestamp и обратно.

Паузы, задержки и расписания

Иногда интеграции работают не мгновенно:

  • CRM обновляет статус 15 секунд;
  • API присылает данные партиями;
  • внешняя система может быть недоступна.

Чтобы избежать ошибок, используйте:

Wait-узел, который останавливает выполнение до:

  • фиксированного времени;
  • времени/интервала (1 час, 5 минут);
  • вебхук-события.

или Schedule Trigger, который запускает процесс:

  • раз в N минут;
  • раз в день;
  • по cron-правилам;
  • по часовой зоне (важно для глобальных команд).

 

Работа с бинарными файлами

До этого мы работали с текстом. Теперь — с файлами:

  • изображения;
  • PDF;
  • документы;
  • архивы;
  • любые данные в бинарном формате.

В Нейро42 бинарные данные передаются через объект:

  • Узлы для работы с файлами
  • HTTP Request — получение/отправка файлов через API.
  • Read / Write Files — доступно на self-hosted, т.е. используется для локальной обработки данных и обеспечивает чтение файлов по пути и запись файлов с диска.
  • Convert to File — преобразует текст или JSON в файл.
  • Extract From File — извлекает данные из PDF, изображений или других форматов.

 

Обратите внимание, что пути к файлам зависят от способа установки:

Способ запуска

  • npm — ~/my_file.json
  • Docker / облако — /tmp/my_file.json
  • В контейнере путь относится к файловой системе контейнера, а не вашей хост-машины.

Предупреждение о применении иностранного языка

Настоящий мануал включает иностранные термины и выражения, оставленные в оригинале ввиду специфики предметной области и сложности однозначного перевода на русский язык. Данные элементы используются исключительно в целях повышения точности и ясности изложенного материала, поскольку точные аналоги на русском языке либо отсутствуют, либо существенно усложняют восприятие информации пользователями-профессионалами.

Техническая документация не является информацией для широкого круга потребителей. Документация предназначена исключительно для специализированных целей и рассчитана на аудиторию профессионалов, обладающих соответствующей квалификацией и знанием отраслевых стандартов и терминологии. Использование иностранной лексики согласуется с положениями действующего российского законодательства, регулирующего употребление иностранных слов в специальных материалах, направленных на профессиональных пользователей

Данная мера принята для минимизации рисков неправильного толкования ключевых понятий и предотвращения негативных последствий, связанных с некорректностью переводов сложных технических терминов и выражений.

Мы обращаем внимание на тот факт, что наличие иностранного языка в данной документации обусловлено профессиональной необходимостью и соответствует установленным нормам и правилам использования специализированной литературы и документации в Российской Федерации.

Свяжитесь с нами

* нажимая на кнопку, Вы даете согласие на обработку персональных данных