Read txt from n8n

Чтение текстовых файлов в n8n: полное руководство

n8n — это инструмент автоматизации рабочих процессов с открытым исходным кодом, который позволяет интегрировать различные приложения и сервисы. Одной из фундаментальных задач в автоматизации является работа с данными, хранящимися в текстовых файлах (формат .txt). Чтение таких файлов в n8n является первым шагом для их последующей обработки, анализа или интеграции содержимого в другие системы. В отличие от специализированных форматов, текстовые файлы представляют собой неструктурированные или полуструктурированные данные, и n8n предоставляет несколько методов для их извлечения, каждый из которых подходит для разных сценариев.

Методы чтения текстовых файлов в n8n

Существует три основных подхода к чтению .txt файлов в n8n: использование встроенных узлов (нод), работа через триггеры (триггер-ноды) и чтение файлов из внешних источников. Выбор метода зависит от места хранения файла и требуемой логики workflow.

1. Использование узла «Read Binary Files»

Это основной и наиболее гибкий узел для чтения любых файлов, включая текстовые, из локальной файловой системы сервера, на котором запущен n8n. Он возвращает данные в бинарном формате (binary data), которые затем необходимо преобразовать в текст.

Типичные шаги в workflow:

Добавление узла «Read Binary Files» в canvas.
Настройка параметров узла: указание пути к файлу (File Path) относительно директории n8n. Например, /data/my_file.txt.
Выбор опции «Read Files From» -> «Local File».
Подключение после него узла «Convert to Text». Этот узел преобразует бинарные данные в строку, доступную для последующей обработки.
Дальнейший парсинг или манипуляция с текстом с помощью узлов «Code» (JavaScript/Python) или «Split Out».

Важно: По умолчанию n8n имеет ограниченный доступ к файловой системе. Путь к файлу должен находиться в разрешенных директориях, которые настраиваются в конфигурационном файле n8n (N8N_BINARY_DATA_PATH).

2. Использование триггерных узлов для чтения файлов

Этот метод используется для автоматического запуска workflow при появлении нового или изменении существующего текстового файла в определенной директории.

Основные триггерные узлы:

Local File Trigger: Сканирует указанную локальную папку с заданным интервалом. При обнаружении нового файла (например, .txt) запускает workflow и передает в него информацию о файле. Для чтения содержимого все равно потребуется связка узлов «Read Binary Files» -> «Convert to Text».
SFTP Trigger: Выполняет аналогичную функцию для файлов на удаленном SFTP-сервере.

Этот подход идеален для обработки файлов, которые регулярно поступают в определенную папку (например, логи, дампы данных, отчеты).

3. Чтение файлов из внешних источников

Текстовые файлы часто хранятся не локально, а в облачных хранилищах или передаются через API. n8n поддерживает множество узлов для интеграции с такими сервисами.

Последовательность действий:

Использование узла для загрузки файла из внешнего источника (например, «Google Drive», «OneDrive», «Dropbox», «S3», «HTTP Request»).
Эти узлы, как правило, возвращают бинарные данные файла или ссылку на него.
Если возвращаются бинарные данные, далее используется узел «Convert to Text». Если возвращается ссылка, может потребоваться узел «HTTP Request» для загрузки и последующее преобразование.

Обработка и парсинг содержимого текстового файла

После получения текстовой строки из файла часто требуется ее структурировать. Текстовые файлы могут иметь различную организацию данных.

Формат содержимого	Метод обработки в n8n	Описание
Простой текст (сплошной)	Узлы «Code», «Split Out», «Text Extract»	Поиск ключевых слов, извлечение фрагментов с помощью регулярных выражений (в узле «Code»).
Строки (каждая строка — отдельная запись)	Узел «Split Out»	Разделение текста по разделителю `n` (новая строка). Создает отдельные элементы для каждой строки файла.
CSV-подобная структура (таблица)	Узел «Convert to JSON» -> «CSV to JSON»	После преобразования файла в текст, если текст представляет собой CSV, можно использовать специализированный парсер для преобразования в JSON.
Логи с фиксированным форматом	Узел «Code» (JavaScript)	Написание кастомного скрипта для парсинга каждой строки лога по известному шаблону.

Пример workflow: Обработка лог-файла и отправка алерта

Рассмотрим практический пример. Workflow считывает новый лог-файл, находит в нем строки с ошибками уровня «ERROR», и отправляет уведомление в Telegram.

Узел «Local File Trigger»: Настроен на папку /logs. Триггер срабатывает при появлении файла app_*.log.
Узел «Read Binary Files»: Читает файл, путь к которому передан из предыдущего узла (например, {{ $json["file"]["path"] }}).
Узел «Convert to Text»: Преобразует бинарные данные лога в строку.
Узел «Split Out»: Разделяет текст на отдельные строки (разделитель — n). Теперь каждая строка лога — отдельный элемент.

Узел «Code» (JavaScript): Фильтрует строки, оставляя только содержащие «ERROR».

const items = $input.all();
const result = [];
for (const item of items) {
  if (item.json.text && item.json.text.includes("ERROR")) {
    result.push(item);
  }
}
return result;

Узел «Telegram»: Отправляет сообщение в канал или чат. Текст сообщения формируется как список найденных ошибок: {{ "Обнаружены ошибки:n" + $json["text"] }}.

Кодировка текстовых файлов

Проблемы с кодировкой (кракозябры вместо текста) — частый вызов. Узел «Convert to Text» имеет параметр «Encoding», который по умолчанию установлен в utf8. Для файлов в кодировке Windows-1251 (CP1251) или других необходимо явно указать соответствующую кодировку. Если кодировка неизвестна, может потребоваться экспериментирование или использование в узле «Code» библиотек типа iconv-lite.

Безопасность и лучшие практики

Валидация путей: Не используйте пользовательский ввод для формирования пути к файлу без строгой проверки для предотвращения Path Traversal атак.
Ограничение прав доступа: Настройте переменные окружения n8n (N8N_BINARY_DATA_PATH, EXECUTIONS_DATA_PRUNE) для ограничения областей файловой системы, доступных для чтения/записи.
Обработка больших файлов: Чтение очень больших текстовых файлов (гигабайты) может привести к исчерпанию памяти. Рассмотрите потоковую обработку с помощью кастомного скрипта или разделение файла на части.
Использование Credentials: При доступе к облачным хранилищам всегда используйте встроенную систему учетных данных n8n, не храните пароли и ключи в открытом виде в workflow.

Интеграция с ИИ и расширенная обработка

После извлечения текста его можно использовать как входные данные для узлов ИИ, таких как «OpenAI», «Hugging Face», «Vector Knowledge Base». Например:

Суммаризация объемных логов или отчетов с помощью GPT.
Извлечение именованных сущностей (компании, даты, суммы) из неструктурированного текста.
Классификация содержимого текстовых файлов по категориям.
Индексация текста в векторную базу данных для семантического поиска.

Ответы на часто задаваемые вопросы (FAQ)

Почему узел «Read Binary Files» не видит мой файл?

Наиболее вероятные причины: 1) Файл находится вне директорий, разрешенных для n8n (проверьте настройки N8N_BINARY_DATA_PATH). 2) Неверно указан путь. Используйте абсолютный путь или путь относительно корневой директории n8n. 3) У процесса n8n нет прав на чтение данного файла или директории.

Как читать очень большие текстовые файлы, не загружая их полностью в память?

Встроенные узлы n8n загружают файл целиком. Для обработки больших файлов необходимо использовать кастомный код в узле «Code» (выполняемый в отдельном процессе) с потоковым чтением (streams) или разбивать файл на части внешними средствами до обработки в n8n.

Можно ли читать файлы напрямую с компьютера пользователя через веб-интерфейс n8n?

Нет, напрямую нельзя. n8n работает на сервере и имеет доступ только к своей файловой системе. Чтобы загрузить файл с компьютера пользователя, его необходимо сначала передать на сервер через какой-либо протокол (например, загрузить через веб-форму на сопутствующем веб-сервере или использовать клиент типа S3/SFTP как промежуточное звено).

Чем отличается «Read Binary Files» от «Local File Trigger»?

«Local File Trigger» — это триггер, который инициирует выполнение workflow при событии с файлом. Он только сообщает о файле (имя, путь), но не читает его содержимое. «Read Binary Files» — это узел действия, который непосредственно считывает содержимое указанного файла в бинарном виде. Они часто используются вместе.

Как обработать текстовый файл, где данные разделены запятыми (CSV)?

После получения текста через «Read Binary Files» -> «Convert to Text», используйте узел «Convert to JSON». В нем выберите операцию «CSV to JSON». Настройте разделитель (delimiter), обычно это запятая, и укажите, содержит ли первая строка файла заголовки столбцов.

Как изменить кодировку читаемого файла?

В узле «Convert to Text» есть поле «Encoding». По умолчанию стоит utf8. Вы можете изменить его на нужную, например, win1251, iso-8859-1, cp866. Полный список поддерживаемых кодировок зависит от среды выполнения n8n (Node.js).

Можно ли читать файлы из сети (по URL) без предварительной загрузки в хранилище?

Да, для этого используйте узел «HTTP Request». Настройте его метод на «GET» и укажите URL файла. Если файл текстовый, ответ (тело) будет содержать его содержимое в виде строки. Для бинарных файлов может потребоваться дополнительная обработка.