Нейросети в истории алхимии: анализ текстов на предмет скрытых химических знаний
Алхимические тексты, созданные в период с античности до XVII-XVIII веков, представляют собой сложный и многогранный объект для историко-научного исследования. Их содержание включает философские рассуждения, мистические символы, практические лабораторные рецепты и описания веществ, закодированные в эзотерической и аллегорической форме. Традиционные методы анализа этих текстов сталкиваются с проблемами субъективной интерпретации, огромного объема материала и трудности выявления скрытых паттернов. Применение современных нейронных сетей и методов обработки естественного языка открывает новые возможности для систематического, масштабного и объективного исследования этого корпуса, позволяя выявлять скрытые химические знания, эволюцию терминологии и связи между авторами и трактатами.
Специфика алхимического корпуса текстов как объекта анализа
Алхимические тексты характеризуются набором уникальных особенностей, которые необходимо учитывать при построении моделей искусственного интеллекта.
- Полиязычность и историческая изменчивость языка: Корпус включает тексты на латыни, арабском, древнегреческом, средневековых европейских языках. Термины меняли значение со временем (например, «ртуть» могла означать как конкретное вещество, так и философский принцип).
- Использование синонимии и кодирования: Одно вещество могло иметь десятки названий («философский камень» — Lapis Philosophorum, красный лев, эликсир, тинктура). Процессы описывались через аллегории (свадьба короля и королевы, смерть и воскрешение).
- Смесь практического и теоретического: В одном тексте могут соседствовать точные описания оборудования (алембик, печь) и мистические рассуждения.
- Проблема атрибуции и псевдоэпиграфики: Многие тексты приписаны легендарным авторам (Гермесу Трисмегисту, Раймунду Луллию), что затрудняет установление хронологии и авторского стиля.
- Вещества: Сера, ртуть, соли, купорос, «зеленый лев» (возможно, железный купорос).
- Процессы: Дистилляция, кальцинация, сублимация, ферментация.
- Оборудование: Атанор, реторта, пеликан.
- Концепты: Трансмутация, квинтэссенция, первоматерия.
- Выявлять синонимы: если модель показывает, что векторы слов «зеленый лев» и «купорос» близки в множестве текстов, это дает гипотезу об их тождественности.
- Отслеживать изменение значений: как вектор слова «ртуть» смещается в семантическом пространстве от мистического принципа к конкретному химическому элементу в текстах разных эпох.
- Тема 1: Практическая металлургия и получение сплавов.
- Тема 2: Дистилляция и получение летучих веществ.
- Тема 3: Спиритуально-мистические аллегории.
- Тема 4: Фармацевтическая алхимия (ятрохимия).
- Заполнение лакун в поврежденных рукописях с учетом контекста.
- Проверка гипотез: если модель, обученная на текстах до Парацельса, после «прочтения» его работ начинает по-новому ассоциировать термины, это указывает на его влияние.
- Выделить ключевые, наиболее влиятельные тексты-«хабы».
- Проследить передачу конкретных практических рецептов (например, способа получения минеральных кислот) сквозь века.
- Объективно определить границы между школами алхимии (арабская, западноевропейская, ятрохимическая).
- Качество данных: Ошибки OCR, физическая утрата фрагментов текстов, вариативность написания.
- Риск «галлюцинаций» модели: Нейросеть может выявить ложные паттерны, не имеющие исторического или химического основания. Требуется валидация экспертами.
- Интерпретируемость: Сложно понять, на каком именно основании нейросеть сделала тот или иной вывод о связи терминов. Это «черный ящик».
- Необходимость междисциплинарности: Без участия историков науки, филологов и химиков результаты анализа могут быть некорректно истолкованы.
- Мультимодальный анализ: Объединение анализа текста с распознаванием изображений (гравюр, символов, схем аппаратов) в единую модель.
- Создание специализированных ИИ-инструментов: Интерактивные платформы для историков, позволяющие осуществлять семантический поиск по алхимическим корпусам с учетом синонимии.
- Реконструкция экспериментов: Попытка перевода текстовых описаний, проанализированных ИИ, в формализованные лабораторные протоколы для исторической реконструкции.
- Уточнение хронологии и атрибуции текстов на основе стилометрического анализа (The Alchemy Project, University of Toronto).
- Систематическое картирование эволюции терминологии веществ и аппаратов от арабских к латинским текстам.
- Выявление ранее не замеченных текстуальных параллелей между трактатами, считавшимися независимыми.
- Трансформеры (BERT, GPT): Для NER, анализа контекста, генерации.
- Сверточные нейросети (CNN): Для анализа визуального ряда (иллюстраций, знаков).
- Рекуррентные сети (RNN, LSTM): Для анализа последовательностей в рецептах.
- Графовые нейронные сети (GNN): Для построения сетей влияния между текстами и авторами.
- «The Chymistry of Isaac Newton» (Университет Индианы).
- «The Alchemy Website» (Амстердамская цифровая коллекция).
- «Bibliotheca Philosophica Hermetica» (Амстердам).
- «Digital Collections of the Bavarian State Library» (много алхимических инкунабул).
- «Early English Books Online (EEBO)» и «Gallica» (Национальная библиотека Франции).
Методы и подходы: от NLP к нейросетям
Анализ алхимических текстов с помощью ИИ строится на последовательном применении технологий обработки естественного языка (NLP) и машинного обучения.
1. Оцифровка и предобработка текстов
Первым этапом является создание машинно-читаемого корпуса. Это включает сканирование рукописей и старопечатных книг, распознавание символов (OCR), транскрибирование и нормализацию орфографии. Для древних языков и специальных символов (алхимические знаки) часто требуется ручная проверка.
2. Семантический анализ и распознавание сущностей (NER)
Современные модели на основе архитектур типа BERT или GPT, предобученные на исторических корпусах, могут быть дообучены для распознавания в тексте ключевых сущностей:
NER помогает автоматически индексировать тексты, создавая базу данных упоминаний веществ и операций.
3. Векторное представление слов (Word Embeddings) и анализ аналогий
Алгоритмы Word2Vec, GloVe или их нейросетевые аналоги преобразуют слова в числовые векторы. Семантически близкие слова оказываются ближе в векторном пространстве. Это позволяет:
4. Тематическое моделирование
Нейросетевые методы тематического моделирования (например, на основе автоэнкодеров) позволяют автоматически выделять скрытые темы в большом массиве текстов. Это помогает классифицировать трактаты по их содержанию:
Анализ распределения тем во времени показывает эволюцию алхимической мысли.
5. Генерация и завершение текстов
Модели типа GPT, дообученные на алхимических текстах, могут использоваться не для создания новых трактатов, а для исследовательских целей:
Конкретные примеры выявления химических знаний
Нейросетевой анализ позволяет переводить аллегорические описания в конкретные химические процессы. Ниже приведена таблица с примерами интерпретаций.
| Алхимический образ / описание | Возможная химическая интерпретация | Как может быть выявлено с помощью ИИ |
|---|---|---|
| «Свадьба Красного Короля и Белой Королевы» | Соединение золота (король) и серебра (королева) для получения сплава, возможно, этап в получении «золота» алхимиков. | Совместное появление в текстах, где также упоминаются «плавильня», «сплав», «руда». Кластеризация контекстов. |
| «Убийство и воскрешение дракона» | Повторяющиеся процессы растворения и выделения металла (часто ртути) из руды или соединений. | Анализ последовательности действий в рецептах, где за «убийством» следует «очищение» и «возгонка». |
| «Зеленый лев, пожирающий солнце» | Действие крепкой водки (азотной кислоты, получаемой из железного купороса — «зеленого льва») на золото («солнце»). | NER идентифицирует «зеленый лев» и «солнце» как сущности. Поиск текстов, где они встречаются вместе с глаголами «растворять», «разъедать». |
| «Полёт белого лебедя» | Сублимация хлорида аммония (нашатыря), образующего белые пары. | Ассоциация слов «лебедь», «белый», «полёт» с терминами «возгонка», «кристаллы», «пар» в рамках векторных моделей. |
Анализ сетей влияния и эволюции идей
С помощью графовых нейронных сетей можно построить и проанализировать сеть цитирования и заимствования между трактатами. Узлы графа — тексты или авторы, ребра — семантическая близость или прямое цитирование. Это позволяет:
Проблемы и ограничения метода
Перспективы развития направления
Заключение
Применение нейронных сетей для анализа алхимических текстов представляет собой мощный инструмент, дополняющий традиционные герменевтические методы. Он позволяет проводить масштабные, количественные исследования, выявлять скрытые связи и эволюцию понятий, систематизировать огромный корпус знаний. Ключевым результатом является не автоматическая расшифровка алхимии, а генерация проверяемых гипотез о соответствии между эзотерическим языком и реальными химическими процессами. Это способствует более глубокому пониманию алхимии как сложного феномена, находившегося на стыке практической химии, натурфилософии и духовных учений, и позволяет точнее проследить преемственность между алхимическим и научно-химическим периодами в истории науки.
Ответы на часто задаваемые вопросы (FAQ)
Может ли ИИ самостоятельно «расшифровать» все алхимические тексты?
Нет. ИИ не обладает пониманием в человеческом смысле. Он является инструментом для выявления статистических закономерностей, паттернов и связей в больших данных. Интерпретация этих паттернов, их проверка на историческую и химическую достоверность, а также финальный синтез выводов остаются за исследователем-человеком. ИИ генерирует гипотезы, а не окончательные истины.
Какие самые значимые открытия были сделаны с помощью такого анализа?
Пока область находится в стадии активного развития. К значимым результатам можно отнести:
Можно ли с помощью ИИ найти рецепт философского камня?
С точки зрения современной химии, философский камень как субстанция для трансмутации металлов не существует. Однако ИИ может проанализировать, какие описания, вещества и последовательности операций наиболее часто ассоциируются в текстах с понятием «Lapis Philosophorum». Это позволит лучше понять, какие реальные химические или металлургические процессы могли лежать в основе этих легендарных описаний, либо как конструировался этот центральный миф алхимии.
Какие нейросетевые архитектуры наиболее пригодны для этой задачи?
Для разных подзадач используются разные архитектуры:
Чаще всего создается комплексный конвейер из нескольких моделей.
Где можно найти оцифрованные корпуса алхимических текстов для анализа?
Крупные проекты по оцифровке включают:
Работа с этими корпусами часто требует специальных разрешений и навыков обработки старопечатных текстов.
Комментарии