Глоссарий: 50 терминов по ИИ, которые должен знать каждый.

Глоссарий: 50 терминов по ИИ, которые должен знать каждый

Данный глоссарий представляет собой структурированный справочник ключевых понятий, технологий и методов в области искусственного интеллекта. Понимание этих терминов необходимо для навигации в современном технологическом ландшафте, осмысленного обсуждения и принятия решений, связанных с ИИ.

Основные категории и концепции

Эта группа терминов описывает фундаментальные подходы и широкие категории внутри дисциплины ИИ.

Искусственный интеллект (ИИ, Artificial Intelligence / AI): Область компьютерных наук, целью которой является создание машин и систем, способных выполнять задачи, требующие человеческого интеллекта. К таким задачам относятся обучение, рассуждение, восприятие, понимание естественного языка и принятие решений.
Машинное обучение (МО, Machine Learning / ML): Подраздел ИИ, который фокусируется на разработке алгоритмов, позволяющих компьютерам обучаться на основе данных. Вместо явного программирования под каждую задачу, система ML идентифицирует закономерности в данных и строит модели для прогнозирования или принятия решений.
Глубокое обучение (Deep Learning / DL): Подраздел машинного обучения, основанный на искусственных нейронных сетях с множеством слоев («глубоких» сетях). Эти алгоритмы моделируют работу человеческого мозга (в упрощенном виде) и особенно эффективны в задачах распознавания образов, таких как компьютерное зрение и обработка естественного языка.
Искусственная нейронная сеть (ИНС, Artificial Neural Network / ANN): Вычислительная модель, вдохновленная биологическими нейронными сетями мозга. Состоит из взаимосвязанных узлов (нейронов), организованных в слои. Способна обучаться, настраивая силу (вес) связей между нейронами на основе входных данных.
Обработка естественного языка (NLP, Natural Language Processing): Раздел ИИ, занимающийся взаимодействием между компьютерами и человеческим языком. Задачи NLP включают машинный перевод, анализ тональности, распознавание речи, генерацию текста и чат-ботов.
Компьютерное зрение (Computer Vision): Область ИИ, которая позволяет машинам «видеть», интерпретировать и понимать визуальную информацию из окружающего мира (изображения, видео). Применяется в распознавании лиц, автономных транспортных средствах, медицинской диагностике по снимкам.
Робототехника (Robotics): Междисциплинарная область, сочетающая ИИ, машинное обучение, инженерию и компьютерные науки для создания машин (роботов), способных автономно или полуавтономно выполнять физические задачи в реальном мире.
Экспертная система (Expert System): Ранняя форма ИИ, предназначенная для имитации способности к рассуждению и принятию решений эксперта-человека в конкретной узкой предметной области. Работает на основе базы знаний и набора правил (if-then).
Сильный ИИ (Искусственный общий интеллект, AGI, Artificial General Intelligence): Гипотетический тип ИИ, который обладает способностью понимать, обучаться и применять интеллект для решения любой задачи, с которой справляется человек. На сегодняшний день не существует.
Слабый ИИ (Узкий ИИ, Narrow AI): Тип ИИ, который существует сегодня. Сфокусирован на выполнении одной конкретной задачи или наборе близких задач (например, игра в шахматы, рекомендация товаров, распознавание речи). Не обладает общим сознанием или интеллектом.

Методы и подходы машинного обучения

Эти термины описывают различные парадигмы и стратегии обучения алгоритмов.

Термин	Описание	Пример применения
Обучение с учителем (Supervised Learning)	Алгоритм обучается на размеченных данных, где каждому входному примеру соответствует правильный выходной ответ (метка). Цель — научиться сопоставлять входные данные с правильными выходами.	Классификация спама в почте, прогнозирование цен на жилье.
Обучение без учителя (Unsupervised Learning)	Алгоритм работает с данными без меток, находя скрытые закономерности, структуры или группировки в данных.	Кластеризация клиентов по поведению, снижение размерности данных.
Обучение с подкреплением (Reinforcement Learning)	Агент обучается, взаимодействуя со средой, получая награды (reward) или штрафы за свои действия. Цель — максимизировать совокупную награду.	Обучение игровым стратегиям (AlphaGo), управление роботами.
Самообучение (Self-supervised Learning)	Подход, при котором модель генерирует «псевдометки» из самих данных, а затем обучается на них, часто используя часть данных для предсказания другой части.	Предобучение больших языковых моделей (например, GPT) на текстах.
Активное обучение (Active Learning)	Алгоритм может запрашивать разметку для наиболее информативных или неопределенных примеров у эксперта-человека, что повышает эффективность обучения при ограниченном бюджете на разметку.	Разметка медицинских изображений, где экспертиза дорога.

Архитектуры и модели нейронных сетей

Конкретные типы нейронных сетей, разработанные для решения специфических классов задач.

Сверточная нейронная сеть (CNN, Convolutional Neural Network): Специализированная архитектура для обработки данных с сеточной структурой, таких как изображения. Использует сверточные слои для автоматического извлечения пространственных признаков.
Рекуррентная нейронная сеть (RNN, Recurrent Neural Network): Архитектура, предназначенная для работы с последовательными данными (временные ряды, текст). Имеет внутреннюю память (скрытое состояние) для учета контекста предыдущих элементов последовательности.
Долгая краткосрочная память (LSTM, Long Short-Term Memory): Усовершенствованный тип RNN, решающий проблему исчезающего градиента. Способен запоминать долгосрочные зависимости в последовательностях.
Трансформер (Transformer): Архитектура, основанная на механизме внимания (attention), которая обрабатывает все элементы последовательности параллельно, а не последовательно. Стала основой для современных больших языковых моделей (BERT, GPT).
Генеративно-состязательная сеть (GAN, Generative Adversarial Network): Архитектура, состоящая из двух конкурирующих сетей: генератор создает поддельные данные, а дискриминатор пытается отличить их от реальных. В результате генератор учится создавать высококачественные синтетические данные.
Автокодировщик (Autoencoder): Нейронная сеть, которая обучается сжимать входные данные в представление меньшей размерности (кодирование), а затем восстанавливать их обратно (декодирование). Используется для снижения шума, уменьшения размерности.
Диффузионная модель (Diffusion Model): Тип генеративной модели, которая учится создавать данные, постепенно удаляя шум из случайного начального состояния. Показывает выдающиеся результаты в генерации изображений и аудио.

Ключевые процессы и метрики

Термины, описывающие этапы работы с моделями ИИ и способы оценки их качества.

Данные для обучения (Training Data): Набор примеров, используемых для обучения модели машинного обучения. Качество и репрезентативность этих данных напрямую влияют на качество итоговой модели.
Валидационные данные (Validation Data): Отдельный набор данных, используемый для настройки гиперпараметров модели и оценки ее производительности во время обучения. Помогает предотвратить переобучение.
Тестовые данные (Test Data): Независимый набор данных, который не используется ни на этапе обучения, ни на этапе валидации. Служит для финальной объективной оценки качества обученной модели.
Гиперпараметры (Hyperparameters): Параметры алгоритма обучения, которые задаются до начала процесса обучения и не обучаются на данных (например, скорость обучения, количество слоев в сети, размер мини-батча).
Переобучение (Overfitting): Ситуация, когда модель слишком точно подстраивается под обучающие данные, включая их шум и случайные колебания, и в результате плохо работает на новых, ранее не виденных данных.
Недообучение (Underfitting): Ситуация, когда модель слишком проста и не может уловить основные закономерности в обучающих данных, что приводит к низкой производительности как на обучающих, так и на новых данных.
Функция потерь (Loss Function): Функция, которая вычисляет ошибку (разницу между предсказанием модели и правильным ответом). Цель обучения — минимизировать значение этой функции.
Градиентный спуск (Gradient Descent): Оптимизационный алгоритм, используемый для минимизации функции потерь. Он итеративно корректирует параметры модели, двигаясь в направлении, противоположном градиенту (наклону) функции потерь.
Точность (Accuracy): Простейшая метрика для задач классификации — доля правильных предсказаний модели среди всех сделанных предсказаний. Может быть неинформативной при несбалансированных классах.
Полнота (Recall) и Точность-полнота (Precision): Метрики для задач классификации, особенно важные при несбалансированных данных. Precision — доля истинно положительных случаев среди всех случаев, которые модель пометила как положительные. Recall — доля истинно положительных случаев, которые модель смогла обнаружить среди всех реально положительных случаев.
F1-мера (F1-score): Гармоническое среднее между точностью (precision) и полнотой (recall). Полезная агрегированная метрика для оценки баланса между этими двумя показателями.

Передовые технологии и инструменты

Современные концепции и платформы, определяющие развитие ИИ сегодня.

Большая языковая модель (LLM, Large Language Model): Модель глубокого обучения, обученная на огромных объемах текстовых данных. Способна генерировать, классифицировать и обобщать тексты, а также вести диалог. Примеры: GPT-4, Claude, LLaMA.
Промпт (Prompt): Текстовая инструкция или запрос, который пользователь вводит в языковую модель для получения желаемого ответа. Искусство составления эффективных промптов называется «промпт-инжиниринг».
Промпт-инжиниринг (Prompt Engineering) Методика разработки и оптимизации текстовых запросов (промптов) для эффективного взаимодействия с большими языковыми моделями с целью получения точных и релевантных результатов.
Тонкая настройка (Fine-tuning): Процесс дополнительного обучения предварительно обученной модели (например, LLM) на специфическом наборе данных для адаптации к конкретной задаче или предметной области.
Малое обучение (Few-shot Learning): Способность модели, особенно LLM, понимать и выполнять новую задачу после демонстрации всего нескольких примеров (промптов) в контексте запроса, без необходимости полной дообучки.
Обучение без примеров (Zero-shot Learning): Способность модели выполнять задачу, с которой она явно не сталкивалась во время обучения, на основе только текстового описания задачи в промпте, без предоставления примеров.
RAG (Retrieval-Augmented Generation): Архитектура, которая комбинирует возможности генерации языковой модели с механизмом извлечения информации из внешних баз знаний или документов. Это позволяет модели давать ответы, основанные на актуальных и проверенных данных, снижая вероятность «галлюцинаций».
Галлюцинация ИИ (AI Hallucination): Ситуация, когда модель ИИ, особенно языковая, генерирует информацию, которая является неправдоподобной, вымышленной или не основанной на предоставленных ей данных или реальных фактах.
Этика ИИ (AI Ethics): Область изучения, посвященная разработке и использованию систем ИИ таким образом, чтобы это соответствовало этическим принципам и ценностям, таким как справедливость, подотчетность, прозрачность и отсутствие дискриминации.
Смещение (Bias) в ИИ Систематическая ошибка в данных или алгоритме, которая приводит к несправедливым или предвзятым результатам, часто дискриминирующим определенные группы людей по признаку расы, пола, возраста и т.д.
Объяснимый ИИ (XAI, Explainable AI): Набор методов и инструментов, позволяющих понять и интерпретировать решения, принимаемые моделями ИИ, особенно сложными (например, глубокими нейронными сетями). Цель — сделать ИИ более прозрачным и доверенным.
Интеллектуальный анализ данных (Data Mining): Процесс обнаружения закономерностей, аномалий и корреляций в больших наборах данных для прогнозирования результатов. Использует методы на стыке машинного обучения, статистики и систем управления базами данных.
Машинное обучение на грани (Edge ML): Развертывание моделей машинного обучения непосредственно на конечных устройствах (телефонах, камерах, IoT-датчиках), а не в облаке. Это снижает задержки, экономит трафик и повышает конфиденциальность.
Градиент (Gradient): Вектор частных производных функции потерь по всем параметрам модели. Указывает направление наискорейшего роста функции. Градиентный спуск использует отрицательный градиент для нахождения минимума.
Обучение с подкреплением с человеческой обратной связью (RLHF, Reinforcement Learning from Human Feedback): Метод тонкой настройки языковых моделей, при котором модель оптимизируется с помощью обучения с подкреплением, где функция вознаграждения основана на оценках, данных людьми-асессорами. Это позволяет лучше согласовать поведение модели с человеческими предпочтениями.
Аугментация данных (Data Augmentation): Техника увеличения объема и разнообразия обучающих данных путем применения к ним случайных, но реалистичных преобразований (например, поворот, кадрирование изображения, синонимизация текста). Помогает бороться с переобучением.
Ансамбль моделей (Ensemble Learning): Метод, который объединяет предсказания нескольких отдельных моделей (например, деревьев решений) для получения более точного и устойчивого итогового прогноза, чем может дать любая из моделей по отдельности.
Кластеризация (Clustering): Задача обучения без учителя, целью которой является разделение набора данных на группы (кластеры) таким образом, чтобы объекты внутри одного кластера были более похожи друг на друга, чем на объекты из других кластеров.
Регрессия (Regression): Тип задачи обучения с учителем, где целью является прогнозирование непрерывной числовой величины (например, цены, температуры, спроса).
Классификация (Classification): Тип задачи обучения с учителем, где целью является отнесение входного объекта к одной из заранее определенных категорий или классов (например, «спам»/»не спам», «кошка»/»собака»).

Ответы на часто задаваемые вопросы (FAQ)

В чем разница между ИИ, машинным обучением и глубоким обучением?

Это понятия разного уровня общности. Искусственный интеллект (ИИ) — самая широкая область, цель которой — создание разумных машин. Машинное обучение (МО) — это подраздел ИИ, метод достижения интеллекта через обучение на данных. Глубокое обучение (ГО) — это, в свою очередь, подраздел машинного обучения, который использует многослойные нейронные сети для обучения. Можно представить это как матрешку: Глубокое обучение ⊂ Машинное обучение ⊂ Искусственный интеллект.

Что такое «нейрон» в нейронной сети? Это имитация мозга?

Нейрон в искусственной нейронной сети — это математическая функция, очень упрощенно имитирующая работу биологического нейрона. Он принимает один или несколько входных сигналов (данных), умножает каждый на свой «вес» (важность), суммирует, добавляет смещение (bias) и пропускает результат через нелинейную функцию активации, чтобы получить выходной сигнал. Сеть в целом вдохновлена мозгом, но ее архитектура и принципы работы — это абстрактная математическая модель, а не точная биологическая симуляция.

Почему большие языковые модели иногда «галлюцинируют»?

Галлюцинации возникают потому, что языковые модели по своей сути являются системами, предсказывающими следующее наиболее вероятное слово (токен) в последовательности, а не системами, оперирующими фактами или истиной. Они обучаются на статистических закономерностях в текстах. Если в данных есть ошибки, противоречия или если модель экстраполирует шаблоны за пределы достоверных знаний, она может сгенерировать правдоподобный, но фактически неверный текст. Отсутствие прямого доступа к базе проверенных фактов или механизма логического вывода усугубляет эту проблему.

Что важнее для успеха проекта ИИ: алгоритм или данные?

В подавляющем большинстве практических случаев качественные и репрезентативные данные важнее выбора конкретного алгоритма. Современные алгоритмы (особенно в глубоком обучении) часто показывают схожие результаты на чистых, хорошо подготовленных данных. Однако плохие, смещенные или недостаточные данные сведут на нет преимущества даже самого совершенного алгоритма. Афоризм «мусор на входе — мусор на выходе» (garbage in, garbage out) в машинном обучении как никогда актуален.

Что такое «этика ИИ» и почему это важно?

Этика ИИ — это область, изучающая моральные последствия разработки и развертывания систем искусственного интеллекта. Ее важность обусловлена тем, что ИИ-системы все чаще принимают или влияют на решения, затрагивающие жизнь людей (кредитование, найм, медицина, правосудие). Ключевые проблемы включают: смещение (bias) — несправедливое отношение к определенным группам; подотчетность — кто отвечает за ошибку ИИ; прозрачность — возможность понять логику решений («черный ящик»); конфиденциальность — использование персональных данных. Игнорирование этических аспектов может привести к дискриминации, ущербу репутации и юридическим рискам.

Глоссарий: 50 терминов по ИИ, которые должен знать каждый.