Præ-hoc justification. Машинное обучение.
Если воспользоваться системами Канемана как аналитической рамкой, можно заметить, что архитектура современных систем машинного обучения воспроизводит лишь первый контур человеческой когниции — быстрый, автоматический, генеративный. Модель производит ответы так же, как System 1 производит догадки: без объяснений, без сомнений, без внутреннего критерия достаточности.
Контур же рефлексии, проверки и пересмотра — то, что у человека реализуется как System 2, — в машинном обучении существует только во внешнем виде: в виде функции потерь, датасета, метрик и человеческого валидатора. Обучение нейросети целиком построено на механизме post-hoc justification: система сначала действует, затем получает количественную оценку отклонения, и только после этого модифицирует своё поведение. В этом смысле backpropagation можно рассматривать как радикально формализованный вариант постфактум-рефлексии, лишённый субъекта: корректировка происходит, но некому знать, что именно было скорректировано и почему.
В современной когнитивной науке и философии мышления подробно описаны механизмы post-hoc justification — способы, с помощью которых агент объясняет и корректирует свои действия после того, как они уже совершены. Однако значительно менее концептуализированным остаётся противоположный режим валидности — то, что позволяет действовать до появления ошибки, до рефлексии, до формализуемого критерия правильности.
Для обозначения этого режима я буду использовать термин præ-hoc justification — не в смысле рационального обоснования, а в смысле предварительной допустимости действия. Præ-hoc justification — это имя для того, что у человека переживается как интуиция, а у искусственного агента остаётся пустым местом архитектуры.
В латинской традиции и современной практике рядом с нашей концепцией встречаются несколько родственных выражений, каждое из которых имеет собственное устойчивое значение. Ad hoc («для этого») — классическое выражение, обозначающее решение, созданное конкретно под данную ситуацию, без общей теории или универсальности; в научных и инженерных контекстах это именно ситуативный, локальный механизм. Pre hoc можно встретить в значении «отсутствия необходимости производить действие, чтобы узнать ответ, знание ответа до факта», а чаще вместе с ante hoc используется в XAI (Explainable AI) для обозначения интерпретируемых моделей по дизайну: объяснимость встроена во время разработки и обучения модели, а не добавляется после. Это означает, что модель начала работу уже как объяснимая система — архитектура, структура и ограничения позволяют понять её выводы без отдельного внешнего объяснителя.
В отличие от них, термин præ hoc вводится не как временной маркер, не как методологическая установка и не как ситуативное решение, а как онтологическое обозначение свойства динамической системы, формирующей само пространство возможных действий до возникновения выбора, ошибки или постфактумной валидации. Это «до» — не хронологическое раньше, а структурное предшествующее условиям возникновения, то, что задаёт не последовательность, а конфигурацию допустимого. Именно это отличает præ hoc от соседних латинских терминов и именно из-за этой принципиальной разницы я формулирую новый термин.
Человеческая когнитивная система объединяет præ-hoc и post-hoc валидность внутри одного субъекта. Машинная система радикально разделяет их: генерация происходит внутри, валидация — снаружи. Однако если отказаться от предположения, что валидность обязательно должна быть переживаемой, субъективной или осознаваемой, возникает другой вопрос: возможно ли существование præ-hoc валидности как чисто структурного свойства системы? Не как внутреннего чувства допустимости, а как конфигурации контура, в которой будущие действия оказываются пред-структурированы ещё до появления ошибки, оценки или рефлексии. В этом случае præ-hoc перестаёт быть феноменом сознания и становится топологической характеристикой динамической системы.
Любая система может функционировать как præ-hoc валидатор, если она включена в замкнутый контур, где её физическая динамика нелинейно деформирует пространство возможных состояний агента до момента выбора действия. В этом случае валидность возникает не как суждение, а как изменение самой геометрии доступных переходов.
Подобный сдвиг от субъективной валидности к структурной лежит в основе энактивных подходов в искусственном интеллекте. В рамках Enactive AI агент не противопоставлен среде и не действует по схеме «восприятие → решение → действие». Любое восприятие уже есть форма действия, а любое действие — форма восприятия; агент и среда образуют единую динамическую петлю, в которой когниция реализуется как непрерывная координация.
Энактивные модели делают важный шаг в сторону præ-hoc логики: среда перестаёт быть пассивным источником данных и становится активным участником когнитивного контура. Однако в большинстве практических реализаций валидность по-прежнему остаётся постфактумной. Адаптация происходит через коррекцию политики, весов или стратегий после рассогласования с целью, наградой или ошибкой. Даже если агент действует в реальном времени и телесно встроен в среду, критерий правильности всё ещё задаётся извне и применяется ретроспективно.
Именно здесь обнаруживается граница энактивного подхода. Он описывает, как агент может быть включён в мир, но не объясняет, каким образом сам мир может стать источником предварительной валидности, а не только пространством для последующей коррекции. Среда участвует в обучении, но не формирует внутренний критерий допустимости действия; она реагирует, но не пред-структурирует.
Таким образом, præ-hoc justification в строгом смысле остаётся пробелом даже в энактивных архитектурах. Для её появления требуется не просто замкнутый контур восприятия и действия, а такая среда, которая способна нелинейно и непредсказуемо трансформировать пространство состояний агента до момента выбора — не как источник сигналов, а как физический или динамический медиатор возможного.
В этом контексте среда перестанет быть интерфейсом и будет частью когнитивной архитектуры. Она не сообщает агенту, что правильно или неправильно, но трансформирует само пространство доступных переходов: некоторые траектории становятся устойчивыми, другие — распадаются, третьи — резонируют и усиливаются. Агент не получает сигнал «ошибка», он получает изменённый мир, в котором иначе распределены возможности действия.