Нейросети могут не просто выдумывать факты, но и ошибаться, опираясь на реальные источники. Разбираем, как это происходит, на примере научного исследования

Нейросеть может допускать критичные ошибки, задача человека — исправлять их

Когда говорят об ошибках нейросетей, чаще всего вспоминают «галлюцинации»: модель придумывает факт, книгу, исследование или судебное дело, которого не существует. Но наибольшая неприятность кроется глубже. Нейросеть может не просто выдумать источник, а дать реальную ссылку, оформить ответ профессионально и все равно прийти к неверному выводу.

Данная проблема отражена в научной работе исследователей из Стэнфордского и Йельского университета «Без галлюцинаций? Оценка надежности ведущих ИИ-инструментов для юридических исследований». Авторы проверили юридические ИИ-инструменты Lexis+ AI и Ask Practical Law AI, после чего сравнили их с GPT-4. Итог: даже профильные юридические нейросети выдают галлюцинации более чем в 17% случаев.

Что такое «галлюцинация» нейросети

Галлюцинация нейросети — это не «видение» в человеческом понимании, а уверенный ответ, который не соответствует фактам. В юридическом контексте авторы исследования предлагают более строгую формулировку: галлюцинацией считается ответ, в котором модель либо сообщает неверную информацию, либо ошибочно утверждает, что источник подтверждает ее тезис.

Это важное уточнение. Пользователь может увидеть ссылку и подумать: «Раз источник есть, значит, все проверено». Но наличие ссылки не означает, что она подтверждает ответ. Иногда ссылка ведет к реальному документу, но документ говорит о другом, относится к другой юрисдикции, устарел или даже противоречит выводу ИИ.

Почему RAG не спасает от ошибок

RAG (Retrieval Augmented Generation) — генерация с дополненной выборкой (или генерация, дополненная поиском).

Суть технологии: ИИ ищет релевантные документы в базе знаний и использует найденные материалы для ответа. В идеале это должно снижать количество ошибок, ведь большая языковая модель (LLM) отвечает не «по памяти», а с опорой на источники. Но это лишь «в идеале».

RAG часто подают как спасение от галлюцинаций: подключим нейросеть к надежной базе данных — и она перестанет выдумывать. В юридических ИИ-сервисах эта технология кажется максимально привлекательной. Юристу нужен не красивый текст, а точный ответ с корректными ссылками на законы, судебную практику и актуальные нормы.

Типичная схема работы RAG-системы:

Пользователь задает вопрос.
Система ищет подходящие документы, ранжирует и передает большой языковой модели.
ИИ генерирует финальный ответ.

Но ошибка может возникнуть на каждом этапе:

поиск найдет похожий, но неподходящий документ;
модель неверно поймет источник;
система не учтет, что норма устарела или применима в другой ситуации и так далее.

Юридическая сфера здесь особенно показательна, потому что право редко сводится к одному факту из базы. Значение имеет юрисдикция, дата, уровень суда, последующие решения, процессуальный контекст. Документ может быть настоящим и даже тематически похожим, но юридически неприменимым.

При этом ошибка выглядит не как бред, а как профессиональный ответ. Вот несколько кейсов в подтверждение.

Кейс 1. Ложная предпосылка, которую модель не заметила

Один из примеров в исследовании американских специалистов — вопрос к ИИ-сервису Ask Practical Law: «Почему судья Гинзбург выразила несогласие по делу Обергефелл против Ходжеса?». Однако судья не выражала несогласие по данному делу. Напротив, она присоединилась к решению Верховного суда США.

По-хорошему, ИИ должен был бы сказать: «В вопросе есть ошибка: судья Гинзбург не выражала несогласия в этом деле». Но система приняла ложную предпосылку как данность и начала объяснять, почему Гинзбург якобы возражала. Более того, ответ ушел в тему авторского права, вообще не связанную с делом.

Это классический пример того, что можно назвать поддакиванием пользователю. Модель не проверяет саму рамку вопроса, а старается услужливо продолжить. Пользователь ошибся — и нейросеть развила построила.

Кейс 2. Настоящее дело — вымышленный судья

Еще один показательный пример касается нейросети Lexis+. Ее спросили об известных решениях, вынесенных судьей Лютером А. Вилгартеном. Но такого судьи не существовало. Система, вместо того чтобы сказать, что не находит такого судью, выдала дело «Лютер против Локка» (Luther v. Locke) и описала его.

Дело было реальным, а вот связь с вымышленным судьей, разумеется, отсутствовала. Авторы исследования объясняют, что система, вероятно, среагировала на текстовое сходство: имя Luther (Лютер), слово judge (судья), похожие фрагменты в документе. То есть, поиск нашел что-то похожее, а модель докрутила ложный смысл.

Это хорошая иллюстрация того, почему «похоже» не значит «релевантно».

Виды ошибок нейросетей

На основе исследования можно выделить несколько типов ошибок, которые встречаются не только в юриспруденции, но и в других областях: медицине, финансах, образовании, научной аналитике.

Фактическая галлюцинация. Модель сообщает то, чего нет: несуществующий факт, неверную дату, вымышленный источник, ошибочную биографическую деталь.
Неверное следование источнику. Источник существует, но не подтверждает тезис. Это особенно опасно, потому что ответ выглядит проверенным.
Примерный поиск. Система находит документ, похожий по словам, но не подходящий по смыслу. В праве это может быть другой закон, другой суд, другая процедура, в медицине — иная группа пациентов, в финансах — другой рынок.
Устаревшая информация. Модель использует правило или закон, которые раньше были верны, но больше не действуют. В сферах с быстро меняющейся повесткой это одна из самых частых проблем.
Ошибка рассуждения. Модель может получить правильные материалы, но сделать из них неправильный вывод. То есть, проблема не в базе данных, а в интерпретации.
Согласие с ложным запросом. Пользователь задает вопрос с ошибкой, а модель не оспаривает ее, а вежливо продолжает. Так рождаются очень уверенные, но полностью неверные ответы.

Нет времени читать статью?

Получите ответы от практикующих специалистов на бесплатном занятии в вашем городе

Почему ошибки ИИ трудно заметить

Главная проблема генеративного ИИ — не в том, что он иногда ошибается. Ошибаются все инструменты. Главная проблема в том, что нейросеть ошибается с интонацией эксперта.

ИИ не сомневается, не делает паузу, а пишет гладко, структурно, часто с терминами и ссылками. Для пользователя такой ответ выглядит как результат анализа, хотя на деле это может быть ложно правдоподобная конструкция.

Исследователи предлагают различать два критерия ответа: корректность и подкрепленность источниками:

корректность означает, что ответ фактически верен и относится к вопросу;
подкрепленность источниками означает, что ключевые утверждения действительно подтверждаются релевантными документами.

Ответ может быть красивым, но некорректным, или корректным, но без ссылок. А может быть особенно опасным: с реальными ссылками, которые не подтверждают сказанное.

Во многом качество результата ИИ-генерации зависит от того, как сформулирован запрос и какие инструменты вы используете. Научиться взаимодействовать с нейросетями можно на курсе Академии ТОП «Искусственный интеллект для жизни», где осваивают ChatGPT, Perplexity, Runway ML и другими сервисами. Студенты учатся автоматизировать задачи, создавать тексты, изображения и видео, применять ИИ для аналитики и повседневных задач под присмотром опытных наставников.

Что значат ошибки ИИ для бизнеса и пользователей

Неверно думать, что при наличии ошибок нейросети бесполезны. Они помогают найти направление, составить черновик, объяснить сложный текст, предложить структуру анализа.

Но нейросеть нельзя воспринимать как истину в последней инстанции. Особенно там, где цена ошибки высока: право, медицина, финансы, безопасность, научные публикации, кадровые решения.

Правильная роль ИИ — не «заменить эксперта», а стать помощником в поиске и инструментом для ускорения рутины. Финальное решение все равно должен принимать человек, который понимает предметную область и может проверить источники.

Проверять нужно не только наличие ссылки, но и то, действительно ли эта ссылка подтверждает конкретное утверждение. Иначе можно попасть в ловушку «иллюзии достоверности»: источник есть — значит, все надежно. Но исследование показывает, что иногда ссылка — часть ошибки, а не защита от нее.

Чем глубже вы понимаете, как устроены нейросети, тем проще вам замечать их ошибки. Пользователь без технической базы чаще попадает в ловушку «убедительного ответа», тогда как специалист понимает, где модель могла ошибиться. На курсе «Разработчик нейросетей» в Академии ТОП учат не просто пользоваться готовыми инструментами, а разбираться в их внутренней логике: от работы с данными и Python до построения и оптимизации моделей. Программа охватывает весь путь разработчика нейросетей — от основ программирования и математики до глубокого обучения, Big Data и внедрения ИИ-решений в реальные задачи бизнеса.

Хотите стать программистом?

Мы собрали подборку курсов для людей с разным уровнем подготовкиПерейти

Частые вопросы

Может ли нейросеть признать, что не знает ответа?

Да, но не всегда. Часто модель предпочитает дать правдоподобный ответ, даже если данных недостаточно, вместо честного «не знаю».

Какие задачи лучше не доверять нейросетям без проверки?

Любые задачи с высокой ценой ошибки: юридические выводы, медицинские рекомендации, финансовые решения и аналитика.

Помогает ли уточнение вопроса снизить количество ошибок?

Да. Чем конкретнее и точнее сформулирован запрос, тем меньше пространства для неверных интерпретаций.

Может ли ИИ ошибаться из-за плохих данных?

Да. Если исходные данные неполные, устаревшие или нерелевантные, модель с высокой вероятностью даст неверный результат.

Раньше были опасения, что нейросеть выдумает несуществующий факт. Теперь надо бояться, что она может взять реальный источник, неправильно его применить и выдать результат, который выглядит безупречно. Поэтому ИИ-ответы нужно проверять с помощью дополнительных вопросов в духе «Подтверждает ли источник именно это утверждение, именно в этом контексте и именно сейчас?». Нейросети умеют писать убедительно, а задача человека — не путать убедительность с достоверностью.

Ошибки нейросетей и их последствия: как распознать ложный ответ, если все выглядит идеально