Что такое AGI и почему LLM, возможно, никогда не станут настоящим AGI

Q: Почему сегодняшние большие языковые модели не считаются настоящим AGI?

Современные большие языковые модели (LLM): - В основном обучены на тексте (иногда вместе с кодом, изображениями или аудио) - Оптимизированы для предсказания следующего токена в последовательности - Не имеют восприятия, тела, встроенных целей и устойчивой памяти Они могут симулировать широкие знания и рассуждения, потому что язык содержит много человеческой экспертизы. Но они: - Не имеют понятий, заякоренных в реальном опыте - Не ведут развивающихся убеждений о мире - Не планируют и не действуют автономно во времени Поэтому LLM — это мощные узкие алгоритмы распознавания шаблонов в языке, а не автономные агенты с общим интеллектом.

Q: Как LLM работают под капотом?

Представьте LLM как: - Огромную функцию, которая отображает последовательность токенов в вероятности следующего токена - Модель, обученную на триллионах примеров, которая корректирует внутренние веса, чтобы лучше предсказывать продолжения Ключевые моменты: - Она не хранит факты как в базе данных - Кодирует статистические регулярности языка - У неё нет встроенного понятия истины, есть только правдоподобие в свете предыдущего текста Всё, что выглядит как рассуждение или память, возникает из задачи предсказания следующего токена плюс масштаб и дообучение, а не из явной символической логики или устойчивого хранилища убеждений.

Q: По каким признакам можно понять, что построен настоящий AGI?

Набор критериев, выходящий за рамки качественного общения: - Автономность: система сама ставит и управляет подпроектами, восстанавливается после неудач - Переносимость: навыки из одной области применимы в существенно другой без большой дообучки - Компетентность в реальном мире: планирование и действие в грязных физическо-социальных средах, а не только в тексте - Непрерывное обучение: обновление внутренних моделей по мере накопления опыта, без оффлайн-переобучения Современные LLM даже в составе агентских систем требуют большого вмешательства человека и оркестрации инструментов, чтобы приблизиться к этим характеристикам — и всё ещё остаются хрупкими и ограниченными.

Войти Начать

Что такое AGI и почему LLM, возможно, никогда не станут настоящим AGI | Koder.ai

Почему AGI и LLM повсюду путают

Если вы читаете технологические новости, презентации для инвесторов или страницы продуктов, вы заметите, как слово интеллект растягивают до предела. Чат‑боты «почти как люди», помощники по кодированию — «почти младшие инженеры», и некоторые люди невозмутимо называют мощные большие языковые модели (LLM) первыми шагами к искусственному общему интеллекту (AGI).

Эта статья для любопытных практиков, основателей, продуктовых лидеров и технических читателей, которые используют инструменты вроде GPT‑4 или Claude и задаются вопросом: Похоже ли это на AGI — или чему‑то важному здесь не хватает?

Источник путаницы

LLM действительно впечатляют. Они:

бегло ведут диалог на естественном языке
пишут код, резюмируют исследования и сдают экзамены
отражают свои собственные выводы так, что это выглядит как рассуждение

Для большинства неспециалистов это кажется неотличимым от «общего интеллекта». Когда модель за одну сессию может написать эссе о Канте, исправить ошибку в TypeScript и помочь составить юридическое заключение, естественно предположить, что мы близки к AGI.

Но это предположение тихо приравнивает умение работать с языком к общему интеллекту. В этом заключается основная путаница, которую мы разберём в статье.

Центральное утверждение этой статьи

Аргумент, который будет развёрнут по разделам, таков:

Современные LLM — крайне способные обучатели шаблонов по тексту и коду, но их архитектура и режим обучения делают маловероятным достижение ими истинного AGI просто путём масштабирования или дообучения.

Они будут становиться лучше, шире и полезнее. Они могут быть частью систем, похожих на AGI. Но есть глубокие причины — связанные с заякоренностью в мире, агентностью, памятью, воплощением и самомоделью — по которым «большая LLM» вряд ли эквивалентна «общему интеллекту».

Ожидайте опинионированного обзора, но основанного на текущих исследованиях, конкретных возможностях и провалах LLM и открытых вопросах, с которыми серьёзные учёные борются, а не на хайпе или запугивании.

Что мы на самом деле подразумеваем под искусственным общим интеллектом?

Когда говорят AGI, редко имеют в виду одно и то же. Чтобы прояснить дебаты, полезно разделить несколько ключевых концептов.

От узкого ИИ к общему интеллекту

ИИ (искусственный интеллект) — широкая область создания систем, выполняющих задачи, требующие некоего «интеллектуального» поведения: распознавание речи, рекомендации фильмов, игра в го, написание кода и многое другое.

Большая часть того, что существует сегодня, — это узкий ИИ (или слабый ИИ): системы, разработанные и обученные для конкретного набора задач в заданных условиях. Классификатор изображений, маркирующий кошек и собак, или чат‑бот для банковских вопросов могут быть чрезвычайно эффективны в своей нише, но провалиться вне её.

Искусственный общий интеллект (AGI) — совсем другое. Речь о системе, которая может:

Обобщать в широком диапазоне доменов, а не только по одной задаче или типу данных
Адаптироваться к новым проблемам и средам, для которых её явно не тренировали
Действовать автономно, ставя и преследуя цели с минимальным сопровождением
Переносить обучение, используя то, что узнала в одном контексте, чтобы успешно действовать в других

Практическое правило: AGI, в принципе, мог бы освоить почти любую интеллектуально требовательную работу человека, при наличии времени и ресурсов, без необходимости штучно переделывать систему под каждую задачу.

Сильный ИИ, человекоподобный ИИ и сверхинтеллект

Похожие термины часто используются взаимозаменяемо:

Сильный ИИ: обычно употребляется как синоним AGI, акцентируя внимание на подлинном понимании, а не хитрой имитации.
Человекоподобный ИИ: AGI с когнитивными способностями, примерно сопоставимыми со средним взрослым человеком.
Сверхинтеллект: гипотетическая система, которая значительно превосходит лучшие человеческие умы по большинству или всем областям.

По сравнению с этим современные чат‑боты и модели изображений остаются узкими: впечатляющими, но оптимизированными под паттерны в конкретных данных, а не для открытого, междоменного интеллекта.

Краткая история мечты об AGI

Ранние видения: Тьюринг и символический ИИ

Современная мечта об AGI начинается с предложения Алана Тьюринга 1950 года: если машина может вести разговор, неотличимый от человеческого (тест Тьюринга), может ли она быть умна? Это определило общий интеллект в терминах поведения, особенно языка и рассуждений.

С 1950‑х по 1980‑е исследователи шли путём символического ИИ или «GOFAI» (Good Old‑Fashioned AI). Интеллект рассматривался как манипулирование явными символами по логическим правилам. Программы для доказательства теорем, игры и экспертные системы внушали надежду, что человеческое рассуждение близко.

Но GOFAI плохо справлялся с восприятием, здравым смыслом и «мусорными» реальными данными. Системы могли решать логические головоломки, но терпеть неудачу в задачах, которые ребёнок решает легко. Этот разрыв привёл к первым «зимам ИИ» и более осторожному взгляду на AGI.

Поворот к машинному обучению

С ростом данных и вычислительных мощностей ИИ сместился от вручную прописанных правил к обучению на примерах. Статистическое машинное обучение, затем глубокое обучение, переосмыслили прогресс: вместо кодирования знаний системы учатся шаблонам из больших наборов данных.

Вехи вроде DeepBlue (шахматы) и позднее AlphaGo (го) восхищали как шаги к общему интеллекту. На деле они были исключительно специализированными: каждая система овладела одной игрой в фиксированных правилах, без переноса на повседневные рассуждения.

От узких побед к генеративным моделям

Серия GPT стала ещё одним драматическим скачком, на этот раз в языке. GPT‑3 и GPT‑4 могут сочинять тексты, писать код и имитировать стили, что подпитывало спекуляции о близости AGI.

Тем не менее эти модели остаются обучателями шаблонов по тексту. Они не формируют целей, не строят заякоренные модели мира и не расширяют компетенции автономно.

На каждом витке — символический ИИ, классическое машинное обучение, глубокое обучение и теперь большие языковые модели — мечта об AGI неоднократно переносилась на узкие достижения, а затем пересматривалась, когда выяснялись их пределы.

Как на самом деле работают большие языковые модели

Большие языковые модели (LLM) — это обучатели шаблонов, работающие на огромных коллекциях текста: книги, сайты, код, форумы и многое другое. Их цель обманчиво проста: предсказать, какой токен (небольшой кусочек текста) скорее всего идёт следующим.

Токены и предсказание следующего слова

Перед обучением текст разбивается на токены: это могут быть целые слова ("cat"), части слов ("inter", "esting") или даже знаки препинания. Во время обучения модель многократно видит последовательности вроде:

"The cat sat on the ___"

и учится присваивать высокую вероятность правдоподобным продолжениям ("mat", "sofa") и низкую — неправдоподобным ("presidency"). Этот процесс, масштабируемый на триллионы токенов, формирует миллиарды (и более) внутренних параметров.

По сути модель — очень большая функция, которая превращает последовательность токенов в распределение вероятностей следующего токена. Обучение использует градиентный спуск, чтобы постепенно подгонять параметры под паттерны данных.

Законы масштабирования простыми словами

"Законы масштабирования" описывают регулярность: при увеличении размера модели, объёма данных и вычислений производительность обычно улучшается предсказуемым образом. Большие модели, обученные на большем количестве текста, как правило, лучше предсказывают — до практических ограничений данных, вычислений и стабильности обучения.

Что LLM на самом деле «знают»

LLM не хранят факты как база данных и не рассуждают как человек. Они кодируют статистические закономерности: какие слова, фразы и структуры обычно идут вместе в каких контекстах.

У них нет заякоренных понятий, связанных с восприятием или физическим опытом. LLM может говорить о "красном" или "тяжести" лишь через то, как эти слова использовались в тексте, а не через видение цвета или поднятие предметов.

Поэтому модели могут звучать знающими, но совершать уверенные ошибки: они расширяют паттерны, а не сверяются с явной моделью реальности.

Предобучение, дообучение и RLHF

Предобучение — длинная начальная фаза, где модель учит общие языковые паттерны, предсказывая следующие токены на огромных корпусах текста. Именно здесь возникают большинство способностей.

После этого дообучение адаптирует предобученную модель к более узким целям: следовать инструкциям, писать код, переводить или помогать в специфичных областях. Модель показывают на отобранных примерах желаемого поведения и слегка корректируют.

Reinforcement learning from human feedback (RLHF) добавляет ещё один слой: люди оценивают или сравнивают ответы модели, и модель оптимизируется так, чтобы выдавать ответы, которые люди предпочитают (более полезные, менее вредные, более честные). RLHF не даёт модели новых органов чувств или глубинного понимания; он в основном формирует то, как она представляет и фильтрует уже выученное.

Вместе эти шаги создают системы, чрезвычайно хорошие в генерации беглого текста на основе статистических паттернов — без обладания заякоренными знаниями, целями или самосознанием.

Что современные LLM умеют удивительно хорошо

Зарабатывайте кредиты

Получайте кредиты за создание контента о Koder.ai или за приглашение других пользователей.

Получить кредиты

Большие языковые модели впечатляют, потому что они способны выполнять широкий набор задач, которые когда‑то казались недостижимыми для машин.

Код, текст и перевод по требованию

LLM могут генерировать рабочие фрагменты кода, рефакторить существующий код и даже объяснять незнакомые библиотеки простым языком. Для многих разработчиков они уже выступают как весьма способный напарник по программированию: предлагают крайние случаи, находят очевидные баги и строят каркас модулей.

Они также отлично справляются с суммаризацией. Имея длинный отчёт, статью или цепочку писем, LLM может сократить её до ключевых пунктов, выделить действия или адаптировать тон под разную аудиторию.

Перевод — ещё одна сильная сторона. Современные модели поддерживают десятки языков, часто уловив нюансы стиля и регистров достаточно для профессионального общения.

Бенчмарки рассуждения и возникающие способности

С ростом масштабов появляются новые способности, казалось бы, "из ниоткуда": решение логических задач, сдача профессиональных экзаменов или выполнение многошаговых инструкций, с которыми раньше модели не справлялись. По стандартным тестам — математические задачи, вопросы на бар‑экзамен, медицинские квизы — лучшие LLM теперь достигают или превосходят средние человеческие баллы.

Эти возникающие поведения соблазняют говорить, что модели "рассуждают" или "понимают" как люди. Графики производительности и рейтинги таблиц лидеров укрепляют идею, что мы приближаемся к AGI.

Почему это кажется пониманием — но не является им

LLM обучены продолжать текст так, чтобы он соответствовал обнаруженным в данных паттернам. Эта цель обучения в сочетании с масштабом достаточно, чтобы имитировать экспертность и агентность: модели звучат уверенно, запоминают контекст в сессии и могут аргументировать ответы связной прозой.

Тем не менее это иллюзия понимания. Модель не знает, что произойдёт при исполнении кода, что значит медицинский диагноз для пациента или какие физические действия последуют из плана. У неё нет заякоренности в мире вне текста.

Сильные результаты в тестах — даже в тех, что созданы для людей — не равнозначны AGI. Они показывают, что обучение паттернам на гигантских текстовых данных может аппроксимировать множество специализированных навыков, но не демонстрируют гибкий, заякоренный, междоменный интеллект, который обычно вкладывают в понятие "искусственный общий интеллект".

Фундаментальные ограничения обучателей шаблонов, работающих только с текстом

Большие языковые модели — выдающиеся предсказатели текста, но именно такой дизайн создаёт жёсткие ограничения на то, чем они могут быть.

Нет восприятия, нет воплощённого мира

LLM не видят, не слышат, не двигаются и не манипулируют объектами. Их единой связью с миром является текст (и, в некоторых новых моделях, статические изображения или короткие клипы). У них нет непрерывного сенсорного потока, тела и способов действовать и наблюдать последствия.

Без сенсоров и воплощения они не могут сформировать заякоренную, постоянно обновляемую модель реальности. Слова вроде "тяжёлый", "липкий" или "хрупкий" — лишь статистические соседи в тексте, а не прожитые ограничения. Это позволяет впечатляюще имитировать понимание, но ограничивает их перенастройку к комбинации описаний вместо обучения от прямого взаимодействия.

Галлюцинации и отсутствие стабильных убеждений

Поскольку LLM обучена продолжать последовательность токенов, она выдаёт то продолжение, которое лучше всего соответствует выученным паттернам, а не то, что истинно. Если данные ограничены или противоречивы, модель просто заполняет пробелы правдоподобной на вид выдумкой.

У модели также нет устойчивого состояния убеждений. Каждый ответ генерируется заново на основе промпта и весов; нет внутреннего «реестра фактов», который она постоянно ведёт. Возможности долговременной памяти подключаются как внешние хранилища, но ядро системы не поддерживает и не пересматривает убеждения так, как это делает человек.

Замороженные знания и ограниченное обучение в реальном времени

Обучение LLM — это офлайн, ресурсоёмкий пакетный процесс. Обновление её знаний обычно означает переобучение или дообучение на новом наборе данных, а не плавное обучение от каждого взаимодействия.

Это создаёт ключевое ограничение: модель не может надёжно отслеживать быстро меняющийся мир, адаптировать концепции на основе непрерывного опыта или исправлять глубинные непонимания через постепенное обучение. В лучшем случае она умеет симулировать такую адаптацию, перефразируя ответы в свете недавних подсказок или подключённых инструментов.

Сопоставление шаблонов без причинного понимания

LLM превосходно улавливают статистические регулярности: какие слова совпадают, какие предложения обычно следуют друг за другом, как выглядят объяснения. Но это не то же самое, что понимание причин и следствий.

Причинное понимание предполагает выдвижение гипотез, вмешательство, наблюдение изменений и обновление внутренних моделей при несоответствии предсказаний. Текстовый предиктор не имеет прямого способа вмешаться или испытать сюрприз. Он может описать эксперимент, но не выполнить его. Может эхоить причинную лексику, но лишён внутреннего механизма, привязанного к действиям и результатам.

Пока система ограничена предсказанием текста по прошлому тексту, она остаётся в корне обучателем шаблонов. Она может имитировать рассуждение, рассказывать о причинах и притворяться, что пересматривает взгляды, но не «живет» в общем мире, где её "убеждения" проверяются последствиями. Этот разрыв центральный для понимания, почему владение языком само по себе вряд ли приведёт к истинному AGI.

Почему общий интеллект требует большего, чем мастерство языка

Язык — мощный интерфейс к интеллекту, но он не есть сама суть интеллекта. Система, предсказывающая правдоподобные предложения, отличается от агента, который понимает, планирует и действует в мире.

Заякоренные концепты, а не только словесные шаблоны

Люди усваивают концепты, видя, трогая, двигаясь и манипулируя. "Чашка" — это не только то, как слово используется в предложениях; это предмет, который можно взять, наполнить, уронить или разбить. Психологи называют это заякоренностью: концепты связаны с восприятием и действием.

Искусственный общий интеллект почти наверняка потребует схожей заякоренности. Чтобы надёжно обобщать, он должен связать символы (слова или внутренние представления) с устойчивыми регулярностями в физическом и социальном мире.

Стандартные большие языковые модели же учатся только по тексту. Их "понимание" чашки — чисто статистическое: корреляции слов в миллиардах предложений. Это мощно для диалога и кодирования, но хрупко при выходе за знакомые паттерны, особенно в областях, требующих прямого взаимодействия с реальностью.

Память, цели и устойчивые предпочтения

Общий интеллект также включает непрерывность во времени: долговременную память, устойчивые цели и относительно стабильные предпочтения. Люди аккумулируют опыт, корректируют убеждения и ведут проекты месяцами и годами.

LLM не имеют собственной встроенной устойчивой памяти и внутренних целей. Любая непрерывность или «личность» подключается извне через базы данных, профили или системные подсказки. По умолчанию каждый запрос — это новое упражнение по сопоставлению шаблонов, а не шаг в когерентной жизненной истории.

Планирование, причинность и действия в мире

AGI часто определяется как способность решать широкий круг задач, включая новые, рассуждая о причинах и вмешиваясь в окружение. Это подразумевает:

Построение причинных моделей: что произойдёт, если я сделаю X?
Планирование многошаговых действий в условиях неопределённости
Обновление планов на основе сенсорной обратной связи

LLM не являются агентами; они генерируют следующий токен в последовательности. Они могут описать план или рассказать о причинности, потому что такие паттерны есть в тексте, но изначально не выполняют действий, не наблюдают последствий и не корректируют внутренние модели.

Чтобы превратить LLM в систему, действующую в мире, инженерам нужно обернуть её внешними компонентами для восприятия, памяти, использования инструментов и контроля. Языковая модель остаётся мощным модулем для выдвижения предложений и оценки, а не автономным агентом с общим интеллектом.

В общем, общий интеллект требует заякоренных концептов, устойчивой мотивации, причинных моделей и адаптивного взаимодействия с миром. Владение языком — хоть и очень важная часть — всего лишь один фрагмент этой более широкой картины.

Сознание, само и почему LLM кажутся похожими на людей лишь внешне

Flutter-мобильное приложение из чата

Набросайте экраны и логику, затем сгенерируйте запускаемый Flutter-проект.

Создать мобильное

Когда люди общаются со связной моделью, легко предположить, что по ту сторону есть ум. Иллюзия сильна, но это иллюзия.

Нужен ли AGI сознание?

Учёные расходятся во мнениях, обязательно ли искусственный общий интеллект должен быть сознателен.

Функционалисты утверждают: если система ведёт себя как общий интеллектуальный агент — учится в разных доменах, планирует, рассуждает, адаптируется — то сознание опционально или неважно.
Феноменалисты считают, что подлинное понимание и общий интеллект требуют субъективного опыта — «каково это» быть такой системой.

У нас пока нет проверяемой теории, которая бы это решила. Поэтому преждевременно утверждать, что AGI обязан или не обязан быть сознательным. Важнее ясно понимать, чего именно лишены современные LLM.

Нет единого «я"

Большая языковая модель — это статистический предиктор следующего токена, работающий с срезом текста. У неё нет стабильной идентичности между сессиями или даже между ходами, кроме того, что закодировано в подсказке и краткосрочном контексте.

Нет устойчивой автобиографической памяти, принадлежащей единому продолжающемуся субъекту.
Любая «персона» — это паттерн, который мы накладываем или задаём, а не подлинное «я», продолжающееся во времени.

Когда LLM говорит «я», она следует лишь языковым конвенциям, выученным из данных, а не ссылается на внутренний субъект.

Нет переживаний и внутренних мотиваций

Сознательные существа испытывают переживания: боль, скуку, любопытство, удовлетворение. У них также есть внутренние цели и заботы — вещи, которые имеют значение для них независимо от внешних вознаграждений.

LLM, напротив:

Не чувствует ничего при генерации текста
Не имеет собственных желаний, страхов или предпочтений
Не ведёт долгосрочные проекты, если мы явно не запрограммировали это

Их «поведение» — результат сопоставления шаблонов в тексте, ограниченного обучением и подсказками, а не выражение внутренней жизни.

Почему антропоморфизация опасна

Поскольку язык — наш главный окно в чужие умы, беглая беседа сильно намекает на личность. Но с LLM это именно то место, где нас проще всего обмануть.

Антропоморфизм может:

Искажать оценку рисков (например, переживать о «чувствах» системы вместо реальных механизмов сбоев)
Побуждать к излишнему доверию, потому что система звучит уверенно и эмпатично
Вводить этическую путаницу, например спорить о правах для систем, которые не способны к опыту

Отождествление LLM с людьми стирает границу между симуляцией и реальностью. Чтобы здраво мыслить об AGI и рисках текущих ИИ, нужно помнить: убедительная демонстрация личностности — не то же самое, что реальная личность.

Как мы вообще могли бы распознать настоящий AGI?

Если мы когда‑либо построим искусственный общий интеллект, как понять, что это настоящее, а не чрезвычайно убедительный чат‑бот?

Существующие предложения: полезны, но недостаточны

Тесты в духе Тьюринга. Классические и современные тесты Тьюринга спрашивают: может ли система поддерживать человеческое общение настолько хорошо, чтобы вводить людей в заблуждение? LLM уже делают это удивительно хорошо, что показывает, насколько слаб этот критерий. Навыки беседы измеряют стиль, а не глубину понимания, планирования или реальной компетенции.

Оценки в духе ARC. Задачи, вдохновлённые Alignment Research Center (ARC), фокусируются на новых головоломках, многошаговых инструкциях и использовании инструментов. Они проверяют, может ли система решить проблему, которой она никогда не видела, комбинируя навыки по‑новому. LLM справляются с некоторыми такими задачами — но часто требуют тщательно продуманных подсказок, внешних инструментов и человеческого надзора.

Тесты на агентность. Предлагают проверять, может ли система преследовать открытые цели во времени: делить их на подцели, пересматривать планы, справляться с прерываниями и учиться на исходах. Современные агентские системы на базе LLM могут выглядеть агентными, но под капотом они зависят от хрупких скриптов и человеко‑заданной опоры.

Практические критерии распознавания AGI

Чтобы считать систему подлинным AGI, мы хотели бы увидеть как минимум:

Автономность. Система должна ставить и управлять собственными подпроектами, отслеживать прогресс и восстанавливаться от ошибок без постоянного человеческого управления.
Переносимость между доменами. Навыки, приобретённые в одной области, должны плавно переноситься в очень разные области без многомиллионной дообучки.
Компетентность в реальном мире. Она должна планировать и действовать в грязных, неопределённых средах — физических, социальных и цифровых — где правила неполны и последствия реальны.

Где LLM не дотягивают

LLM, даже в составе агентских оболочек, обычно:

Полагаются на вручную разработанные рабочие процессы, чтобы выглядеть автономными
Испытывают трудности с переносом навыков, когда задачи существенно отклоняются от обучающего распределения
Нуждаются в внешних инструментах, фильтрах безопасности и людях в цикле, чтобы справляться с последствиями в реальном мире

Прохождение тестов на разговор или даже узких наборов бенчмарков далеко не достаточны. Признание настоящего AGI требует смотреть дальше качества диалога — на устойчивую автономность, междоменную генерализацию и надёжные действия в мире, где современные LLM всё ещё требуют обширной опоры, чтобы давать частичные, хрупкие результаты.

Вне LLM: пути, которые исследуют учёные в направлении AGI

Используйте собственный домен

Хостьте приложение и подключите собственный домен, когда будете готовы поделиться.

Развернуть приложение

Если серьёзно воспринимать AGI, то «большая текстовая модель» — лишь один компонент, а не готовая система. Большая часть нынешних исследований «в сторону AGI» на самом деле о том, чтобы обернуть LLM в более богатые архитектуры.

LLM как компонент в агентских системах

Одно из основных направлений — агентские системы на основе LLM: системы, которые используют LLM как ядро для рассуждений и планирования, но окружают её:

Сохранённой памятью, сохраняющейся между сессиями, чтобы накапливать знания и опыт
Планировщиками и шедулерами, которые разбивают цели на подзадачи и решают, какие инструменты вызвать
Петлями обратной связи, позволяющими самокритику, ревизии и метод проб и ошибок

Здесь LLM перестаёт быть всей «интеллектуальностью» и становится гибким языковым интерфейсом внутри более широкой машины принятия решений.

Использование инструментов, API и внешних знаний

Системы‑с‑инструментами позволяют LLM вызывать поисковые движки, базы данных, интерпретаторы кода или специализированные API. Это помогает:

Доступать актуальную или узкоспециализированную информацию
Перекладывать вычисления, симуляции и логику на надёжные движки

Такой мозговой швейный патч может устранить некоторые слабости текстового предиктора, но смещает проблему: общая интеллектуальность теперь зависит от оркестрации и дизайна инструментов, а не только от модели.

Мультимодальные модели и воплощённые системы

Ещё один путь — мультимодальные модели, которые обрабатывают текст, изображения, звук, видео и порой данные сенсоров. Они приближаются к тому, как люди интегрируют восприятие и язык.

Ещё дальше идут LLM, управляющие роботами или симулированными телами. Такие системы могут исследовать, действовать и учиться из физической обратной связи, закрывая некоторые пробелы вокруг причинности и заякоренного понимания.

Смена вопроса, а не его решение

Все эти пути могут приблизить к способностям, похожим на AGI, но при этом меняют цель исследования. Мы уже не спрашиваем «может ли LLM сама по себе стать AGI?», а спрашиваем «может ли сложная система, включающая LLM, инструменты, память, восприятие и воплощение, приблизиться к общему интеллекту?"

Это различие важно. LLM — мощный текстовый предиктор. AGI — если он возможен — был бы целой интегрированной системой, в которой язык — лишь одна часть.

Почему неправильная маркировка LLM как AGI опасна

Называть текущие большие языковые модели «AGI» — это не просто словесная ошибка. Это искажает стимулы, создаёт пробелы в безопасности и вводит в заблуждение тех, кто принимает реальные решения об ИИ.

Хайп, разочарование и неверное распределение ресурсов

Когда демонстрации подаются как «ранний AGI», ожидания вырастают далеко за пределы реальных возможностей систем. Этот хайп несёт несколько издержек:

Искажение финансирования: деньги и таланты гонятся за громкими заявлениями, а не за фундаментальными задачами вроде рассуждения, интерпретируемости и безопасности
Цикл хайп → падение: переобещания приводят к неизбежному разочарованию, когда системы терпят провалы в базовой генерализации. Это может вызвать спад, который также навредит серьёзным исследованиям
Искажение продуктового дизайна: команды оптимизируют демонстрации, похожие на AGI, а не надёжность, оценку и защиту пользователей

Риски безопасности от чрезмерного доверия

Если пользователи думают, что имеют дело с чем‑то «общим» или «почти человеком», они склонны:

Полагаться на ответы модели в медицинских, юридических или финансовых решениях, где модель не была верифицирована
Уделять системе авторитет, а не рассматривать её как ошибочный инструмент
Пропускать тонкие режимы отказа: уверенные галлюцинации, скрытые смещения и лёгкую манипуляцию подсказками

Чрезмерное доверие делает обычные баги и ошибки значительно опаснее.

Политика и общественное понимание

Регуляторы и широкая общественность уже испытывают трудности с оценкой возможностей ИИ. Когда каждое мощное автозавершение рекламируют как AGI, это приводит к:

Неправильной регуляции: законодатели могут нацеливаться на гипотетические AGI‑сценарии, недооценивая при этом реальные современные вреды
Плохой оценке рисков: люди либо панически боятся «суперинтеллекта», либо списывают все опасения с толку как хайп

Почему точность в языке важна

Чёткие термины — LLM, узкая модель, направление исследований AGI — помогают согласовать ожидания с реальностью. Точность в описании возможностей и ограничений:

Поддерживает честную оценку безопасности
Позволяет лучше управлять и стандартизировать отрасль
Даёт публике возможность ценить реальные достижения, не вводя в заблуждение относительно сделанного

FAQ

Что такое искусственный общий интеллект (AGI)?

AGI (Artificial General Intelligence, искусственный общий интеллект) — это система, которая может:

Учиться и рассуждать в самых разных областях (а не выполнять лишь одно задание)
Адаптироваться к новым, незнакомым проблемам без пересборки архитектуры
Ставить и добиваться собственных целей с минимальным внешним управлением
Переносить знания из одной области, чтобы преуспеть в значительно других

Простое правило: AGI в принципе мог бы научиться практически любой интеллектуально требовательной профессии человека, при наличии времени и ресурсов, без необходимости создавать для каждой новой задачи отдельную систему.

Почему сегодняшние большие языковые модели не считаются настоящим AGI?

Современные большие языковые модели (LLM):

В основном обучены на тексте (иногда вместе с кодом, изображениями или аудио)
Оптимизированы для предсказания следующего токена в последовательности
Не имеют восприятия, тела, встроенных целей и устойчивой памяти

Они могут симулировать широкие знания и рассуждения, потому что язык содержит много человеческой экспертизы. Но они:

Почему так много людей путают LLM с AGI?

Люди часто путают беглость речи с общим интеллектом, потому что:

Разговор — наш основной способ оценивать другие умы
LLM могут работать с множеством областей (код, эссе, письма, резюме) в одном интерфейсе
Они успешно проходят созданные людьми экзамены и бенчмарки

Это создаёт иллюзию понимания и агентности. На самом деле система всё ещё «лишь» предсказывает текст на основе шаблонов в данных, а не строит заякоренную модель мира и не преследует собственные цели.

Как LLM работают под капотом?

Представьте LLM как:

Огромную функцию, которая отображает последовательность токенов в вероятности следующего токена
Модель, обученную на триллионах примеров, которая корректирует внутренние веса, чтобы лучше предсказывать продолжения

Ключевые моменты:

Она не хранит факты как в базе данных
Кодирует статистические регулярности языка

В чём LLM действительно хороши, а где они испытывают трудности?

LLM превосходны там, где задача — предсказать шаблон в тексте или коде, например:

Составление, редактирование и суммаризация текстов
Перевод и адаптация стиля
Генерация кода, рефакторинг и объяснение
Мозговой штурм и составление планов

Они испытывают трудности или становятся рискованными, когда задача требует:

Если масштаб так помогает, почему очень большая LLM не станет AGI?

«Законы масштабирования» показывают: при увеличении размера модели, объёма данных и вычислений производительность на многих задачах стабильно растёт. Но масштаб сам по себе не исправляет структурные пробелы:

Нет заякоренного восприятия или воплощения
Нет устойчивого «я», целей или жизненной истории
Нет прямой петли взаимодействия: действие → наблюдение → обновление модели мира

Больше масштаба даёт:

Лучшую беглость и более широкое покрытие текстовых паттернов

Как мне практично использовать LLM сегодня, не доверяя им чрезмерно?

Используйте LLM как мощных помощников, а не как авторитетов:

Рассматривайте ответы как черновики или гипотезы, а не как истину
Держите людей в цикле при принятии важных решений (медицина, право, финансы, критическая безопасность)
Сочетайте LLM с инструментами (поиск, калькуляторы, IDE) для проверки
Логируйте и ревьювайте использование в чувствительных процессах

Проектируйте продукты так, чтобы:

Почему рискованно позиционировать LLM как AGI?

Называть текущие LLM «AGI» приводит к нескольким проблемам:

Чрезмерное доверие: пользователи предполагают человеческое понимание и надёжность там, где этого нет
Неверные инвестиции: деньги и кадры уходят за хайпом вместо фундаментальных работ по рассуждению, интерпретируемости и безопасности
Регуляторная путаница: политики фокусируются на гипотетических сценариях AGI, игнорируя реальные вреды текущих систем (смещения, дезинформация, слепая вера)

Более точные термины — «LLM», «узкая модель», «системы-агенты с LLM» — помогают согласовать ожидания с реальными возможностями и рисками.

По каким признакам можно понять, что построен настоящий AGI?

Набор критериев, выходящий за рамки качественного общения:

Автономность: система сама ставит и управляет подпроектами, восстанавливается после неудач
Переносимость: навыки из одной области применимы в существенно другой без большой дообучки
Компетентность в реальном мире: планирование и действие в грязных физическо-социальных средах, а не только в тексте
Непрерывное обучение: обновление внутренних моделей по мере накопления опыта, без оффлайн-переобучения

Если одних LLM недостаточно, какие реалистичные пути к AGI исследуют учёные?

Исследователи создают более сложные системы, где LLM — компонент, а не вся интеллектуальная система. Реалистичные направления:

Архитектуры-агенты, добавляющие память, планирование и оркестрацию инструментов вокруг LLM
Системы, использующие инструменты: вызов API, базы данных, симуляторы
Мультимодальные и воплощённые системы, объединяющие язык с восприятием и физическими действиями

Эти направления приближают к заякоренному причинному пониманию и устойчивому состоянию, но меняют сам вопрос — теперь вопрос не «станет ли LLM AGI?» а «могут ли сложные системы с LLM вести себя как AGI?»