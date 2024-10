Теперь, когда афера с медузой, набитой большими данными – тонет, то же самое стали публично** говорить ученые, занимавшиеся темой ИИ. Сначала частные лица (Ян Лекун и Фей-Фей Ли), а теперь уже и команды. Так, команда ИИ-экспертов Apple выступила на techcrunch.com с таким анонсом:

"Как модели машинного обучения делают то, что они делают? И действительно ли они «думают» или «рассуждают» так, как мы понимаем эти вещи? Это философский вопрос в той же степени, что и практический, но новая статья, появившаяся в пятницу, предполагает, что ответ, по крайней мере на данный момент, довольно однозначный: «нет»."

Конспективно, о чем они сказали:

Группа ученых-исследователей ИИ в Apple опубликовала свою статью «Понимание ограничений математического рассуждения в больших языковых моделях» для общего обсуждения в четверг. Хотя более глубокие концепции символического обучения и воспроизведения шаблонов немного запутаны, базовую концепцию их исследования очень легко понять.

Допустим, я попросил вас решить простую математическую задачу, например, такую:

Оливер собирает 44 киви в пятницу. Затем он собирает 58 киви в субботу. В воскресенье он собирает вдвое больше киви, чем в пятницу. Сколько киви у Оливера?

Очевидно, ответ 44 + 58 + (44 * 2) = 190. Хотя большие языковые модели (LLM) на самом деле несовершенны в арифметике, они могут довольно надежно решать что-то вроде этого. Но что, если я добавлю немного случайной дополнительной информации, например:

Оливер выбирает 44 киви в пятницу. Затем он выбирает 58 киви в субботу. В воскресенье он выбирает вдвое больше киви, чем в пятницу, но пять из них были немного меньше среднего. Сколько киви у Оливера?

Это та же самая математическая задача, верно? И, конечно, даже ученик начальной школы знал бы, что даже маленький киви все равно остается киви. Но, как оказалось, эта дополнительная точка данных сбивает с толку даже самых современных LLM. Вот мнение GPT-o1-mini:

[О] В воскресенье 5 из этих киви были меньше среднего. Нам нужно вычесть их из воскресной суммы: 88 (воскресные киви) – 5 (меньшие киви) = 83 киви

Это всего лишь простой пример из сотен вопросов, которые исследователи слегка изменили, но почти все из них привели к огромному снижению показателей успешности для моделей, которые пытались их решить.

Итак, почему это должно быть так? Почему модель, которая понимает проблему, так легко может быть сбита с толку случайной, не относящейся к делу деталью? Исследователи предполагают, что этот надежный способ отказа означает, что модели на самом деле вообще не понимают проблему. Их обучающие данные позволяют им отвечать правильным ответом в некоторых ситуациях, но как только требуется малейшее фактическое «рассуждение», например, считать ли маленькие киви, они начинают выдавать странные, абсурдные результаты.

Вот что пишут исследователи в своей статье:

[Мы] исследуем хрупкость математических рассуждений в этих моделях и демонстрируем, что их производительность значительно ухудшается по мере увеличения количества предложений в вопросе. Мы предполагаем, что это снижение связано с тем, что нынешние LLM не способны к действительному логическому рассуждению. Вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в их обучающих данных.

…Такие дела…

Александр Розов

Комментарий редакции

Основные тезисы:

1. Автор ещё в 2019 году высказывал скептицизм относительно современного подхода к ИИ, утверждая что методологически он не продвинулся дальше идей Розенблатта 1950-х годов.

2. Современный подход к ИИ описывается как "медуза, набитая большими данными" – то есть системы, которые в основном занимаются сбором и примитивным анализом больших данных.

3. Исследователи из Apple провели эксперименты, показывающие серьёзные ограничения языковых моделей:

– ИИ может решать простые математические задачи

– Но при добавлении незначительных, нерелевантных деталей в задачу, модели начинают давать неверные ответы

– Это указывает на отсутствие реального понимания и рассуждения

4. Известные эксперты в области ИИ (Ян Лекун, Фей-Фей Ли) также начали публично высказывать сомнения в текущем направлении развития ИИ.

Вывод:

Статья указывает на фундаментальную проблему в современном подходе к искусственному интеллекту. Несмотря на впечатляющие результаты в некоторых областях, современные ИИ-системы не обладают реальной способностью к рассуждению и пониманию. Вместо этого они работают на основе распознавания паттернов из обучающих данных, что делает их крайне уязвимыми даже к незначительным изменениям в задачах. Это ставит под сомнение текущий путь развития ИИ и указывает на необходимость пересмотра фундаментальных подходов к созданию искусственного интеллекта.

Расширенный вывод:

Современные генеративные модели представляют собой специализированный инструмент, который успешно имитирует лишь одну из граней человеческого интеллекта – способность к быстрому распознаванию паттернов и генерации ответов на основе аналогий. Это объясняет как их впечатляющие успехи в определённых областях, так и их фундаментальные ограничения.

Человеческий разум работает в двух принципиально разных режимах. Первый – это быстрое интуитивное мышление, основанное на распознавании паттернов и поиске аналогий. Именно эту функцию успешно реализуют современные генеративные модели, что делает их эффективными в задачах обработки естественного языка, распознавания образов и работы с большими массивами данных. Второй режим – это логическое, алгоритмическое мышление, требующее последовательного анализа и рассуждений. Эта способность находится за пределами возможностей современных нейросетевых архитектур, которые по своей природе не предназначены для строгих логических операций.

Важно понимать, что это не является недостатком генеративных моделей – это их естественное свойство, определяемое самой архитектурой. Для решения строго логических задач существуют классические алгоритмические подходы, которые успешно применяются в компьютерных системах уже много десятилетий.

Особого внимания заслуживает вопрос целеполагания и принятия решений. Эта функция требует не только обработки информации, но и понимания контекста, этических норм, долгосрочных последствий – всего того, что составляет человеческую мудрость и ответственность. Передача этих полномочий автоматизированным системам, даже самым продвинутым, несёт в себе серьёзные риски.

Таким образом, разумный подход заключается в использовании генеративных моделей как специализированного инструмента там, где они действительно эффективны – в задачах распознавания паттернов и обработки информации. При этом логическое мышление, алгоритмическое решение задач и, что особенно важно, принятие ключевых решений должны оставаться в компетенции человека. Это позволит максимально эффективно использовать сильные стороны как искусственных систем, так и естественного интеллекта.