Кубик Рубика давно перестал быть просто головоломкой. Его используют как универсальную метафору сложных систем без очевидных решений – от политики и управления до социальных процессов и человеческого интеллекта. Уже более полувека этот простой на вид объект остается символом задачи, требующей анализа, терпения и системного мышления.
Почти сразу после своего появления кубик Рубика привлек внимание пионеров ИИ. Уже в начале 1980-х математики и программисты увидели в нем идеальный формализованный дискретный мир: со строгими правилами и гигантским пространством поиска.
В этой статье я прослежу эволюцию исследований кубика Рубика – от первых алгоритмических решений 1980-х годов до современных подходов машинного обучения – и покажу, как эта уникальная головоломка повлияла на развитие искусственного интеллекта.
В марте 1981 года в журнале Scientific American Дуглас Хофштадтер, американский физик и информатик, исследователь сознания и искусственного интеллекта, популяризатор науки, опубликовал большую статью о «Волшебном кубе». На обложке был представлен компьютерно-сгенерированный рендер кубика Рубика, на котором один угловой кубик (cubie) повернут на 120° по часовой стрелке, а все остальные элементы остаются в стартовой (собранной) позиции. Такое состояние физически невозможно на реальном кубике, и редакторы журнала условно назвали его «кварком». Но если на диагонально противоположном углу находится кубик, повернутый в противоположную сторону (−120°, «антикварк»), конфигурация становится достижимой.
Этот рендер создали Дэвид Кристман и Бернард Гринберг на Lisp-машине – специализированном компьютере, разработанном в лаборатории искусственного интеллекта Массачусетского технологического института (MIT AI Laboratory). Программа позволяла просматривать кубик с любого ракурса, выполнять произвольные повороты граней, воссоздавать любые достижимые конфигурации и тестировать алгоритмы трансформации состояний. По сути, это был один из первых интерактивных цифровых симуляторов среды Rubik’s Cube: состояние – действие – новое состояние – структура, очень похожая на современные среды для обучения с подкреплением (reinforcement learning – RL).
В тот же период появились и первые серьезные алгоритмические результаты. В 1981 году британский математик, специалист в области теории узлов и теории групп Морвен Тистлетвэйт разработал четырехступенчатый алгоритм разложения пространства состояний кубика Рубика на подпространства и доказал, что любой кубик 3×3×3 можно решить не более чем за 52 хода в метрике поворотов граней (Face Turn Metric, FTM) – это была первая строгая верхняя граница числа ходов для решения любой конфигурации, позже ставшая частью истории определения «числа Бога», или God’s Number.
В 1990-е годы кубик стал полноценным полигоном для классического ИИ. Исследователи последовательно снижали верхние границы решения: до 42 ходов, затем до 39, 37, 28 и 27, а в 2007 году американские математики Даниэль Кункле и Джин Куперман с помощью суперкомпьютерных расчетов доказали, что достаточно 26 ходов и или меньше, чтобы решить любое состояние кубика Рубика.
В 1992 году немецкий математик Герберт Коцемба, имя которого сегодня стало нарицательным среди куберов, предложил двухфазный алгоритм решения кубика Рубика Kociemba’s Two-Phase Algorithm. Алгоритм работает по принципу «разделяй и властвуй». Сначала кубик приводится в специальное промежуточное состояние, где возможных ходов становится значительно меньше и поиск решения упрощается. Затем, уже в этом ограниченном пространстве, кубик доводится до полностью собранного вида. Такой двухшаговый подход стал одним из ранних примеров иерархического поиска — идеи, когда сложную задачу разбивают на уровни. Сегодня тот же принцип широко используется в робототехнике и обучении с подкреплением, где системы сначала решают подзадачи, а затем объединяют их в общее решение.
Двухфазный алгоритм Коцембы в последствии лег в основу программы Cube Explorer, способной находить оптимальные или близкие к оптимальным решения (≤ 20 ходов) для случайных конфигураций кубика за доли секунды на обычном компьютере. Благодаря сочетанию строгой теоретической базы и высокой практической эффективности алгоритм Коцембы по сей день используется в программных солверах, роботах-сборщиках и гибридных AI-системах, где нейросети отвечают за восприятие и управление, а классические методы поиска – за стратегическое планирование действий.
Следующий прорыв произошел в 1997 году, когда профессор Калифорнийского университета Ричард Корф применил к кубику Рубика алгоритм IDA* вместе с предвычисленными таблицами, где хранились минимальные расстояния от подпространств состояний до цели. Фактически это была точная, вручную построенная функция ценности: для данного состояния можно было оценить, какое минимальное число ходов нужно до решения. Именно такие функции сегодня нейросети учатся аппроксимировать в обучении с подкреплением.
В 2000-х годах Кубик Рубика стал объектом масштабных распределенных вычислений. Кульминацией этих работ стал проект Cube20 под руководством программиста из Пало-Алто Томаса Рокицки при участии Герберта Коцембы, а также профессора математики Морли Дэвидсона и инженера Google Джона Детриджа.
Пространство состояний кубика 3×3×3 было разбито на огромные группы похожих конфигураций — всего получилось около 2,2 миллиарда косетов. Затем исследователи воспользовались симметриями кубика: многие состояния на самом деле эквивалентны, если просто повернуть куб в руках. За счёт этого и с помощью методов оптимального покрытия количество реально разных случаев удалось сократить примерно до 55,9 миллиона. Совокупные вычисления заняли около 35 CPU-лет и выполнялись на мощностях Google. В июле 2010 года команда доказала, что число Бога для кубика Рубика равно 20 в метрике поворотов граней FTM. Это утверждение описывает не алгоритм решения, а диаметр графа состояний кубика (графа Кэли – математической основы кубика Рубика), то есть максимальное минимальное расстояние от любого состояния до решения.
Проект Cube20 фактически проверил все симметрически сокращенные подмножества состояний и убедился, что для каждого существует решение длиной ≤ 20 ходов. Это утверждение не просто алгоритм решения – оно описывает диаметр графа Кэли и окончательно устанавливает, что God’s Number = 20.
На рубеже 2010-х. Роботы-решатели
Параллельно с развитием алгоритмов решения развивались и физические роботы‑решатели (солверы). Например, робот RuBot II в середине 2000-х годов использовал камеру для сканирования конфигурации кубика, передавал изображение в программу на базе алгоритма Коцембы для вычисления последовательности ходов, а затем механически поворачивал грани, решая кубик за десятки секунд.
Роботы серии CubeStormer (Lego Mindstorms + смартфон) также применяли камеру телефона для визуального захвата состояния кубика и вычисления решения с помощью усовершенствованного двухфазного подхода, а затем поворачивали грани с помощью приводов – CubeStormer II решал головоломку приблизительно за 5,35 с, что в начале 2010-х годов стало мировым рекордом среди роботов‑солверов.
Для сравнения современные роботы решают кубик Рубика за десятые доли секунды. Робот разработчика из «Яндекса» Александра Кротова в 2024 году справился с задачей за 0,203 секунды. А уже в апреле 2025 года американские студенты из Purdue University переписали мировой рекорд – их робот собрал кубик Рубика вдвое быстрее за 0,103 секунды.
Настоящий сдвиг к современному глубокому машинному обучению произошёл в конце 2010-х годов. В 2018 году исследователи из Университета Калифорнии в Ирвайне предложили алгоритм DeepCube, в котором нейросеть училась собирать кубик с нуля — без готовых правил, подсказок и заранее подготовленных таблиц. Система начинала с уже собранного кубика и постепенно училась справляться с всё более запутанными состояниями.
В 2019 году эта же команда в журнале Nature Machine Intelligence представила улучшенную версию под названием DeepCubeA. В ней нейросеть обучалась около двух дней, сочетая обучение с подкреплением и классический поиск. В результате система смогла решать все тестовые конфигурации кубика 3×3×3, а примерно в 60% случаев находила оптимальное решение за 20 ходов — то есть почти всегда достигала теоретического предела сложности близкого к числу Бога.
Обе работы хорошо показывают, как эволюционировал подход этой команды: от экспериментов с обучением с подкреплением и обратным обучением — к полноценной системе, где нейросеть и поиск работают вместе и решают сложную дискретную задачу максимально эффективно. По сути, DeepCubeA научился приближённо оценивать «расстояние до решения» — ту самую функцию, которую раньше приходилось вручную рассчитывать или хранить в громоздких таблицах паттернов. Теперь эту роль выполняет нейросеть, обученная через RL и встроенная в алгоритм поиска. Это стало важным шагом для применения глубокого обучения к задачам с огромными дискретными пространствами состояний и редкими наградами — не только для кубика Рубика, но и для широкого класса комбинаторных задач.
В том же 2019 году OpenAI представила роборуку Dactyl, которая научилась физически собирать кубик Рубика. Нейросеть, обученная в симуляции с automatic domain randomization (ADR), отвечала за зрительное восприятие и точное управление пальцами, а планирование самой последовательности ходов оставалось классическим — на основе алгоритма Коцембы. Такой гибридный подход сегодня встречается всё чаще: нейросети берут на себя восприятие, моторику и низкоуровневое управление, а проверенные алгоритмы — стратегическое и долгосрочное планирование.
В 2020-е годы кубик стал тестовой площадкой для ещё более сложных систем ИИ. Появились воплощённые агенты (embodied AI), которые одновременно видят кубик, понимают текстовые инструкции и планируют реальные действия в окружающем мире. Такие системы уже не просто решают головоломку — они объединяют зрение, язык и физические действия в единый интеллект, способный действовать в открытой среде.
К середине 2020-х кубик остается актуальной задачей для прорывных методов ИИ. В последние пару лет исследования кубика Рубика переживают настоящий ренессанс, превращая эту классическую головоломку в один из ключевых бенчмарков для оценки интеллекта искусственных систем. Анализ публикаций на платформах arXiv, Google Scholar, ResearchGate и Semantic Scholar показывает резкий рост числа работ – особенно в 2024–2025 годах, когда количество препринтов и статей удвоилось по сравнению с предыдущими периодами. Доминирующей тенденцией стал переход к использованию кубика как тестовой среды для искусственного интеллекта и машинного обучения. Появились работы, где нейросети на основе диффузионных моделей оценивают расстояния между состояниями кубика и используют beam search для поиска коротких решений. Примеры включают ML-солверы, достигающие >98% оптимальности для кубика 3×3×3 и рекордно коротких решений для больших кубов 4×4×4 и 5×5×5, где традиционные алгоритмы сталкиваются с экспоненциальным ростом сложности. Появляются работы по обучению с подкреплением, где исследуются альтернативные способы поиска без сложных процедур выборки. Ряд исследователей использует кубик Рубика как тестовую среду с огромным количеством состояний для обучения с подкреплением на графах, в том числе применяют GFlowNets для дискретных графов, позволяя агентам учиться оптимально планировать действия в сложных комбинаторных задачах.
Вместе с тем, специализированные бенчмарки, такие как CubeBench, показывают, что современные языковые и мультимодальные модели плохо справляются с долгосрочным пространственным планированием: их успешность резко падает при горизонте более 8 ходов, а способность к самокоррекции и восстановлению после ошибок остается ограниченной.
Интерес исследователей говорит, что кубик Рубика эволюционировал от объекта чистой комбинаторной математики к универсальной среде для изучения физически-ориентированного интеллекта, пространственного мышления и долгосрочного планирования. Математические работы все чаще интегрируются с ИИ: от робототехники со специализированными vision-language моделями, такими как CubeRobot до междисциплинарных задач, таких как коллективный интеллект в сообществе спидкуберов и квантовый кубик Рубика.
Кубик Рубика прошел уникальный путь: от Lisp-машины MIT в 1981 году до embodied AI мультимодальных агентов 2020-х. Это одна из немногих моделей, на которой можно проследить всю эволюцию искусственного интеллекта.
Продолжаем наблюдать…
Источник


