Открыт способ установить нижнюю границу энергозатрат произвольных вычислительных процессов

Это новая глава для новой физики, без которой не появится СуперИИ

Сергей Карелов
3 min readMay 31, 2024

• Рост интеллектуальных способностей генеративного ИИ на основе больших языковых моделей определяется их масштабированием.

• А рост масштаба моделей требует роста вычислительной мощности оборудования, на котором модели работают.

• Однако, с ростом вычислительной мощности существует фундаментальная термодингамическая засада — принцип Ландауэра (предельно упрощая, этот принцип утверждает, что для выполнения вычислений необходимо расходовать энергию; и чем больше произвести вычислений, тем больше будет произведено тепла).

• Если преодолеть это термодинамическое ограничение компьютеров, станет возможным создание все более мощных вычислительных систем для все более мощных моделей генеративного ИИ.

• Более того. Преодоление этого термодинамического ограничения может открыть путь к построению оборудования, столь же энергоэффективного, как биологические вычислительные системы (напр. мозг), чья энергоэффективность в 100 000 выше компьютеров.

Но чтобы преодолеть термодинамическое ограничение компьютеров, нужна «Новая физика», пересматривающая физику вычислений на кроссдисциплинарном стыке неравновесной физики и теории вычислений.

Этим и занимается уже 10 лет проф. Дэвид Волперт.

Профессор Дэвид Волперт. Фото: https://patrickstrattner.com/PORTFOLIO/SANTA-FE-INSTITUTE/6

✔️ В 2018 группа Волперта опубликовала одно из первых успешных приложений «Новой физики», описав на основе неравновесных методов скрытую сложность, казалось бы, простейшего процесса физического превращения бита из 1 в 0 (см. [1]). Это был прорыв. Но от понимания физики работы одного бита информации до понимания работы компьютера, как до Альфа-Центавра.

✔️ Новый прорыв произошел в 2020. Волперт и Колчинский опубликовали работу «Термодинамика вычислений со схемами», в которой был описан процесс масштабирования применения неравновесной физики от битов до схем (см. [2]). Это был второй прорыв. Но и он не позволял полноценно применить «Новую физику» к компьютерным вычислениям из-за их непредсказуемости.

Новый 3й прорыв произошел только что.

Волперт и трое его соавторов (физики и компьютерщики) расширили современную теорию термодинамики вычислений. Объединив подходы статистической физики и информатики, они представили математические уравнения, которые показывают минимальные и максимальные прогнозируемые энергетические затраты вычислительных процессов, зависящих от случайности, которая является мощным инструментом в современных компьютерах.

Такого рода вычислительных процессов в компьютерах сколько угодно. Например, — процессы с непредсказуемым завершением.

Представьте мой любимы пример — симулятор игры в “Монету Питерса” (см. [3] или [4]). И допустим, при подбрасывании монеты дано указание прекратить подбрасывание, как только выпадут 100 орлов. Нетрудно понять, что момент останова симулятора случаен, и потому он будет непредсказуем для разных попыток.

Новый прорыв оказался возможным в результате объединения теоретических выводов предыдущих работ Волперта с теорией мартингалов (случайных последовательностей или процессов, которые в будущем остаются постоянными в среднем).

Работа «Термодинамика вычислений с абсолютной необратимостью, однонаправленными переходами и стохастическим временем вычислений» опубликована в Physical Review X (апрель-июнь 2024) [5]

1 https://t.me/theworldisnoteasy/511

2 https://t.me/theworldisnoteasy/1087

3 https://www.patreon.com/posts/lovushka-tselei-100101870

4 https://boosty.to/theworldisnoteasy/posts/9b90b927-dea0-4e3f-b010-e7570ae1d9c1

5 https://journals.aps.org/prx/abstract/10.1103/PhysRevX.14.021026

--

--

Сергей Карелов

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации