Близнецы Homo sapiens за 2 месяца повзрослели на 2 года
К лету они достигнут совершеннолетия, и мир изменится
Мой декабрьский пост «Стохастический попугай умер. Да здравствуют близнецы Homo sapiens!» про кардинальный прорыв в мультимодальном понимании мира языковыми моделями (на примере модели Gemini — «Близнецы» от DeepMind) некоторыми был воспринят с недоверием и даже с изрядным скепсисом. Мол, это все ловкость рук авторов демо-ролика, и на самом деле, модель ничего такого не может.
Спустя 2 мес опубликован техотчет, не оставляющий места сомнениям. Модель не только «это может», но теперь может и еще кое-что впечатляющее. Будто за пару мес «Близнецы» повзрослели, минимум, на пару лет.
Смотрите сами. Это впечатляет.
Вот пример, когда модель по рисунку типа каляка-маляка находит изображенную на нем сценку в 1382-страничном романе Гюго “Отверженные”.
А это пример с пониманием видео. На вход модели загрузили 44-х минутное видео. И задали вопросы на понимание сцен видео, текста и картинок.
На следующем видео показан эксперимент с моделью на этом примере.
________________________________
Ваши шансы увидеть мои новые посты быстро уменьшатся до нуля, если вы не лайкаете, не комментируете и не делитесь в соцсетях.