Компания Google представила новую версию искусственного интеллекта под названием Gemini. Она набрала 90,0 % в тесте MMLU (понимание языка в условиях многозадачности) против 89,8 % у людей и 86,4 % у GPT-4 по набору из 57 прикладных и фундаментальных наук. В соревнованиях по программированию от Codeforces этот ИИ опередил 87 % всех участников.
По заявлению создателей Gemini, ему подвластны любые задачи, которые люди решают при помощи мозга. ИИ построен по мультимодальной архитектуре, поэтому он не сводит все виды информации к общему коду, а воспринимает их со всеми характерными особенностями. Он не просто понимает слова и музыку из песни, но и может оценить их красоту, глубину творческой задумки, сложность исполнения. А потом постараться выразить все это в ином формате.
Gemini работает со всеми видами данных, доступных человеку, а в перспективе и больше. Этот ИИ умеет разделять себя на части и делегировать им разные функции – одна творит, вторая ее контролирует. Но в этом его главный минус: интуиция Gemini недоступна, поэтому для решения типовой задачи он создает от полумиллиона вариантов и больше, а потом скрупулезно выбирает из них лучший. Нетрудно представить, какой объем вычислительной мощности требуется для его работы.
В настоящее время можно поработать с модификацией Gemini Pro, но в урезанной версии. Вариант Gemini Nano устанавливается на мобильные устройства, он уже доступен на смартфоне Pixel 8 Pro. Наиболее производительная версия Gemini Ultra выйдет не ранее, чем ее тщательно протестируют на ошибки и безопасность. Предполагается, что в недалеком будущем Gemini станет базовой опцией во всех продуктах Google.