Google Gemini: новая модель ИИ, которая может рассуждать и кодировать

Google Gemini: новая модель ИИ, которая может конкурировать с ChatGPT и Microsoft

В среду Google начал внедрение Gemini, своей новой модели искусственного интеллекта (ИИ), которая должна помочь ей более эффективно конкурировать с OpenAI (создателем ChatGPT) и Microsoft, начиная с потребительских приложений и заканчивая корпоративными вычислительными возможностями.

"Это наша самая последовательная, самая талантливая и самая общая модель ИИ", - заверил Элай Коллинз, вице-президент Google DeepMind, исследовательской лаборатории ИИ калифорнийской группы, во время презентации для прессы.

Затем он продемонстрировал видео, в котором пользователь показывает Gemini предметы, рисунки и видео. Система ИИ устно комментирует то, что она "видит", идентифицирует объекты, проигрывает музыку и отвечает на вопросы, требующие определенной степени анализа, обосновывая свои "рассуждения".

Например, столкнувшись с изображением пластиковой утки, которая должна выбрать один из двух путей - левый к другой утке, нарисованной на бумаге, и правый к угрожающе выглядящему медведю, - Gemini предлагает выбрать левый путь, потому что "лучше заводить друзей, чем врагов".

Видео также демонстрирует, что Gemini может распознавать ссылки без особого контекста, например сцену из "Матрицы", которую играет человек, притворяющийся, что уклоняется от пуль в замедленной съемке.

Рассуждения

Новая модель "мультимедийна с самого начала, она обладает сложными способностями к рассуждениям и может кодировать на продвинутом уровне", - подробно рассказал Илай Коллинз.

По его словам, Gemini - это первая модель ИИ, которая превзошла человеческих экспертов в стандартном отраслевом тесте "MMLU", который используется для оценки способности компьютерных программ рассуждать в различных областях, от математики до истории и права.

С момента запуска ChatGPT год назад гиганты Кремниевой долины включились в бешеную гонку за так называемым генеративным ИИ, который может создавать тексты, изображения или строки кода, эквивалентные тем, что создает человек, просто задавая запросы на повседневном языке.

Google, лидер в области ИИ, застигнутый врасплох феноменальным успехом ChatGPT, ответил собственным чатботом Bard.

Но все дело в моделях - компьютерных системах, лежащих в основе этих приложений, которые сначала питались текстом, собранным в Интернете, а теперь получают всевозможные данные для обработки запросов с изображениями и общения с пользователями.

В сентябре OpenAI заявила, что добавила речь и зрение в ChatGPT, чтобы сделать его "более интуитивным".

Лучший коллаборатор

Gemini - это "еще один шаг на пути к нашей цели: предоставить вам лучший в мире ИИ-сотрудник", как отметила в среду Сисси Хсиао, вице-президент Google, отвечающая за Bard.

Возможности Bard уже расширены, но по-прежнему ограничиваються письменными запросами и только на английском языке.

Другим функциям и форматам, таким как расширенная помощь в решении математических задач, придется подождать до 2024 года.

Менее известный, чем ChatGPT, Bard имеет возможность попытаться отвоевать позиции у своего конкурента, который стал жертвой собственного успеха: в середине ноября, перегруженный спросом, OpenAI приостановил подписку на платную версию.

13 декабря Google также предоставит доступ к первой версии Gemini своим клиентам в облаке (удаленные вычисления), в том числе разработчикам, которые используют свою платформу Vertex AI для создания собственных приложений ИИ.

В этой области интернет-гигант вступает в прямую конкуренцию с Microsoft, основным инвестором OpenAI и номером 2 в мире по облачным вычислениям после Amazon.

Оба американских концерна в течение года добавляли инструменты генеративного ИИ в свое программное обеспечение (поисковая система, офисное и продуктивное ПО, облачная платформа и т. д.).

"Эта новая эра моделей представляет собой одно из величайших научно-технических усилий, которые мы предприняли как компания", - заявил глава Google Сундар Пичаи, слова которого приводятся в пресс-релизе.

Review

оставить отзыв