Google Gemini: nowy model sztucznej inteligencji, który potrafi rozumować i kodować

08.12.2023

529

Google Gemini: nowy model sztucznej inteligencji, który może konkurować z ChatGPT i Microsoftem

Google w środę rozpoczął wdrażanie Gemini, nowego modelu sztucznej inteligencji (AI), który powinien pomóc mu skuteczniej konkurować z OpenAI (twórcą ChatGPT) i Microsoftem, od aplikacji konsumenckich po możliwości obliczeniowe dla przedsiębiorstw.

"To nasz najbardziej spójny, najbardziej utalentowany i najbardziej ogólny model sztucznej inteligencji" - zapewnił Eli Collins, wiceprezes Google DeepMind, kalifornijskiego laboratorium badawczego grupy AI, podczas prezentacji prasowej.

Następnie zademonstrował wideo, w którym użytkownik pokazuje Gemini obiekty, rysunki i filmy. System sztucznej inteligencji ustnie komentuje to, co "widzi", identyfikuje obiekty, odtwarza muzykę i odpowiada na pytania, które wymagają pewnego stopnia analizy, uzasadniając swoje "rozumowanie".

Na przykład, w konfrontacji z obrazem plastikowej kaczki, która musi wybrać jedną z dwóch ścieżek - w lewo do innej kaczki narysowanej na papierze i w prawo do groźnie wyglądającego niedźwiedzia - Gemini sugeruje wybór lewej ścieżki, ponieważ "lepiej jest mieć przyjaciół niż wrogów".

Wideo pokazuje również, że Gemini potrafi rozpoznawać odniesienia bez większego kontekstu, takie jak scena z Matrixa odgrywana przez mężczyznę udającego unikanie kul w zwolnionym tempie.

Rozumowanie

Nowy model jest "multimedialny od samego początku, ma wyrafinowane zdolności rozumowania i może kodować na zaawansowanym poziomie", wyszczególnił Eli Collins.

Powiedział, że Gemini jest pierwszym modelem sztucznej inteligencji, który przewyższa ludzkich ekspertów w standardowym w branży teście "MMLU", który jest używany do oceny zdolności programów komputerowych do rozumowania w dziedzinach od matematyki przez historię po prawo.

Od czasu uruchomienia ChatGPT rok temu, giganci z Doliny Krzemowej dołączyli do szalonego wyścigu o tak zwaną generatywną sztuczną inteligencję, która może tworzyć tekst, obrazy lub linie kodu odpowiadające temu, co ludzie tworzą, po prostu zadając pytania w języku potocznym.

Google, lider w dziedzinie sztucznej inteligencji, zaskoczony fenomenalnym sukcesem ChatGPT, odpowiedział własnym chatbotem, Bardem.

Chodzi jednak o modele - systemy komputerowe w sercu tych aplikacji, które początkowo były zasilane tekstem zebranym z sieci, a teraz otrzymują wszelkiego rodzaju dane do przetwarzania zapytań o obraz i komunikowania się z użytkownikami.

We wrześniu OpenAI powiedział, że dodał mowę i wizję do ChatGPT, aby uczynić go "bardziej intuicyjnym".

Lepszy współpracownik

Gemini to "kolejny krok w kierunku naszego celu, jakim jest dostarczenie najlepszego na świecie współpracownika AI", jak zauważył w środę Sissy Hsiao, wiceprezes Google odpowiedzialny za Bard.

Możliwości Barda zostały już rozszerzone, ale nadal są ograniczone do pisemnych próśb i tylko w języku angielskim.

Inne funkcje i formaty, takie jak zaawansowana pomoc w rozwiązywaniu problemów matematycznych, będą musiały poczekać do 2024 roku.

Mniej znany niż ChatGPT, Bard ma okazję spróbować odzyskać swojego konkurenta, który stał się ofiarą własnego sukcesu: w połowie listopada, przytłoczony popytem, OpenAI zawiesił subskrypcję płatnej wersji.

13 grudnia Google udostępni również pierwszą wersję Gemini swoim klientom w chmurze (zdalne przetwarzanie), w tym programistom korzystającym z platformy Vertex AI do tworzenia własnych aplikacji AI.

W tym obszarze internetowy gigant wchodzi w bezpośrednią konkurencję z Microsoftem, głównym inwestorem OpenAI i numerem 2 na świecie w chmurze obliczeniowej po Amazonie.

Oba amerykańskie koncerny od roku dodają narzędzia generatywnej sztucznej inteligencji do swojego oprogramowania (wyszukiwarka, oprogramowanie biurowe i zwiększające produktywność, platforma chmurowa itp.

"Ta nowa era modeli reprezentuje jedno z największych przedsięwzięć naukowo-technologicznych, jakie podjęliśmy jako firma" - powiedział CEO Google Sundar Pichai, cytowany w komunikacie prasowym.

James Fletcher

James Fletcher jest znanym autorem i ekspertem w dziedzinie programowania i technologii informatycznych, z dyplomem Uniwersytetu Oksfordzkiego i doświadczeniem w wiodących firmach technologicznych. Często pisze dla naszej strony internetowej, oferując wartościowe treści na temat programowania i nowych technologii, obejmujące zarówno podstawy, jak i najlepsze praktyki, w tym uczenie maszynowe i sztuczną inteligencję.

poprzedni następny

Google Gemini: nowy model sztucznej inteligencji, który potrafi rozumować i kodować

Rozumowanie

Lepszy współpracownik

James Fletcher

Review

zostaw opinię