08.12.2023
324
Google w środę rozpoczął wdrażanie Gemini, nowego modelu sztucznej inteligencji (AI), który powinien pomóc mu skuteczniej konkurować z OpenAI (twórcą ChatGPT) i Microsoftem, od aplikacji konsumenckich po możliwości obliczeniowe dla przedsiębiorstw.
"To nasz najbardziej spójny, najbardziej utalentowany i najbardziej ogólny model sztucznej inteligencji" - zapewnił Eli Collins, wiceprezes Google DeepMind, kalifornijskiego laboratorium badawczego grupy AI, podczas prezentacji prasowej.
Następnie zademonstrował wideo, w którym użytkownik pokazuje Gemini obiekty, rysunki i filmy. System sztucznej inteligencji ustnie komentuje to, co "widzi", identyfikuje obiekty, odtwarza muzykę i odpowiada na pytania, które wymagają pewnego stopnia analizy, uzasadniając swoje "rozumowanie".
Na przykład, w konfrontacji z obrazem plastikowej kaczki, która musi wybrać jedną z dwóch ścieżek - w lewo do innej kaczki narysowanej na papierze i w prawo do groźnie wyglądającego niedźwiedzia - Gemini sugeruje wybór lewej ścieżki, ponieważ "lepiej jest mieć przyjaciół niż wrogów".
Wideo pokazuje również, że Gemini potrafi rozpoznawać odniesienia bez większego kontekstu, takie jak scena z Matrixa odgrywana przez mężczyznę udającego unikanie kul w zwolnionym tempie.
Nowy model jest "multimedialny od samego początku, ma wyrafinowane zdolności rozumowania i może kodować na zaawansowanym poziomie", wyszczególnił Eli Collins.
Powiedział, że Gemini jest pierwszym modelem sztucznej inteligencji, który przewyższa ludzkich ekspertów w standardowym w branży teście "MMLU", który jest używany do oceny zdolności programów komputerowych do rozumowania w dziedzinach od matematyki przez historię po prawo.
Od czasu uruchomienia ChatGPT rok temu, giganci z Doliny Krzemowej dołączyli do szalonego wyścigu o tak zwaną generatywną sztuczną inteligencję, która może tworzyć tekst, obrazy lub linie kodu odpowiadające temu, co ludzie tworzą, po prostu zadając pytania w języku potocznym.
Google, lider w dziedzinie sztucznej inteligencji, zaskoczony fenomenalnym sukcesem ChatGPT, odpowiedział własnym chatbotem, Bardem.
Chodzi jednak o modele - systemy komputerowe w sercu tych aplikacji, które początkowo były zasilane tekstem zebranym z sieci, a teraz otrzymują wszelkiego rodzaju dane do przetwarzania zapytań o obraz i komunikowania się z użytkownikami.
We wrześniu OpenAI powiedział, że dodał mowę i wizję do ChatGPT, aby uczynić go "bardziej intuicyjnym".
Gemini to "kolejny krok w kierunku naszego celu, jakim jest dostarczenie najlepszego na świecie współpracownika AI", jak zauważył w środę Sissy Hsiao, wiceprezes Google odpowiedzialny za Bard.
Możliwości Barda zostały już rozszerzone, ale nadal są ograniczone do pisemnych próśb i tylko w języku angielskim.
Inne funkcje i formaty, takie jak zaawansowana pomoc w rozwiązywaniu problemów matematycznych, będą musiały poczekać do 2024 roku.
Mniej znany niż ChatGPT, Bard ma okazję spróbować odzyskać swojego konkurenta, który stał się ofiarą własnego sukcesu: w połowie listopada, przytłoczony popytem, OpenAI zawiesił subskrypcję płatnej wersji.
13 grudnia Google udostępni również pierwszą wersję Gemini swoim klientom w chmurze (zdalne przetwarzanie), w tym programistom korzystającym z platformy Vertex AI do tworzenia własnych aplikacji AI.
W tym obszarze internetowy gigant wchodzi w bezpośrednią konkurencję z Microsoftem, głównym inwestorem OpenAI i numerem 2 na świecie w chmurze obliczeniowej po Amazonie.
Oba amerykańskie koncerny od roku dodają narzędzia generatywnej sztucznej inteligencji do swojego oprogramowania (wyszukiwarka, oprogramowanie biurowe i zwiększające produktywność, platforma chmurowa itp.
"Ta nowa era modeli reprezentuje jedno z największych przedsięwzięć naukowo-technologicznych, jakie podjęliśmy jako firma" - powiedział CEO Google Sundar Pichai, cytowany w komunikacie prasowym.
Review
zostaw opinię