Google пуска редица нововъведения в битката за надмощие с OpenAI
Дългоочакваната годишна конференция на Alphabet Google I/O показа големите амбиции на технологичния гигант в битката на полето на изкуствения интелект. Компанията показа редица нововъведения, някои от които са пряко предизвикателство за основния конкурент в лицето на OpenAI.
Опит за AI доминация в онлайн търсенето
Google, който е лидер в интернет търсенето, въвежда иновации с изкуствен интелект, за да подобри търсачките си. Въвеждат се редица функции – търсене с помощта на видео, текст, личната галерия със снимки. Това лято ще бъде пусната и функцията “Ask Photos”, която ще даде възможност Gemini да преглежда библиотеката в Google Photos в отговор на различни въпроси като например “Какъв е регистрационният номер на автомобила ми”. Функцията ще бъде пусната това лято.
Google Lens вече позволява търсене в интернет въз основа на изображения. Компанията – майка Alphabet надгражда с нова функция, която позволява търсения през видеоклипове. С този ход Google хвърля ръкавицата директно на OpenAI, след като разработчикът на ChatGPT обяви нова версия на GPT-4o – моделите, които захранват инструмента.
AI асистенти на ново ниво
Компанията прави и сериозна заявка да предостави на потребителите истински виртуален асистент, който е способен сам да пише мейли и да извършва делегирани от потребителите задачи.
Google представи и нов модел Gemini 1.5 Flash. Той е също толкова мощен, колкото и Gemini 1.5 Pro, но може да генерира отговори значително по-бързо. Удвоен и е обемът на информацията, която чат ботът може да възприема.
На свой ред Gemini 1.5 Pro ще бъде въведен в инструменти на Google като Docs, Sheets, Slides, Drive и Gmail. Идеята е, когато бъде пуснат за платените абонати още следващия месец, инструментът да се превърне по-скоро в асистент в рамките на работното пространство, който може да извлича информация от цялото съдържание. Инструментът ще може да пише имейли, да прави напомняния.
Alphabet пуска и проектът Astra с амбицията той да се превърне в истински виртуален асистент, който може да наблюдава и разбира всичко, което вижда през камерата на устройствата. Той е в основата на много от най-впечатляващите демо версии на I/O тази година.
AI Teammate трябва да се превърне във виртуален колега на потребителите. Той ще служи като център за цялата информация, споделена по време на работа.
Войната с OpenAI
Gemini Live пък има за цел да направи гласовите разговори с Gemini по-естествени. Гласът на чат бота ще бъде актуализиран с допълнителна индивидуалност, а потребителите ще могат да го прекъсват по средата на изречението или да го помолят да наблюдава през камерата на смартфона им и да дава информация за това, което вижда в реално време.
Подобна функция представиха и от OpenAI вчера. GPT-4o е версия на модела GPT-4, която е много по-бърза и подобрява възможностите за работа с текст, изображения, видео и аудио. Този инструмент също е способен да наблюдава околностите през камерата и да отговаря по човешки начин на потребителски запитвания.
Google отправя и ново предизвикателство към компанията зад ChatGPT с Veo. Този инструмент ще влезе в пряка конкуренция с ora – продукт за видео съдържание, генерирано от изкуствен интелект на база текст. Инструментът Veo на Google може да създава видеоклипове с резолюция 1080 пиксела на база текст, изображения и видео разкази.