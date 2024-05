Niedawno OpenAI pokazało nowy, wszechstronny model GPT-4o, który pozwala ChatGPT odpowiadać w czasie rzeczywistym na pytania dotyczące obrazu z kamery smartfona lub ekranu komputera. Z pewnością dlatego startup zorganizował swoją konferencję tuż przed Google I/O 2024. Wynika z tego, że wiedział on dobrze o tym, że Google ma coś podobnego w zanadrzu.

Project Astra to prototypowy, multimodalny duży model językowy, który łączy analizę obrazu, dźwięku i tekstu. Podczas jego demonstracji pokazano film, na którym kobieta, spaceruje po biurze z włączonym aparatem telefonu i zadaje skomplikowane pytania dotyczące otoczenia. Wirtualny asystent bez wahania rozwiewa jej wątpliwości związane z tworzonym kodem, pomaga poprawić schemat firmowej serwerowni, proponuje nazwę dla psiego zespołu, a nawet wskazuje zgubione okulary.

A jeśli mowa o okularach, to warto wspomnieć, że w pewnym momencie kobieta przełącza się na zamontowaną w nich kamerę i kontynuuje przy ich użyciu rozmowę ze sztuczną inteligencją. Czy ma to wskazywać na to, że już wkrótce możemy się spodziewać następcy Google Glass?