OpenAI, компания, стоящая за ChatGPT, только что объявила о создании оператора. Это сервис искусственного интеллекта, который действует как агент и выполняет задачи от вашего имени. Используя свой собственный браузер, оператор просматривает веб–страницу и взаимодействует с ней, самостоятельно набирая текст, щелкая мышью и прокручивая его - никакого ввода не требуется.
Внедрение будет постепенным, и первыми его получат подписчики ChatGPT Pro в Соединенных Штатах.
Оператор может выполнять различные повторяющиеся задачи в браузере, а OpenAI утверждает, что он может заполнять формы, заказывать продукты и даже создавать мемы. Он может использовать те же интерфейсы и инструменты, с которыми взаимодействуют люди, и это также поможет бизнесу, открывая для него новые возможности взаимодействия.
Предварительный просмотр Operator, агента, который может использовать свой собственный браузер для выполнения задач для you.pic.twitter.com/wkBBDIlVqj
Оператор работает на базе новой модели под названием CUA – Computer-Using Agent. Она сочетает в себе возможности GPT-4o vision и расширенные возможности мышления благодаря усиленному обучению. CUA обучен взаимодействовать с GUIS – графическими интерфейсами пользователя с кнопками, меню и текстовыми полями, которые люди видят на экране.
Когда сервис зависает или нуждается в помощи, он просто возвращает вам управление. Вам также необходимо вручную ввести конфиденциальные данные, такие как пароли или другие формы подтверждения.
Оператор может работать с такими сервисами, как Doordash, Etsy, Booking.com, Uber и Instacart, а также проводить исследования через медиа-партнеров, таких как Associated Press и Reuters.
Источник