TABS API — новейшая разработка Mozilla в области агентного веб-разделения
Сразу после объявления о создании режима просмотра с использованием искусственного интеллекта в Firefox и подготовки к агентному взаимодействию в Firefox 145 корпоративное подразделение Mozilla демонстрирует свои возможности в области искусственного интеллекта тем, кому это может быть интересно: веб-разработчикам.
TABS API позволяет разработчикам создавать агентов для автоматизации веб-взаимодействий, таких как клики, прокрутка, поиск и отправка форм, «как это делает человек». Обратная связь в реальном времени и адаптивное поведение, по словам Mozilla, обеспечат «полный контроль над веб-ресурсами без лишних сложностей».
Поскольку TABS не работает на LLM, поддерживаемом Mozilla, вам необходимо подключить его к выбранному вами стороннему LLM для любой соответствующей обработки. TABS обрабатывает веб–взаимодействия — сторону автоматизации, но не саму интеллектуальную информацию.
На бесплатном тарифе разработчики получают 1000 запросов в месяц, что вполне приемлемо для создания прототипов личных проектов. Для сложных агентских рабочих нагрузок может потребоваться больше запросов. Хотя цены пока не установлены, на сайте TABS API указано, что стоимость составит ~5 долларов за 1000 запросов.
Платные тарифные планы будут предлагать дополнительные функции, такие как снижение задержки и, как ни странно, решение CAPTCHA, чтобы ИИ мог «доказать», что он не робот, на страницах, защищенных от автоматизированных действий.
Преимущество Mozilla — минимизация данных
Google, OpenAI и другие крупные поставщики ИИ предлагают собственные агентские API. Mozilla присоединяется к ним с опозданием, но планирует действовать иначе. Она делает упор на «минимизацию данных и безопасность», а собранные данные обрабатываются эфемерно, то есть не сохраняются.
Это важное различие. Агенты ИИ могут выполнять сложные онлайн-задачи, связанные с получением и обработкой всевозможных личных или конфиденциальных данных.
Агентные вычисления, если верить тем, кто финансово, эмоционально и духовно привязан к идее их успеха любой ценой, будут выполнять за людей рутинные задачи, как чат-боты LLM выполняют задачи, связанные со знаниями и обучением.
Идея заключается в том, что вместо того, чтобы самим открывать веб-браузер и делать что-то, например сравнивать цены на ноутбуки или искать дешёвые авиабилеты, мы можем поручить это «агенту».
Возможно, вы видели новости о том, что Microsoft переделывает Windows в агентную операционную систему с упором на «эффективность» и «продуктивность». Мы освобождаемся от оков пользовательского интерфейса и берём на себя свою законную роль, э-э, подсказок?
Время, которое ИИ-агенты готовы потратить на спасение, — это необработанная валюта, которую мы можем потратить на… В нашем антиутопическом аду, где ИИ обречён прозябать в нищете, женитесь на больших языковых моделях и оставайтесь зависимыми от алгоритмов, которые концентрируют ценность наверху. И, без сомнения, вводите больше подсказок.
Если отбросить цинизм, то бум агентских сетей неизбежен, потому что есть люди, которые могут его обеспечить. В лучшем случае это будет полезный инструмент; в худшем — он ускорит процесс разрыва связей между людьми, и взаимодействие будет осуществляться через платные продукты: «депопуляция интернета».
На данный момент люди нужны для создания и реализации возможностей «веб-агентов» Если вы хотите создать такого агента, возможно, не имея при этом мотивации лишать общее благо его преимуществ, то API TABS от Mozilla — хорошее место для начала.
Редактор: AndreyEx