Хвиля Інновацій: Як H Company Відкриває уявіть собі, Нові Горизонти. Веб-агентів
Ми з вами, шановні читачі, на порозі захопливого відкриття. Нещодавно світ побачив народження нового звіра у світі штучного інтелекту – це Runner H, розроблений компанією H. Але найцікавіше навіть не сам продукт, а той факт, що H Company припустимо, не просто випустила його, а й відкрила двері у світ його “серця” – ключових моделей, що стоять за цим дивом. Щоб було ясно, це як отримати не просто чудовий інструмент, а й креслення до його створення!
Сьогодні ми зануримося у захопливу подорож, де відкриємо для себе не лише таємниці. Звичайно, runner H, а й глибини революційних моделей, що змінюють правила гри у світі веб-агентів.
Runner H: Ваш Шлях до Автоматизації Інтернету
Уявіть собі світ, де ви можете просто сформулювати завдання у текстовому. Форматі, а потім спостерігати, як віртуальний агент досліджує веб-простір, знаходить потрібну інформацію, виконує поставлену задачу та навіть генерує необхідні документи. Саме це й реалізовує Runner H. Наразі він перебуває в скажімо, от, бета-версії та доступний для безкоштовного використання. Дивно, його можливості вражають: від пошуку товарів на eBay і створення таблиць Google Sheets до автоматизації багатьох інших рутинних завдань.
Щоб продемонструвати його потенціал, автор відео, який занурює нас у світ Runner H, ставить. Наступне завдання:
“Перейти на eBay та знайти картки Pokemon, які зараз знаходяться у продажу. Витягти 10 карток Pokemon, що продаються, та створити таблицю Google Sheets, додавши картки з їх посиланнями на eBay. “
Результат та агент блискавично виконав завдання! Це вражає не тільки швидкістю, але й можливістю запускати декілька таких агентів паралельно, що значно збільшує продуктивність.
Залаштунки Магії: Відкритий Код та Дослідження
Серце Runner H -. Це його Open начебто, Source моделі, що отримали поетичну назву Surfer H, щось на зразок. Саме вони відповідають за обробку інформації та реалізацію поставлених завдань. Ці моделі, подібно до музичного оркестру, поділяються на два ключові елементи:
- Hollow One Navigation: Відповідає за навігацію у веб-просторі, тобто кліки на кнопки, прокручування сторінок та перехід за посиланнями.
- Hollow One Localization: Розпізнає розташування елементів на екрані та визначає координати для кліків.
Ці моделі дозволяють агенту “бачити” веб-сторінки та взаємодіяти з ними, як звичайний користувач. І найголовніше: ви маєте повний доступ до них! Ви можете завантажувати їх, змінювати, навчати, адаптувати під власні потреби – все, що тільки забажаєте! Це справжній подарунок для розробників та дослідників, які прагнуть розширити можливості штучного інтелекту.
Команда H бачите, Company не лише відкрила код, а й опублікувала. детальне дослідження про те, як саме були досягнуті такі вражаючі результати. Це надає унікальну можливість зазирнути за лаштунки технології та зрозуміти принципи її роботи, приблизно так. У дослідженні представлено Surfer значить, H як “ефективного веб-агента, що інтегрує моделі мови та зору”. Він використовує Hollow One, нову колекцію моделей з відкритими. Вагами, що спеціалізуються на навігації в веб-просторі та видобутку інформації.
Швидкість, Точність та Ефективність: Переваги Hollow One
У порівнянні з іншими. Моделями, Hollow One демонструє вражаючі результати, особливо у роботі з Web Voyager benchmark. У поєднанні з Hollow 1, Surfer H досягає 92. 2% точності, що є надзвичайно високим показником. Все це досягається за рахунок ефективності та невисокої вартості. Безумовно, хоч існують варіанти з більшою кількістю параметрів, які здатні показати ще кращий результат, саме Hollow One 3B та 7B виглядають найоптимальнішими для широкого кола користувачів.
Ще однією важливою перевагою є вартість використання моделей Hollow One. Фактично, вони значно економічніші порівняно з іншими моделями на ринку. Це робить їх ідеальним вибором як для персонального використання, так і для розробки бізнес-орієнтованих рішень.
Як Працює Surfer H: Архітектура скажімо, Агента
Успіх Surfer H криється в його трьох основних. Дивно, компонентах:
- Політика (Policy): Генерує список дій, які агент повинен виконати (перехід на сайт, прокручування, клік).
- Локалізатор (Localizer): Визначає координати елементів на екрані, з якими потрібно взаємодіяти. Більше того,
- Валідатор (Validator): Оцінює результати виконання дій і вирішує, чи було досягнуто успіху.
Основний робочий процес виглядає наступним чином:
- Ви надаєте агенту завдання.
- Завдання зберігається в пам’яті.
- Створюється політика (послідовність кроків) проте
- Виконуються дії у веб-браузері.
- Локалізатор визначає координати.
- Валідатор оцінює результат, видає звіт та/або робить висновок з результатом.
Якщо результат не задовільний, агент коригує свої дії. На основі отриманого начебто, зворотного зв’язку та повторює процес до досягнення успіху, щось на зразок.
Навіщо Потрібні Веб-Агенти?
Веб-агенти – це відповідь на виклики сучасного інтернету. Вони дозволяють обійти обмеження, пов’язані з відсутністю стандартизованих API для взаємодії з веб-сайтами. Вони взаємодіють з сайтом, як люди, клікаючи, прокручуючи та виділяючи елементи.
Розширення Функціональності: Інтеграції та Майбутнє
Runner H пропонує широкі можливості інтеграції з різними сервісами, такими як Google Sheets, Google Docs, Drive, Notion, Slack та Zapier. Ці інтеграції дозволяють легко з’єднувати Runner H з іншими інструментами, які ви вже використовуєте, та значно розширювати його функціональність.
Але цим можливості не обмежуються! В майбутньому планується впровадження платіжних функцій, що дозволить агентам здійснювати оплату від вашого імені.
Tester H: Автоматизація Тестування
Окрім Runner H, H Company також анонсувала Tester H, інструмент для автоматизації тестування веб-сайтів та додатків. Tester H дозволяє писати тести у простому форматі, визначаючи дії, які має виконати система, та перевіряючи їх результати. Це дозволяє суттєво прискорити процес тестування та гарантувати якість продукту.
Висновок: Майбутнє Веб-Агентів
Компанія H Company представила не просто черговий інструмент, а цілу екосистему, яка відкриває нові обрії у світі автоматизації. До речі, вона не тільки дає унікальний продукт, а й відкриває його “серце” для дослідників та розробників.
Завдяки відкритому вихідному коду, ефективності та простоті використання, Surfer H та Runner H стануть потужним інструментом для вирішення широкого спектру задач. Можна сміливо стверджувати, що ми бачите, стоїмо на порозі нової ери веб-агентів, ери, де рутинні завдання виконуються автоматично, а ми можемо зосередитись на більш важливих речах. Це лише початок захопливої подорожі, і ми, як спостерігачі, з нетерпінням чекаємо на подальший розвиток цієї чудової технології.