Founders Fund, Pantera та Franklin Templeton приєднуються до "Арени" Sentient, щоб провести стрес-тестування агентів штучного інтелекту корпоративного рівня

By: rootdata|2026/03/21 23:42:19

Поширити

Протягом останніх двох років компанії прискорюють інтеграцію агентів ШІ в реальні робочі процеси: від обслуговування клієнтів і бекенд-операцій до фінансових і нормативних процесів, які вимагають прийняття рішень з високими ставками. Оскільки ці системи все більше впроваджуються в реальні бізнес-процеси, виникає нова проблема: хоча агенти можуть отримувати інформацію, вони часто не можуть забезпечити стабільні, інтерпретовані та відтворювані процеси обґрунтування, коли робота стає "незграбною", багатоетапною або високоризиковою.

Сьогодні лабораторія штучного інтелекту з відкритим вихідним кодом Sentient офіційно запустила Arena — середовище реального часу, готове до виробництва, для тисяч розробників ШІ по всьому світу, щоб проводити стрес-тестування та ітеративно конкурувати на найскладніших проблемах обґрунтування, з якими стикаються підприємства. До першого етапу учасників Arena входять Founders Fund, Pantera та Franklin Templeton, який управляє активами на суму понад 15 трильйонів доларів, що є сигналом того, що інституції виявляють ранній, чіткий інтерес до "структурованих оцінок агентів ШІ перед їх розгортанням".

"Коли компанії застосовують агентів ШІ для досліджень, операцій і робочих процесів, орієнтованих на клієнтів, питання вже не в тому, чи достатньо потужні ці системи... а в тому, чи вони надійні в реальних робочих процесах", — сказав Джуліан Лав, керуючий партнер Franklin Templeton Digital Assets. Лав додав, що структуровані середовища, такі як Arena, допоможуть галузі відрізняти «перспективні ідеї» від «можливостей, які дійсно можна використовувати у виробництві».

Співзасновник Sentient Гимшану Тайягі заявив: «АІ-агенти вже не просто експерименти в компаніях; вони входять у критичні процеси, які стосуються клієнтів, фінансування та операційних результатів. Цей зсуг змінює критерії оцінки. Систем недостатньо, щоб вони виглядали вражаюче в демонстраціях. Компаніям потрібно знати: чи можуть агенти все ще надійно міркувати в виробничих умовах, де вартість невдачі висока, а довіра крихка? Бізнесу потрібна порівнянність, повторюваність і метод відстеження покращення надійності в довгостроковій перспективі, який не залежить від базової моделі або стека інструментів».

Arena моделює реальний хаос робочих процесів підприємства: неповноцінну інформацію, довгий контекст, нечіткі інструкції та суперечливі джерела. Arena не просто оцінює, чи надають агенти «правильні відповіді», але записує повні сліди міркувань, щоб інженерні команди могли точно визначати причини невдач і перевіряти покращення з часом.

Це забезпечує нейтральний, незалежний від постачальника орієнтир для оцінки міркувань у різних моделях і стеках технологій. Arena наголошує на продуктивності рівня виробництва, а не на демонстраційній продуктивності, тим самим формуючи можливості агента, які можна перевірити і застосувати до сценаріїв з високим рівнем ризику, які бізнеси також можуть перенести на свої приватні дані та внутрішні інструменти.

У першому завданні розробники, які приєднуються до Arena, зосередяться на фундаментальній проблемі корпоративного рівня: обґрунтуванні документів. Агентства штучного інтелекту повинні обґрунтовувати та обчислювати складні, неструктуровані дані — цей тип роботи лежить в основі таких сценаріїв, як фінансовий аналіз, розслідування першопричин, написання інвестиційних мемо та обслуговування клієнтів.

Інші учасники початкового етапу включають alphaXiv, Fireworks, OpenHands та OpenRouter; оскільки Arena розширюється в задачах, галузях та інтеграції моделей, очікується, що приєднається більше учасників.

Останні дослідження також висвітлюють розрив, який Arena прагне подолати: 85% компаній висловлюють бажання стати "агентними підприємствами", причому майже три чверті планують розгортати автономних агентів, але менше чверті фактично мають зрілі системи управління; багато компаній намагаються масштабувати пілотні проекти до великомасштабних виробничих розгортань. У середньому компанії використовують близько десятка агентів, часто розкиданих по ізольованих сценаріях; багато хто вважає, що без кращої оркестрації та можливостей для співпраці додавання більше агентів лише збільшить складність і зменшить цінність.

"У OpenHands ми завжди прагнули підтримувати розробників у використанні агентів для вирішення реальних, практичних проблем", — сказав Грем Нейбіг, головний науковий співробітник і співзасновник OpenHands. "Ми також раді підтримати учасників у використанні SDK програмного агента OpenHands для вирішення цих складних завдань".

Алекс Аталлах, співзасновник і генеральний директор OpenRouter, заявив: "Arena — це саме та ініціатива, яка може просунути вперед штучний інтелект з відкритим вихідним кодом — вона дозволяє дослідникам конкурувати, ітерати та інноваційно працювати в відкритому середовищі". Ми з нетерпінням чекаємо поглиблення нашої співпраці з Sentient і надання інфраструктури для прискорення та спрощення масштабування експериментів.

Arena буде запущена в усьому світі, запрошуючи тисячі розробників штучного інтелекту подати заявку на першу обмежену групу, а офлайн-заходи заплановані в Сан-Франциско, починаючи з березня 2026 року.

Про Sentient Labs

Sentient Labs — це провідна організація з дослідження технологій і розробки продуктів, яка займається просуванням штучного інтелекту з відкритим вихідним кодом. Як двигун інновацій Фонду Sentient, Sentient Labs проводить передові дослідження в галузі обґрунтування, узгодження та співпраці агентів штучного інтелекту. Sentient є основним розробником високопродуктивних фреймворків, таких як ROMA, і моделей з відкритим вихідним кодом, таких як Dobby. Місія Sentient полягає в тому, щоб перетворити штучний інтелект з відкритим вихідним кодом з "експерименту" на "необхідність". Забезпечуючи інфраструктуру для створення потужних, композибельних систем агентів, Sentient дає змогу розробникам комерціалізувати інструменти з відкритим вихідним кодом і досягти зручності на рівні підприємства. Sentient прагне зробити відкритий вихідний код стандартним стандартом для глобальних місіонок з критично важливими операціями штучного інтелекту.

Ціна --

Вам також може сподобатися

Після двох років Гонконг нарешті видав першу партію ліцензій на стейблкоїни: HSBC, Standard Chartered отримали ліцензії

Регульована установа планує запустити стейблкоїн у першій половині цього року.

Людина, яка допомогла TAO зрости на 90%, сьогодні в одиночку знову знизила ціну

Поки люди поруч, історія триває. Але як тільки вони зникнуть, ви навіть не знайдете гідного опонента, з яким можна було б грати.

3-хвилинний посібник з участі в IPO SpaceX на Bitget

Bitget IPO Prime надає користувачам з усього світу унікальну можливість взяти участь у первинних розміщеннях акцій «єдинорогів» світового рівня, що дозволяє звичайним користувачам на рівних умовах отримати доступ до потенційних економічних вигод від первинних розміщень акцій провідних компаній.

Як заробити 15 000 доларів США з бездіяльним USDT перед сезоном альткоїнів 2026

Цікавитесь, чи настане сезон альткоїнів у 2026 році? Отримайте останнє оновлення ринку та дізнайтеся, як перетворити ваші бездіяльні стейблкоїни, що чекають на вхід, на додаткові винагороди до 15 000 USDT.

Чи можна виграти прибутки Джокера без великого обсягу торгів? 5 помилок нових гравців у другому сезоні серіалу «Джокер повертається» від WEEX

Чи можуть дрібні трейдери виграти WEEX Joker Returns 2026 без величезного обсягу? Так, якщо ви уникнете цих 5 дороговартісних помилок. Дізнайтеся, як максимізувати виплати карт, розумно використовувати джокери та перетворювати невеликі депозити на винагороди у розмірі 15 000 USDT.

Топ-5 криптовалют для покупки в 1 кварталі 2026 року: Детальний аналіз ChatGPT

Дізнайтеся про топ-5 криптовалют для покупки в 1 кварталі 2026 року, включаючи BTC, ETH, SOL, TAO та ONDO. Ознайомтеся з прогнозами цін, ключовими наративами та інституційними каталізаторами, що формують наступний рух ринку.

Сезон альткоїнів 2026: 4 етапи для отримання прибутку (перед тим, як натовп почне панічно купувати)

Сезон альткоїнів 2026 розпочинається — дізнайтеся про 4 ключові етапи обертання капіталу (від ETH до PEPE) і як позиціонуватися перед піком. Дізнайтеся, які токени очолять кожен етап і не пропустіть ралі.

Чи настане сезон альткоїнів у 2026 році? 5 порад, як знайти наступні можливості для криптовалют з 100-кратним зростанням

Чи настане сезон альткоїнів у 2026 році? Відкрийте для себе 5 етапів ротації, на які звертають увагу розумні трейдери, а також ключові сектори криптовалют, де можуть з'явитися наступні можливості для альткоїнів з 100-кратним зростанням.

Настав ведмежий ринок, і емітенти криптовалютних ETF також беруть участь

Сьогоднішнє розміщення MSBT є останньою віхою в цій реструктуризації, з припливом інститутів, що прискорює прийняття криптовалют традиційними фінансами, але також розмиває ліквідність рідного ринку.

Найбагатша людина посварилася зі своїм колишнім босом

Це стало величезним скандалом, оскільки кілька провідних фігур у китайському криптовалютному колі протягом останніх 24 годин брали участь у запеклих словесних баталіях і конфронтаціях.

Бонус за автоматичне заробляння 2026: WEEX, Binance, Bybit, OKX та Kraken (лише одна платформа пропонує додаткові бонуси)

Auto Earn 2026: Binance? Bybit? Ніяких додаткових бонусів. Тільки WEEX пропонує +0,5% + 300% річних за рекомендацію. Термін дії обмежений. Дізнайтеся, на скільки саме ви можете заробити більше.

Auto Earn 2026: WEEX пропонує додаткові 0,5% + бонус у розмірі 300% річних — це більше, ніж у Binance та Bybit?

Більшість бірж пропонують функцію «Auto Earn», але лише WEEX надає додатковий бонус у розмірі 0,5% за приріст балансу + 300% річних за реферальні винагороди у 2026 році. Ось як WEEX порівнюється з Binance, Bybit, OKX та Kraken — і чому ви можете заробити більше, просто натиснувши одну кнопку.

Сім зелених свічок зустрічають трьох білих солдатів | Свіжі новини Rewire

Минулої ночі в протоколі засідання ФРС вже було опубліковано сигнал "тримати лінію на посилення", інфляція за індексом споживчих цін – це друга підозра