logo

Ramp Labs представляє рішення для спільного використання пам'яті між агентами, споживання токенів зменшено на 65%

By: theblockbeats.news|2026/04/11 14:21:42
0
Поширити
copy

BlockBeats News, 11 квітня, компанія з інфраструктури штучного інтелекту Ramp Labs опублікувала результати дослідження "Latent Briefing", досягнувши ефективного обміну пам'яттю між системами з кількома агентами шляхом прямого стиснення масштабного кешу моделей KV, значно зменшуючи споживання токенів без втрати точності.


У основних архітектурах з кількома агентами оркестратор розкладає завдання та повторно викликає моделі виконавців. Оскільки ланцюжок висновків розширюється, використання токенів експоненціально зростає. Основна ідея Latent Briefing полягає в тому, щоб використовувати механізм уваги для виявлення дійсно критичних частин у контексті, безпосередньо відхиляти надлишкову інформацію на рівні подання, а не покладатися на повільне резюмування LLM або нестабільний пошук RAG.


У тесті на основі бенчмарку LongBench v2 цей метод показав чудові результати: Споживання токенів робочою моделлю зменшилося на 65%, середнє заощадження токенів для документів середньої довжини (від 32 000 до 100 000) досягло 49%, загальна точність покращилася приблизно на 3 процентні пункти порівняно з базовим рівнем, а додатковий час для кожного стиснення становив лише близько 1,7 секунди, що забезпечило прискорення приблизно в 20 разів порівняно з оригінальним алгоритмом.


У експерименті використовувалися Claude Sonnet 4 як оркестратор і Qwen3-14B як робоча модель, що охоплювали різні сценарії документів, такі як академічні статті, юридичні документи, романи та урядові звіти. Дослідження також показало, що оптимальний поріг стиснення варіюється залежно від складності завдання та довжини документа — складні завдання підходять для агресивної стиснення для фільтрації шуму спекулятивного міркування, тоді як довгі документи більше підходять для м'якого стиснення для збереження розрізненої ключової інформації.

Ціна --

--

Вам також може сподобатися

Потік стейблкоїнів та побічні ефекти на валютному ринку

Дослідження показали, що екзогенне збільшення чистого припливу стейблкоїнів значно збільшує розбіжність у цінах між стейблкоїнами та традиційною іноземною валютою, призводить до знецінення національної валюти та погіршує умови фінансування синтетичних доларів (тобто збільшує до...

Після двох років Гонконг нарешті видав першу партію ліцензій на стейблкоїни: HSBC, Standard Chartered отримали ліцензії

Регульована установа планує запустити стейблкоїн у першій половині цього року.

Людина, яка допомогла TAO зрости на 90%, сьогодні в одиночку знову знизила ціну

Поки люди поруч, історія триває. Але як тільки вони зникнуть, ви навіть не знайдете гідного опонента, з яким можна було б грати.

3-хвилинний посібник з участі в IPO SpaceX на Bitget

Bitget IPO Prime надає користувачам з усього світу унікальну можливість взяти участь у первинних розміщеннях акцій «єдинорогів» світового рівня, що дозволяє звичайним користувачам на рівних умовах отримати доступ до потенційних економічних вигод від первинних розміщень акцій провідних компаній.

Як заробити 15 000 доларів США з бездіяльним USDT перед сезоном альткоїнів 2026

Цікавитесь, чи настане сезон альткоїнів у 2026 році? Отримайте останнє оновлення ринку та дізнайтеся, як перетворити ваші бездіяльні стейблкоїни, що чекають на вхід, на додаткові винагороди до 15 000 USDT.

Чи можна виграти прибутки Джокера без великого обсягу торгів? 5 помилок нових гравців у другому сезоні серіалу «Джокер повертається» від WEEX

Чи можуть дрібні трейдери виграти WEEX Joker Returns 2026 без величезного обсягу? Так, якщо ви уникнете цих 5 дороговартісних помилок. Дізнайтеся, як максимізувати виплати карт, розумно використовувати джокери та перетворювати невеликі депозити на винагороди у розмірі 15 000 USDT.

Популярні монети

Останні новини криптовалют

Читати більше
iconiconiconiconiconicon

Бот служби підтримки@WEEX_support_smart_Bot

VIP-послугиsupport@weex.com