0.24%
1.32%
4.50%
BTC
$64,014.00
0.03%
1.15%
4.50%
ETH
$1,745.52
0.03%
2.75%
1.88%
BNB
$589.85
0.11%
2.69%
4.63%
XRP
$1.16
0.37%
1.73%
9.90%
SOL
$71.05
0.12%
0.06%
2.30%
TRX
$0.32010000
0.28%
1.70%
1.01%
DOGE
$0.08456000
0.57%
2.43%
4.55%
ADA
$0.16500000
0.11%
1.81%
2.69%
LINK
$8.03
0.00%
2.59%
6.10%
LTC
$43.99
0.24%
1.32%
4.50%
BTC
$64,014.00
0.03%
1.15%
4.50%
ETH
$1,745.52
0.03%
2.75%
1.88%
BNB
$589.85
0.11%
2.69%
4.63%
XRP
$1.16
0.37%
1.73%
9.90%
SOL
$71.05
0.12%
0.06%
2.30%
TRX
$0.32010000
0.28%
1.70%
1.01%
DOGE
$0.08456000
0.57%
2.43%
4.55%
ADA
$0.16500000
0.11%
1.81%
2.69%
LINK
$8.03
0.00%
2.59%
6.10%
LTC
$43.99
   /       /       /    Nvidia показала систему для обучения роботов

Nvidia показала систему для обучения роботов

Nvidia показала систему для обучения роботов

Исследователи Nvidia, Carnegie Mellon University и Калифорнийского университета в Беркли представили ENPIRE — фреймворк, который позволяет ИИ-агентам для программирования улучшать политики управления роботами на реальном оборудовании.

Система запускает замкнутый цикл: робот выполняет задачу, среда автоматически оценивает результат и возвращается в исходное состояние, а ИИ-агент анализирует ошибки, переписывает код и запускает следующую серию испытаний.

Как работает ENPIRE

В робототехнике обучение на реальном оборудовании остается дорогим и медленным процессом. После неудачной попытки нужно вернуть сцену в исходное состояние, проверить результат, изменить алгоритм и снова провести испытание. Обычно часть этой работы требует участия инженеров.

ENPIRE переносит в физический мир подход, который в Nvidia называют AutoResearch: ИИ-агенты пишут код, тестируют его и улучшают в следующих итерациях. Однако в отличие от цифровой среды здесь каждый эксперимент связан с реальными роботами, камерами, объектами, ошибками захвата, трением и другими физическими ограничениями.

Фреймворк состоит из четырех модулей:

  • Environment отвечает за автоматический сброс сцены, проверку результата, логирование и интерфейсы безопасности;
  • Policy Improvement запускает улучшение политики управления;
  • Rollout оценивает политику на одном или нескольких физических роботах;
  • Evolution позволяет агентам анализировать логи, искать идеи в литературе, менять инфраструктуру обучения и исправлять код.

После первичной настройки среды цикл может идти без постоянного наблюдения человека. Агент получает данные из видео, траекторий и функции награды, предлагает новую гипотезу, меняет код, тестирует результат на роботе и сохраняет изменения, если они улучшают показатель.

Зачем нужны автоматическая проверка и сброс

Ключевой элемент ENPIRE — автоматизация двух операций: проверки результата и возврата сцены в исходное состояние. Первый нужен для того, чтобы система могла сама определить, выполнена ли задача. Например, в сценарии с кабельной стяжкой функция оценки объединяла детектор, сегментационную модель и проверку по двум камерам. Так агент получал сигнал успеха или ошибки без ручной разметки каждого прогона.

Автоматический сброс позволяет запускать много попыток подряд. После неудачного действия робот должен вернуть объект или сцену в состояние, пригодное для следующего эксперимента. Без этого обучение на реальном оборудовании быстро упирается в необходимость постоянного участия человека.

Как отметили в Decrypt, на первом этапе человек помогает агенту создать постоянные инструменты — процедуру сброса и функцию награды. После этого они используются повторно, а агент берет на себя дальнейшее улучшение политики.

Что показали на роботах

В реальных экспериментах команда тестировала ENPIRE на нескольких задачах манипуляции. Push-T проверяет, может ли робот толкать T-образный объект в заданную зону. Pin Insertion требует вставлять штыри в отверстия диаметром 4 мм. Также показаны установка GPU и операции с кабельной стяжкой.

На странице проекта Nvidia указано, что в реальных задачах манипуляции система успешно справлялась с заданием в 99% случаев, если агенту давали до восьми попыток с учетом предыдущих ошибок. Показатель отражает способность системы восстанавливаться после неудач и повторять действия с учетом контекста, а не точность одной изолированной попытки.

В качестве агентов для программирования команда сравнила Codex на GPT-5.5, Claude Code на Opus 4.7 и Kimi Code на Kimi K2.6. Оценка проходила в бенчмарке AutoEnvBench на задачах Push-T и Pin Insertion.

Исследователи также проверили ENPIRE в RoboCasa — симуляторе бытовых задач вроде открытия шкафов, ящиков и включения или выключения объектов на кухне. В этих сценариях ENPIRE превзошел GR00T от Nvidia и CaP-X — агентную систему, которая использует инструменты, но не запускает полный цикл автоматического исследования.

Восемь роботов ускорили обучение

Отдельный блок работы посвящен масштабированию на парк роботов. Nvidia провела эксперимент на восьми роботизированных станциях с двумя манипуляторами. У каждой были собственные оборудование, компьютер и ИИ-агент для программирования.

Станции обменивались результатами через Git: удачная идея или изменение кода могли быстро распространяться между агентами. Такой подход позволил сократить время обучения. По данным Decrypt, переход от одного робота к восьми сократил время освоения Push-T примерно с пяти до двух часов. Для Pin Insertion время снизилось с более чем 90 минут до около 40 минут.

Ограничения

Авторы подчеркнули, что масштабирование не решает всех проблем. Когда агенты читают логи, пишут код, отлаживают его или ждут ответа базовой языковой модели, роботы и вычислительные ресурсы используются не полностью. С ростом числа роботов увеличивается GPU-активность, но средняя загрузка самих роботов снижается. Команды агентов тратят больше времени на обобщение результатов других веток и координацию, а не только на физические прогоны.

Еще одно ограничение — рост расхода токенов. Больший парк роботов быстрее приводит политику к рабочему состоянию, но требует больше токенов из-за чтения логов, обмена идеями и координации между агентами.

Кроме того, ENPIRE пока показан на ограниченном наборе задач манипуляции. Его результаты не означают, что роботы уже могут самостоятельно осваивать произвольные физические навыки в открытой среде без инженерной подготовки.

Напомним, в июне Nvidia представила Isaac GR00T Reference Humanoid Robot — исследовательский референс-дизайн для разработки и тестирования навыков гуманоидных роботов. В конфигурацию вошли корпус Unitree H2 Plus и тактильные пятипалые кисти Sharpa Wave.

Ранее Unitree представила «первого в мире готового к серийному производству» пилотируемого робота. Андроид способен передвигаться на двух и четырех конечностях.

Источник: ForkLog

18-06-2026
Криптовалюты / Новости в мире криптовалют

Новости в мире криптовалют

GPU-майнеры для AMD и Nvidia с поддержкой ProgPoWGPU-майнеры для AMD и Nvidia с поддержкой ProgPoWAlibaba представила ИИ-модели для управления роботамиAlibaba представила ИИ-модели для управления роботамиAlibaba представила ИИ-модели для управления роботамиAlibaba представила ИИ-модели для управления роботамиAlibaba представила ИИ-модели для управления роботамиAlibaba представила ИИ-модели для управления роботами

Случайная цитата о деньгах

"Идеалист - это тот, кто помогает разбогатеть другим."

Генри Форд

Интересные записи в других разделах блога

Информация

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Последние материалы

все статьи →
CME Group планирует подать иск против CFTC из-за бессрочных фьючерсовНовости в мире криптовалютCME Group планирует подать иск против CFTC из-за бессрочных фьючерсовКомпания CME Group планирует подать иск против CFTC из-за одобрения бессрочных фьючерсов, заявил в интервью CNBC ее CEO Терренс Даффи. По его словам, такие18-06-2026Биткоин-транзакция: как ее прочитать и отследитьНовости в мире криптовалютБиткоин-транзакция: как ее прочитать и отследитьВ основе биткоина — открытый реестр, поэтому при должном навыке любой перевод можно проследить от адреса к адресу. Из этого выросла целая индустрия: трейдеры18-06-2026Grayscale назвала фаворитов среди DeFi-токеновНовости в мире криптовалютGrayscale назвала фаворитов среди DeFi-токеновАналитическое подразделение компании Grayscale Investments опубликовало исследование по оценке криптоактивов через традиционные финансовые модели и заявило,18-06-2026Aztec Connect снова взломали повторно: украдено еще $2,2 млнНовости в мире криптовалютAztec Connect снова взломали повторно: украдено еще $2,2 млнЗаброшенный протокол Aztec Connect подвергся повторному взлому. Как сообщили специалисты по безопасности из BlockSec Phalcon и SlowMist, 18 июня злоумышленник18-06-2026«Опасный оптимизм»: киты начали накапливать биткоин, несмотря на рекордное давление продаж альткоиновНовости в мире криптовалют«Опасный оптимизм»: киты начали накапливать биткоин, несмотря на рекордное давление продаж альткоиновАналитики CryptoQuant сообщили о появлении первых сигналов накопления биткоина крупными игроками. В то же время сегмент альткоинов продолжает находиться под18-06-2026Скандал в Испании: у экс-премьера ищут биткоиныНовости в мире криптовалютСкандал в Испании: у экс-премьера ищут биткоиныСапатеро отрицал схему спасения Plus Ultra на своем допросе, пока судья санкционировал арест любых биткоинов и лайткоинов, которыми он владеет.18-06-2026Аналитики QCP Capital назвали причины консолидации биткоинаНовости в мире криптовалютАналитики QCP Capital назвали причины консолидации биткоинаСоглашение между США и Ираном снизило риски проблем в мировой энергетике, однако биткоин по-прежнему остается ниже $66 000 из-за опасений очередных продаж со18-06-2026Глава Kalshi назвал 3 конкурентов платформы: Polymarket не вошел в списокНовости в мире криптовалютГлава Kalshi назвал 3 конкурентов платформы: Polymarket не вошел в списокГенеральный директор Kalshi Тарек Мансур заявил, что Polymarket не является его основным конкурентом, назвав более серьезными угрозами CME, Robinhood и18-06-2026Perp-DEX Satori Finance объявила о закрытииНовости в мире криптовалютPerp-DEX Satori Finance объявила о закрытииДецентрализованная биржа бессрочных фьючерсов Satori Finance объявила о закрытии из-за затяжных неблагоприятных рыночных условий и недостаточной выручки. В18-06-2026
ВойтиMasterInvest