Екип, занимаващ се с роботика в подразделението на Google DeepMind представи три нови продукта, които ще помогната на роботите по-бързо да вземат решения и да са по-безопасни за хората при изпълнение на своите задачи.
Системата за събиране на данни AutoRT работи на базата на визуален езиков модел (VLM) и голям езиков модел (LLM) — те помагат на роботите да оценяват околната среда, да се адаптират в непозната обстановка и да вземат решения за изпълнение на поставените задачи. VLM се използва за анализ на околната среда и разпознаване на обекти в пределите на видимост. LLM се използва за творческо изпълнение на задачите. Важно нововъведение на AutoRT е появата на “Конституция на роботите” в блока LLM – осигуряващи безопасност команди, предписващи на машината да избягва избора на задачи, в които участват хора, животни, остри предмети и даже електрически прибори. С цел допълнителна безопасност роботите се програмират да спрат, когато усилието на техните стави надвиши зададен праг. В допълнение, в конструкцията на робота е предвиден специален ключ за изключване, който може да се използва от човека в екстремна ситуация.
През последните месеци Google е използвала в четири свои офисни сгради 53 робота със система AutoRT и е направила над 77 000 теста. Някои от роботите са управляващи дистанционно от оператори, други са изпълнявали задачите си автономно, или на базата на зададен алгоритъм, или с използване на ИИ модела Robotic Transformer (RT-2). Засега всичките тези роботи изглеждат просто – това са подвижни крайници-манипулатори с камери за оценка на околната обстановка.
Второто нововъведение е системата SARA-RT (Self-Adaptive Robust Attention for Robotics Transformers), насочена към оптимизация на работата на модела RT-2. Изследователите са установили, че при удвояване на входящите данни, например, повишаване на резолюцията на камерите, потребността на робота от изчислителни ресурси нараства четворно. Този проблем е удачно решен чрез нов метод за прецизна настройка на изкуствения интелект, получил название up-training, който обръща почти квадратичната консумация на резурси в линейна. Така моделът работи по-бързо и запазва предишното качество.
И накрая, инженерите на Google DeepMind са разработили ИИ модела RT-Trajectory, който опростява обучението на роботи при изпълнение на конкретни задачи. След като постави задача, операторът сам демонстрира как тя трябва да бъде изпълнена. RT-Trajectory анализира зададената от човека траектория и я адаптира към действията на робота.