Объяснимый ИИ: Новая техника снижает затраты на LLM на 90%

Разработка и тестирование больших языковых моделей (LLM), таких как GPT и Llama, требует значительных вычислительных ресурсов, что является препятствием для исследований в области их объяснимости и надежности. Команда из Манчестерского университета представила инновационное решение, способное кардинально изменить эту ситуацию.

Доктор Данило С. Карвальо и доктор Андре Фрейтас разработали программные фреймворки LangVAE и LangSpace. Эти инструменты существенно снижают потребность в аппаратном и энергетическом обеспечении для управления и тестирования LLM, делая создание объяснимого ИИ более доступным.

Принцип работы заключается в создании сжатых языковых представлений из LLM. Это позволяет интерпретировать и управлять моделями, используя геометрические методы. Суть подхода в том, что внутренние языковые паттерны модели рассматриваются как точки и фигуры в пространстве, которые можно измерять, сравнивать и корректировать, не меняя саму модель. Эффективность этой методики поражает: она сокращает потребление ресурсов более чем на 90% по сравнению с существующими решениями.

Такое повышение эффективности значительно снижает порог входа для разработки объяснимых и управляемых систем ИИ. Это открывает двери для большего числа исследователей, стартапов и промышленных команд, позволяя им глубже изучать принципы работы этих мощных технологий.

«Мы значительно снизили барьеры для разработки и экспериментирования с объяснимыми и управляемыми моделями ИИ, а также надеемся уменьшить воздействие этих исследовательских усилий на окружающую среду», — отметил доктор Карвальо. «Наше видение — ускорить разработку надежного и заслуживающего доверия ИИ для критически важных приложений, таких как здравоохранение».

Комментарии

Комментариев пока нет.