
«`html
Исследование: SheetCompressor от Microsoft Researchers
Анализ электронных таблиц (spreadsheets) с помощью SheetCompressor, разработанным исследователями Microsoft, представляет значительный прорыв в обработке и понимании данных электронных таблиц с использованием языковых моделей большого размера (LLM).
Проблема
Электронные таблицы часто имеют сложные и обширные структуры, что затрудняет их анализ и взаимодействие с ними. Существующие методы кодирования электронных таблиц для LLM часто нуждаются в улучшении, так как они ограничены токенами и не могут эффективно обрабатывать большие наборы данных.
Решение
SheetCompressor предлагает инновационное решение в виде трех основных модулей: сжатие на основе структурных якорей, обратный индексный перевод и агрегация с учетом форматов данных. Эти модули совместно улучшают кодирование и сжатие электронных таблиц, позволяя LLM более эффективно и эффективно их обрабатывать.
Результаты
Тесты показали, что SheetCompressor снизил использование токенов для кодирования электронных таблиц на 96%. Это позволило значительное улучшение производительности в задачах обнаружения таблиц и ответило на вопросы значительно лучше, чем существующие методы.
Применение
SheetCompressor позволяет практическое применение на больших наборах данных и значительно повышает производительность LLM в задачах анализа электронных таблиц.
Подробности исследования доступны в статье на MarkTechPost.
Авторы исследования: Microsoft Researchers.
Следите за нашими новостями в Twitter и Telegram.
«`