Itinai.com beautiful russian high fashion sales representativ a1922e6e 86c0 4f4f ace3 d2864b5eacac 2
Itinai.com beautiful russian high fashion sales representativ a1922e6e 86c0 4f4f ace3 d2864b5eacac 2

Ученые из UCSD и Adobe представили Presto!: ИИ для ускорения вывода в диффузионных трансформерах.

 Researchers from UCSD and Adobe Introduce Presto!: An AI Approach to Inference Acceleration for Score-based Diffusion Transformers via Reducing both Sampling Steps and Cost Per Step

«`html

Прогресс в генерации текста в аудио и музыку

Генерация текста в аудио (TTA) и текст в музыку (TTM) достигли значительных успехов благодаря моделям диффузии в аудиосфере. Эти модели показывают лучшие результаты по сравнению с генеративными состязательными сетями (GAN) и вариационными автокодировщиками (VAE).

Проблемы и решения

Однако, модели диффузии сталкиваются с проблемой длительного времени вывода из-за итеративного процесса денойзинга, что приводит к задержкам от 5 до 20 секунд. Это ограничивает их применение в ситуациях, требующих быстрой генерации аудио.

Существующие попытки решения этих проблем сосредоточены на авторегрессионных методах и моделях диффузии. Хотя диффузионные методы показывают многообещающие результаты, их медленная скорость вывода остается серьезным недостатком.

Инновационный подход Presto!

Исследователи из UCSD и Adobe представили Presto! — новый подход для ускорения вывода в трансформерах на основе диффузии для генерации TTM. Этот метод сокращает количество шагов выборки и стоимость за шаг, что значительно ускоряет процесс.

Presto! использует латентную диффузионную модель для генерации моно аудио 44.1kHz, которое затем преобразуется в стерео. Модель обучена на большом наборе данных и использует различные сигналы, такие как уровень шума и текстовые подсказки.

Результаты и преимущества

Presto! имеет две версии: Presto-S и Presto-L. Результаты показывают, что Presto-L превосходит базовую модель, ускоряя процесс на 27% и улучшая качество. Presto-S достигает качества близкого к базовой модели с ускорением в 15 раз.

Метод Presto! достигает задержек в 230ms и 435ms для 32-секундного моно и стерео аудио, что в 15 раз быстрее, чем другие решения.

Как внедрить ИИ в ваш бизнес

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ), рассмотрите следующие шаги:

  • Проанализируйте, как ИИ может изменить вашу работу.
  • Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
  • Подберите подходящее решение и внедряйте ИИ постепенно, начиная с небольших проектов.
  • На основе полученных данных расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам в Телеграм. Узнайте, как ИИ может изменить процесс продаж в вашей компании с решениями от saile.ru — будущее уже здесь!

«`

Бесплатный ИИ: для автоматизации продаж

Умные продажи