Itinai.com beautiful russian high fashion sales representativ 6f8a916b bbbd 4496 98d9 15b25a27f624 0
Itinai.com beautiful russian high fashion sales representativ 6f8a916b bbbd 4496 98d9 15b25a27f624 0

Neural Magic выпускает полностью квантованную версию модели Meta’s Llama 3.1 405B: FP8 Dynamic Quantization и FP8 Static Quantization

 Neural Magic Releases Fully Quantized FP8 Version of Meta’s Llama 3.1 405B Model: FP8 Dynamic Quantization and FP8 Static Quantization

«`html

Neural Magic объявил о выпуске полностью квантованной версии FP8 модели Meta Llama 3.1 405B

Meta-Llama-3.1-405B-Instruct-FP8-dynamic

Новая модель решает ограничения памяти и увеличивает скорость вывода более чем в 2 раза, используя быструю память и вычислительные возможности, и ликвидируя необходимость распределения по нескольким узлам.

Квантование и Оптимизация

Модель достигает высокой эффективности благодаря квантованию весов и активаций до типа данных FP8, что уменьшает объем диска и требования к памяти GPU.

Развертывание и Оценка

Квантованную модель Neural Magic можно развертывать эффективно, используя библиотеки `vllm` и `transformers` в Python.

Воспроизведение и Точность

Neural Magic предоставляет подробные инструкции для воспроизведения результатов оценки модели для различных задач.

Заключение

Выпуск полностью квантованной версии FP8 модели Meta Llama 3.1 405B Neural Magic открывает новые возможности для эффективного и масштабируемого применения искусственного интеллекта.

Также не забудьте следовать за нами в Twitter и присоединиться к нашему Telegram-каналу.

«`

Бесплатный ИИ: для автоматизации продаж

Умные продажи