saile.ru • ИИ в продажах

Itinai.com it company office background blured chaos 50 v f378d3ad c2b0 49d4 9da1 2afba66e1248 0

Настройка Llama 3.2 3B для Python: Полное руководство с Unsloth

«`html

Настройка и дообучение Llama 3.2 3B Instruct модели

В этом руководстве мы обсудим, как подготовить и выполнить дообучение модели Llama 3.2 3B Instruct, используя специальный набор данных кода на Python. В конце вы поймете, как настраивать большие языковые модели для задач, связанных с кодом.

Установка необходимых зависимостей

Установите библиотеки, необходимые для дообучения:

!pip install "unsloth[colab-new]"
!pip install "transformers"
!pip install -U trl
!pip install --no-deps trl peft accelerate bitsandbytes
!pip install torch torchvision torchaudio triton
!pip install xformers

Импорт необходимых библиотек

from unsloth import FastLanguageModel
from trl import SFTTrainer
from transformers import TrainingArguments
import torch
from datasets import load_dataset

Загрузка набора данных кода Python

max_seq_length = 2048
dataset = load_dataset("user/Llama-3.2-Python-Alpaca-143k", split="train")

Инициализация модели Llama 3.2 3B

model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/Llama-3.2-3B-Instruct-bnb-4bit",
    max_seq_length = max_seq_length,
)

Настройка LoRA с Unsloth

model = FastLanguageModel.get_peft_model(
    model,
    r = 16,
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
    lora_alpha = 16,
    use_gradient_checkpointing = "unsloth",
    max_seq_length = max_seq_length
)

Подключение Google Drive

from google.colab import drive
drive.mount("/content/drive")

Создание и запуск цикла обучения

trainer = SFTTrainer(
    model = model,
    train_dataset = dataset,
    dataset_text_field = "text",
    max_seq_length = max_seq_length,
    tokenizer = tokenizer,
    args = TrainingArguments(
        per_device_train_batch_size = 2,
        learning_rate = 2e-4,
        max_steps = 60,
        output_dir = "/content/drive/My Drive/Llama-3.2-3B-Instruct-bnb-4bit"
    ),
)
trainer.train()

Сохранение дообученной модели

model.save_pretrained("lora_model")
tokenizer.save_pretrained("lora_model")

Заключение

В этом руководстве мы показали, как дообучить модель Llama 3.2 3B Instruct на наборе данных кода Python с помощью библиотеки Unsloth и эффективной 4-битной квантизации. Это позволит вам создать более компактную и эффективную модель для генерации и понимания кода на Python.

Как искусственный интеллект (ИИ) может помочь вашему бизнесу

Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, проанализируйте, как он может изменить вашу работу. Определите возможности автоматизации и ключевые показатели эффективности (KPI) для улучшения. Выберите подходящее решение и внедряйте ИИ постепенно, начиная с малых проектов.

Для консультаций по внедрению ИИ пишите нам в Телеграм.

Узнайте, как ИИ может изменить процесс продаж в вашей компании, с решением от saile.ru!

«`

4 февраля 2025