Python API

AITraining 提供了一个 Python API，用于以编程方式访问所有训练功能。

安装

pip install aitraining torch

快速开始

from autotrain.trainers.clm.params import LLMTrainingParams
from autotrain.project import AutoTrainProject

# Configure training
params = LLMTrainingParams(
    model="google/gemma-3-270m",
    data_path="./data.jsonl",
    project_name="my-model",
    trainer="sft",
    epochs=3,
    batch_size=4,
    lr=2e-5,
    peft=True,
    lora_r=16,
)

# Start training
project = AutoTrainProject(params=params, backend="local", process=True)
job_id = project.create()
print(f"Training started: {job_id}")

API 结构

训练参数

每种任务类型都有自己的参数类：

任务	参数类
LLM 训练	`LLMTrainingParams`
文本分类	`TextClassificationParams`
图像分类	`ImageClassificationParams`
令牌分类	`TokenClassificationParams`
Seq2Seq	`Seq2SeqParams`
表格数据	`TabularParams`
目标检测	`ObjectDetectionParams`
VLM	`VLMTrainingParams`

项目执行

from autotrain.project import AutoTrainProject

# Create project
project = AutoTrainProject(
    params=params,
    backend="local",  # or "spaces"
    process=True      # Start immediately
)

# Run training
job_id = project.create()

示例：完整训练脚本

from autotrain.trainers.clm.params import LLMTrainingParams
from autotrain.project import AutoTrainProject

def train_model():
    # Configure parameters
    params = LLMTrainingParams(
        # Model
        model="meta-llama/Llama-3.2-1B",
        project_name="llama-sft",

        # Data
        data_path="./conversations.jsonl",
        train_split="train",
        text_column="text",
        block_size=2048,

        # Training
        trainer="sft",
        epochs=3,
        batch_size=2,
        gradient_accumulation=4,
        lr=2e-5,
        mixed_precision="bf16",

        # LoRA
        peft=True,
        lora_r=16,
        lora_alpha=32,
        lora_dropout=0.05,

        # Logging
        log="wandb",
        logging_steps=10,
    )

    # Start training
    project = AutoTrainProject(
        params=params,
        backend="local",
        process=True
    )

    return project.create()

if __name__ == "__main__":
    job_id = train_model()
    print(f"Training complete: {job_id}")

核心模块

模块	描述
`autotrain.project`	项目执行
`autotrain.trainers.clm.params`	LLM 参数
`autotrain.trainers.text_classification.params`	文本分类
`autotrain.dataset`	数据集处理
`autotrain.generation`	推理工具

入门

核心端点

任务 API

SDK 和集成

实时

API 简介

Python API

安装

快速开始

API 结构

训练参数

项目执行

示例：完整训练脚本

核心模块

下一步

LLM Endpoints

Python SDK

入门

核心端点

任务 API

SDK 和集成

实时

​Python API

​安装

​快速开始

​API 结构

​训练参数

​项目执行

​示例：完整训练脚本

​核心模块

​下一步

LLM Endpoints

Python SDK

Python API

安装

快速开始

API 结构

训练参数

项目执行

示例：完整训练脚本

核心模块

下一步