向导命令参考
AITraining 向导支持各种命令,帮助您导航、搜索和配置训练任务。重要:向导命令为英文(如
:help、:back、/search),系统消息也
为英文。本文档解释了每个命令的作用以及如何使用它们,即使您不流利使用 英语。导航命令
这些命令在任何提示符下都有效:| 命令 | 快捷方式 | 描述 |
|---|---|---|
:back | 返回上一步 | |
:help | ?、:h | 显示当前提示符的详细帮助 |
:exit | :quit | 取消向导并退出 |
使用 :back
您可以随时返回以更改先前的答案::back 时,向导返回到上一步。消息 “Going back to dataset selection…” 表示您正在返回到数据集选择步骤。
使用 :help
每个提示符都有上下文帮助。当您输入:help 时,向导会显示关于所询问内容的详细说明:
:help。帮助以英文显示,但清楚地解释了您需要做什么。
目录命令
这些命令在浏览模型或数据集时有效:| 命令 | 描述 |
|---|---|
/search <query> | 按名称搜索模型/数据集 |
/sort | 更改排序(trending、downloads、likes、recent) |
/filter | 按大小过滤模型(仅限模型) |
/refresh | 清除缓存并重新加载列表 |
/search
查找特定模型或数据集。当您知道要查找的名称或类型时使用此命令:/search 后跟关键字。您可以搜索:
- 模型名称:
/search gemma、/search llama - 模型类型:
/search code(专注于代码的模型) - 数据集名称:
/search alpaca - 数据集类型:
/search conversation(对话数据集)
/search gemma- 查找 Gemma 模型/search code- 查找专注于代码的模型/search alpaca- 查找 Alpaca 风格的数据集/search conversation- 查找对话数据集
/sort
更改结果的排序方式。当您想以不同方式查看模型/数据集时使用:/sort 然后按对应排序的键。
| 排序选项 | 键 | 描述 | 何时使用 |
|---|---|---|---|
| Trending | T | 当前流行的内容 | 查看社区当前使用的内容 |
| Downloads | D | 有史以来下载最多 | 查找最受验证/使用的模型 |
| Likes | L | 社区最喜欢 | 查看社区最爱 |
| Recent | R | 最新添加 | 发现新发布 |
/filter
按参数计数过滤模型(仅适用于模型,不适用于数据集)。非常有用用于查找适合您硬件的模型:/filter 然后按对应大小的键。这仅显示适合您硬件类型的模型。
| 过滤器 | 键 | 大小范围 | 典型硬件 | 模型示例 |
|---|---|---|---|---|
| All | A | 无过滤 | 任何 | 所有模型 |
| Small | S | < 3B 参数 | MacBook、消费级 GPU | gemma-3-270m、Llama-3.2-1B |
| Medium | M | 3B - 10B 参数 | 游戏 GPU、工作站 | gemma-2-2b、Llama-3.2-3B |
| Large | L | > 10B 参数 | 云 GPU、多 GPU | Llama-3.1-70B、Mistral-7B |
/refresh
清除缓存并获取最新数据。当列表看起来过时或您刚添加新模型/数据集时使用:/refresh 更新。
选择方法
选择模型或数据集时,您有几个选项:按数字
从显示的列表中选择:按 HuggingFace ID
输入完整的模型/数据集 ID:按本地路径
指向本地目录:输入约定
默认值
[方括号] 中的值是默认值。按 Enter 接受:
必填字段
标记为[REQUIRED] 的字段必须填写。如果您尝试跳过(按 Enter),将看到错误消息:
[REQUIRED] = 必填。您需要填写此字段才能继续。错误消息解释了为什么需要此字段。
是/否问题
用y(yes/是)或 n(no/否)回答。您也可以按 Enter 接受默认值:
[Y/n]- 默认是是(Yes)。按 Enter 接受”是”[y/N]- 默认是否(No)。按 Enter 接受”否”
键盘快捷方式
| 键 | 操作 |
|---|---|
| Enter | 接受默认值或确认输入 |
| Ctrl+C | 取消向导(与 :exit 相同) |
| 上/下箭头 | 滚动浏览编号选项(如果支持) |
高级参数
配置高级参数时,向导将它们分组:| 组 | 包含 |
|---|---|
| Training Hyperparameters | epochs、batch_size、lr、warmup_ratio |
| PEFT/LoRA | peft、lora_r、lora_alpha、quantization |
| DPO/ORPO | dpo_beta、max_prompt_length |
| Hub Integration | push_to_hub、username、token |
| Knowledge Distillation | teacher_model、distill_temperature |
| Hyperparameter Sweep | use_sweep、sweep_n_trials |
| Enhanced Evaluation | use_enhanced_eval、eval_metrics |
| Reinforcement Learning | rl_reward_model_path(仅 PPO) |
提示
自由使用 :help
自由使用 :help
每个提示符都有详细帮助。如果您不确定某事的含义,输入
:help。返回修复错误
返回修复错误
做出了错误选择?使用
:back 返回到上一步。您的其他答案会被保留。搜索而不是滚动
搜索而不是滚动
不要滚动浏览数百个模型,使用
/search llama 或 /search 7b 来缩小范围。按硬件过滤
按硬件过滤
不确定哪些模型会工作?使用
/filter →
S(small)仅查看适合消费级硬件的模型。首次运行接受默认值
首次运行接受默认值
在您的第一次训练中,接受大多数默认值。让某些东西工作,然后自定义。
命令快速参考
导航
目录(模型/数据集)
选择
输入
常见消息词汇表
使用向导时,您会看到这些英文消息。以下是它们的含义:| 英文消息 | 翻译 | 何时出现 |
|---|---|---|
Going back to... | 返回… | 当您使用 :back 时 |
Help | 帮助 | 当您使用 :help 时 |
Cache cleared | 缓存已清除 | 当您使用 /refresh 时 |
Model: ... 或 ✓ Model: ... | 模型:… | 当您选择模型时 |
Dataset: ... 或 ✓ Dataset: ... | 数据集:… | 当您选择数据集时 |
This field is required | 此字段是必需的 | 当您尝试跳过必填字段时 |
Configuration is valid! | 配置有效! | 当一切配置正确时 |
Start training? | 开始训练? | 在开始训练之前 |
Popular models (trending) | 热门模型(趋势) | 模型列表 |
Popular datasets (trending) | 热门数据集(趋势) | 数据集列表 |
Filter size: | 过滤大小: | 当您使用 /filter 时 |
Sort options: | 排序选项: | 当您使用 /sort 时 |