功能特性¶

模型微调的功能特性参见下表：

一级功能	二级功能	描述
数据集	可视化创建数据集	提供直观的界面，支持创建训练、验证和测试数据集
	格式和类型	支持 Alpaca 格式和 ShareGPT 格式的数据集，以及自定义评测和人工评测类型的数据集。Alpacaga 支持指令监督微调、预训练、偏好训练、KTO、多模态数据集；ShareGPT 支持指令监督微调、偏好训练和 KTO 数据集；自定义评测类型支持文件格式为 csv 或 jsonline 的简答题和问答题；自定义评测仅支持 jsonline 文件
	S3存储支持	支持从S3存储中直接拉取文件，提升数据接入的便捷性
	本地文件上传	支持本地文件上传，提供多样化的数据接入方式
模型微调	微调方法	支持 LoRA、全量微调（full）、冻结微调（freeze）等多种模型微调方式的可视化管理
	训练阶段	支持（增量）预训练、多模态指令监督微调、奖励模型训练、PPO训练、DPO训练、KTO训练、ORPO训练等多种集成方法
	实时监控	支持查看微调过程中的学习率、训练损失和验证损失等关键数据，实时监控模型训练状态
	查看任务日志	支持查看微调过程中的日志信息
模型评测	基线评测	支持语言的字词释义、成语习语、语义相似度、指代消解；知识的知识问答；推理的文本蕴含、常识推理、数学推理、定理应用、综合推理；考试的初中/高中/大学/职业考试；理解的阅读理解、内容总结、内容分享等官方定义的数据集进行评测
	自定义评测	支持文件格式为 csv 或 jsonline 的选择题类型的数据集
	人工评测	通过人工标注模型推理结果，手动生成评测报告。仅支持 jsonline 格式的数据集
	基础模型评测	支持通过文件挂载方式接入的模型直接进行评测
	微调模型评测	支持对微调后的模型进行评测
模型导出	可视化导出模型	支持对 full 微调后的模型导出至模型广场，并部署对话
支持的基础模型	支持的模型	包括 LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Qwen2-VL、Yi、Gemma、Baichuan、ChatGLM、Phi 等等