OpenAI前几天推出了GPT-3.5 Turbo的微调功能(fine-tuning for GPT-3.5 Turbo),用户可以用自己的数据训练模型并大规模运行它,打造专属GPT,并且早期测试显示,经过微调的GPT-3.5 Turbo在特定任务上可以达到或超过GPT-4的表现!下面ChatGPT中文网就分享下这个资讯信息。
一、GPT-3.5 Turbo微调功能介绍
所谓的GPT微调功能就是用我们自己的数据去训练已有的GPT模型,以达到增强GPT在某一方面的能力,得到我们自己的专属GPT模型。例如我们用自己的医学数据来训练GPT模型,以增强GPT在处理医学相关问题的能力,得到一个“医学版GPT”。
结合微调功能,GPT的能力可以在以下实例中得到增强:
- 改进的可控性:微调允许企业使模型更好地遵循指令,例如使输出简洁或始终以指定语言回应。例如,开发者可以利用微调确保模型在被提示使用该语言时总是用德语回应。
- 可靠的输出格式:微调提高了模型一致格式化响应的能力——这对于要求特定响应格式的应用至关重要,如代码补全或组成API调用。开发者可以使用微调更可靠地将用户提示转换为可用于他们自己系统的高质量JSON片段。
- 定制的语调:微调是优化模型输出的质量感觉的绝佳方式,如其语调,使其更适合企业的品牌声音。拥有可识别品牌声音的企业可以使用微调使模型的语调更一致。
目前OpenAI推出了GPT-3.5 Turbo的微调功能,而GPT-4和gpt-3.5-turbo-16k的微调功能也将在这个秋天上线!
二、GPT-3.5 Turbo微调功能步骤
根据OpenAI官方说明,GPT微调的步骤有4步。
1、准备数据
{ "messages": [ { "role": "system", "content": "You are an assistant that occasionally misspells words" }, { "role": "user", "content": "Tell me a story." }, { "role": "assistant", "content": "One day a student went to schoool." } ] }
2、上传文件
curl https://api.openai.com/v1/files \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -F "purpose=fine-tune" \ -F "file=@path_to_your_file"
3、创建微调作业
curl https://api.openai.com/v1/fine_tuning/jobs \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -d '{ "training_file": "TRAINING_FILE_ID", "model": "gpt-3.5-turbo-0613" }'
4、使用微调后的模型
curl https://api.openai.com/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -d '{ "model": "ft:gpt-3.5-turbo:org_id", "messages": [ { "role": "system", "content": "You are an assistant that occasionally misspells words" }, { "role": "user", "content": "Hello! What is fine-tuning?" } ] }'
消息来源: