请问如何自定义数据集，数据集量需要多大呢 #1991

sh66666 · 2023-12-25T13:21:10Z

sh66666
Dec 25, 2023

这是我定义的数据集，80条意义相同的问答，微调glm3，qwen7b都没有效果，这是为什么
希望大佬能教教我

snowpalm · 2023-12-27T02:22:06Z

snowpalm
Dec 27, 2023

我自己数据集是近600条数据（包含你是谁，来自哪里及什么能力和领域专业数据等），采用的是epoch num 30 及 LR学习率 1e-3采用LoRA微调方法，其它参数没调整，qwen7B-chat UI上的Chat或者Evaluate等都还可以，chatglm3-6b-chat在UI Chat上仅对你是谁等问答有效，其它无效果，但Evaluate的输出效果还是较明显。供参考。 Issue list中有个对chatglm3-6b的lora微调参数的解决方法，设定lora_rank 32， epoches 30，利用self-cognition数据集进行微调的有效，但对于我自己的数据集缺无效。看来学习率调整有很大作用，仅供参考。

4 replies

sh66666 Dec 27, 2023
Author

glm3对自我认知理解的很好是吗，微调完成后对其他问题回答会有混乱是吗？qwen7bchat不会出现这种情况吗？
请问，你的数据是关于一个问题有许多条问答对，还是说对一个问题，使用一个或几个问答对进行微调就有效果？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问如何自定义数据集，数据集量需要多大呢 #1991

{{title}}

Replies: 1 comment 4 replies

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

请问如何自定义数据集，数据集量需要多大呢 #1991

sh66666 Dec 25, 2023

Replies: 1 comment · 4 replies

snowpalm Dec 27, 2023

sh66666 Dec 27, 2023 Author

snowpalm Dec 28, 2023

statsmind Feb 29, 2024

Egber1t Apr 16, 2024

sh66666
Dec 25, 2023

Replies: 1 comment 4 replies

snowpalm
Dec 27, 2023

sh66666 Dec 27, 2023
Author