We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
您好.
我发现有两个参数在训练时和预训练文件中的值不一致.
在https://github.com/brightmart/xlnet_zh的预训练中的1、生成tfrecords:中的配置中: --reuse_len=256 \
https://github.com/brightmart/xlnet_zh
预训练
1、生成tfrecords:
--reuse_len=256 \
在https://github.com/brightmart/xlnet_zh的预训练中的2、训练模型:中的配置中: --mem_len=384 \
2、训练模型:
--mem_len=384 \
在下载预训练文件的config.json中.(12层的小模型, 24层的大模型配置文件都如此)
"mem_len": null, "reuse_len": null,
请问这是什么原因导致的? 这在预测的时候是否会导致xlnet退化成bert?
The text was updated successfully, but these errors were encountered:
No branches or pull requests
您好.
我发现有两个参数在训练时和预训练文件中的值不一致.
在
https://github.com/brightmart/xlnet_zh
的预训练
中的1、生成tfrecords:
中的配置中:--reuse_len=256 \
在
https://github.com/brightmart/xlnet_zh
的预训练
中的2、训练模型:
中的配置中:--mem_len=384 \
在下载预训练文件的config.json中.(12层的小模型, 24层的大模型配置文件都如此)
请问这是什么原因导致的? 这在预测的时候是否会导致xlnet退化成bert?
The text was updated successfully, but these errors were encountered: