-
Notifications
You must be signed in to change notification settings - Fork 58
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
最終用於實驗測試的數據集(處理后的FB15K,與FB20K) #4
Comments
您好, |
多谢若冰。没关系,我很快返校,到时候我们见面聊。 Miao Fan *(范淼)*
在 2016年3月11日 下午9:28,Ruobing Xie [email protected]写道:
|
其实我更想具体知道您对FB15K过滤了哪些entity,我希望可以得到十分准确的数据集进行比对。 Miao Fan *(范淼)*
在 2016年3月11日 下午9:28,Ruobing Xie [email protected]写道:
|
entity为14,904个,过滤掉的是: |
最好是有标准的数据集, Miao Fan *(范淼)*
在 2016年3月12日 上午11:59,Ruobing Xie [email protected]写道:
|
已更新entity list下载链接 |
@xrb92 有个疑问?为什么在使用CNN时,对每个实体的描述要使用其摘要中的实体name? 这里用实体name,并通过word2vec来计算entity的预向量,是想捕获出实体间的共现关系吗? 麻烦介绍下,谢谢 |
您好,若冰。
拜讀了您的文章,我受益匪淺。
可否與您共享一下經過處理后的FB15K,與FB20K的數據集?
我在論文里沒有找到太具體的處理數據集的方法,特別是選擇多少關鍵詞作為描述,或者去掉了具體哪些entity。
如果可以直接共享一下最終用於測試的數據集,恐怕會有更多的人樂於引用和進一步研究,也包括我:)
The text was updated successfully, but these errors were encountered: