Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

wiseflow处理得到的info的摘要内容不理想。 #167

Open
calmyun opened this issue Dec 24, 2024 · 6 comments
Open

wiseflow处理得到的info的摘要内容不理想。 #167

calmyun opened this issue Dec 24, 2024 · 6 comments

Comments

@calmyun
Copy link

calmyun commented Dec 24, 2024

image
得到的info中的content如图所示。我作为用户的需求是wiseflow能根据爬取的这个网页,提炼这个网页的内容,并总结成一段跟我设置的focus_point密切相关的简要摘要。请问有什么方法优化。欢迎各位大神来留言。

@bigbrother666sh
Copy link
Member

你的图呢?
另外按你的描述存在逻辑误区,如果网页的内容和你的关注点不相关,又如何提炼总结为密切相关的摘要呢?
所以本质上依然是从网页中抽取你关注的信息点。

你可以把你要抽取的网站和你的兴趣点发出来,我们试着从这两块的关联性上入手优化。

@bigbrother666sh
Copy link
Member

我觉得你可以考虑为 focus_point 增加 explanation,以明确指定抽取的方向

@calmyun
Copy link
Author

calmyun commented Dec 25, 2024

你的图呢? 另外按你的描述存在逻辑误区,如果网页的内容和你的关注点不相关,又如何提炼总结为密切相关的摘要呢? 所以本质上依然是从网页中抽取你关注的信息点。

你可以把你要抽取的网站和你的兴趣点发出来,我们试着从这两块的关联性上入手优化。

我的根据focus_point来查找跟focus_point相关的url的,所以网页内容肯定是跟关注点相关的。

@bigbrother666sh
Copy link
Member

bigbrother666sh commented Dec 25, 2024

没太理解这个需求
“我的根据focus_point来查找跟focus_point相关的url的,所以网页内容肯定是跟关注点相关的。”

@calmyun
Copy link
Author

calmyun commented Dec 26, 2024

没太理解这个需求 “我的根据focus_point来查找跟focus_point相关的url的,所以网页内容肯定是跟关注点相关的。”

就是我本地部署的时候,我不是根据sites中的url来进行爬取的。我是根据focus_point,使用一些算法,来查找与focus_point密切相关的主流url,利用这些url进行爬取的。因此,我输入wiseflow的url都是跟focus_point密切相关的。

@calmyun
Copy link
Author

calmyun commented Dec 26, 2024

你的图呢? 另外按你的描述存在逻辑误区,如果网页的内容和你的关注点不相关,又如何提炼总结为密切相关的摘要呢? 所以本质上依然是从网页中抽取你关注的信息点。

你可以把你要抽取的网站和你的兴趣点发出来,我们试着从这两块的关联性上入手优化。

1
我已经在附件上加载了我关注点的信息。如图所示,我explanation字段也是设置了的。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants