Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Tokenized된 Data 길이 분석 #21

Open
sangHa0411 opened this issue Dec 2, 2021 · 0 comments
Open

Tokenized된 Data 길이 분석 #21

sangHa0411 opened this issue Dec 2, 2021 · 0 comments
Assignees
Labels
report Sharing information or results of analysis

Comments

@sangHa0411
Copy link
Contributor

  1. 논문
    • 해석 : 대부분의 길이가 512이 이하 인 것을 파악하였습니다.

스크린샷 2021-12-03 오전 12 30 27

  1. 법률
    • 해석 : 대부분의 길이가 512이 이하 인 것을 파악하였습니다.

스크린샷 2021-12-03 오전 12 32 03

  1. 잡지
    • 해석 : 대략 데이터의 2/3가 512이 넘는 것으로 파악되었습니다.

스크린샷 2021-12-03 오전 12 33 01

  1. 뉴스
    • 해석 : 대략 데이터의 1/2가 512이 넘는 것으로 파악되었습니다.

스크린샷 2021-12-03 오전 12 36 12

@sangHa0411 sangHa0411 added the report Sharing information or results of analysis label Dec 2, 2021
@sangHa0411 sangHa0411 self-assigned this Dec 2, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
report Sharing information or results of analysis
Projects
None yet
Development

No branches or pull requests

1 participant