pdfwordfrequencycounter

This is a super crappy script I wrote that parses through Greek PDFs and, poorly, calculates the most common 750 words. It somewhat ignores articles, θα, να, and some other word fragments, but sucks at it. It was enough for my purposes so maybe it will help someone else.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
hp1.html		hp1.html
pdfanal.py		pdfanal.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

pdfwordfrequencycounter

About

Releases

Packages

Languages

TiddlyWiddly/pdfwordfrequencycounter

Folders and files

Latest commit

History

Repository files navigation

pdfwordfrequencycounter

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages