DA-Web-Crawling

Desafio Análise de Dados

Declarando as bibliotecas

import requests import csv from bs4 import BeautifulSoup as soup from requests.exceptions import HTTPError

Utilizando o pacote requests para fazer o download da página da Web

import requests from requests.exceptions import HTTPError import re

def crawl_website (url:str) -> str:

try: resposta = requests.get(url) resposta.raise_for_status() except HTTPError as exc: print (exc) else: return resposta.text

Conferindo como web crawler pode interagir

URL = 'https://github.com/trending'

robots = crawl_website(url = URL) print(robots)

Extraindo informações da Web

from bs4 import BeautifulSoup pagina = BeautifulSoup(open('trending.csv', mode='r'), 'html.parser')

texto = pagina.get_text() print(texto)

#Criando o arquivo CSV e extraindo os 10 projeto mais populares

pagina = soup(conteudo, 'html.parser') top10 = pagina.find_all('span', class_='text-normal')

with open(file='github.csv', mode='w', encoding='utf8') as file: writer = csv.writer(file, delimiter=';') writer.writerow(["Posição", "Repositório"])

for i in range(1,11):
    txt = top10[i].text.replace(" ", "").replace("/", "").strip()
    writer.writerow([i,txt])
    print(f"{i}-{txt}")

Lista com os 10 Projetos

1-easychen 2-shroominic 3-EbookFoundation 4-facebookresearch 5-charmbracelet 6-Uniswap 7-MakiNaruto 8-stalwartlabs 9-Lissy93 10-bigscience-workshop

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
DAWEBCrawling.py		DAWEBCrawling.py
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DA-Web-Crawling

Declarando as bibliotecas

Utilizando o pacote requests para fazer o download da página da Web

Conferindo como web crawler pode interagir

Extraindo informações da Web

Lista com os 10 Projetos

About

Releases

Packages

Languages

License

Maia-Polonio/DA-Web-Crawling

Folders and files

Latest commit

History

Repository files navigation

DA-Web-Crawling

Declarando as bibliotecas

Utilizando o pacote requests para fazer o download da página da Web

Conferindo como web crawler pode interagir

Extraindo informações da Web

Lista com os 10 Projetos

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages