Para mayores informaciones
Proyecto de Web Scraping desarrollado en el curso de Inteligencia Artificial en Factoría F5
La empresa XYZ Corp está pensando en utilizar una frase que se identifique con sus valores y su misión. El objetivo de este proyecto es desarrollar un programa en Python que realice web scraping para extraer todas las frases de la web quotes.toscrape , además de las frases se quieren recuperar el autor de cada frase, los tags asociados a cada frase, y la pagina "about" con información de los autores. Los datos extraídos deben ser formateados y almacenados adecuadamente.
1. Acceder a una web preparada para ser scrapeada: La web contiene muchas frases, con información relacionada .
2. Extraer información relevante: Utilizar técnicas de web scraping en Python para obtener todas las frases con la información extra (autor, tags, about).
3. Formatear los datos: Asegurarse de que los datos extraídos estén limpios y organizados de manera coherente.
4. Almacenar los datos en una base de datos: Utilizar una base de datos SQL o NoSQL para guardar la información extraída.
Control de Versiones: Git/GitHub
Lenguaje de Programación: Python (bibliotecas: BeautifulSoup, Scrapy, Requests, etc.)
Base de Datos: MySQL
Herramientas de gestión de proyectos: (Github Proyectos con Kanban)
describir....
Elegí el apartado de Gestión de Proyecto del Github para controlar mis tareas usando la metodología Ágil Kanban.