Skip to content

Latest commit

 

History

History
273 lines (239 loc) · 10.4 KB

instructions-es.md

File metadata and controls

273 lines (239 loc) · 10.4 KB

Documentation

Estructura de los datos

Para los tweets

Ejemplo 1

1379024369574363139.png

{
    "tweet_id": "1379024369574363139",
    "tweet_url": "https:\/\/twitter.com\/ppmadrid\/status\/1379024369574363139",
    "username": "ppmadrid",
    "name": "PP Comunidad de Madrid",
    "profile_picture": "https:\/\/pbs.twimg.com\/profile_images\/1589390008389099521\/gLWMNjrk_normal.jpg",
    "replies": 4.0,
    "views": null,
    "retweets": 36,
    "likes": 75,
    "quotes": 2,
    "bookmarks": 0,
    "posted_time": "2021-04-05T10:51:27+00:00",
    "content": "#HuevosALoAyuso, no hay Tezanos que los pare ",
    "hashtags": [
        "HuevosALoAyuso"
    ],
    "mentions": [],
    "images": [],
    "videos": [
        "blob:https:\/\/twitter.com\/5816da6e-c9e6-4954-85aa-6b86b499aed9"
    ],
    "link": "",
    "replies_relation_target_id": "",
    "replies_relation_target_url": "",
    "quotes_relation_target_id": "1379023875292430336",
    "quotes_relation_target_url": "https:\/\/twitter.com\/pparganda\/status\/1379023875292430336"
}

Ejemplo 2

1386791731417567234.png

{
    "tweet_id": "1386791731417567234",
    "tweet_url": "https:\/\/twitter.com\/ppmadrid\/status\/1386791731417567234",
    "username": "ppmadrid",
    "name": "PP Comunidad de Madrid",
    "profile_picture": "https:\/\/pbs.twimg.com\/profile_images\/1589390008389099521\/gLWMNjrk_normal.jpg",
    "replies": 2.0,
    "views": null,
    "retweets": 19,
    "likes": 41,
    "quotes": 2,
    "bookmarks": 0,
    "posted_time": "2021-04-26T21:18:08+00:00",
    "content": "Los cierres perimetrales aumentan el nivel de contagio. \n\nNosotros aplicamos criterios t\u00e9cnicos de control sobre el virus. \n@eruizescudero\n en \n@Lanoche_24h",
    "hashtags": [],
    "mentions": [
        "eruizescudero",
        "Lanoche_24h"
    ],
    "images": [],
    "videos": [
        "blob:https:\/\/twitter.com\/12306201-09ff-4c18-859e-8ce2a9b82aa9"
    ],
    "link": "",
    "replies_relation_target_id": "1386790949301497856",
    "replies_relation_target_url": "https:\/\/twitter.com\/ppmadrid\/status\/1386790949301497856",
    "quotes_relation_target_id": "",
    "quotes_relation_target_url": ""
}

Ejemplo 3

1386647686997291015.png

{
    "tweet_id": "1386647686997291015",
    "tweet_url": "https:\/\/twitter.com\/ppmadrid\/status\/1386647686997291015",
    "username": "ppmadrid",
    "name": "PP Comunidad de Madrid",
    "profile_picture": "https:\/\/pbs.twimg.com\/profile_images\/1589390008389099521\/gLWMNjrk_normal.jpg",
    "replies": 3.0,
    "views": null,
    "retweets": 18,
    "likes": 0,
    "quotes": 43,
    "bookmarks": 0,
    "posted_time": "2021-04-26T11:45:45+00:00",
    "content": "La Comunidad de Madrid tambi\u00e9n es rica en vino. Y el sector vitivin\u00edcola tiene todo el apoyo de \n@IdiazAyuso\n.\n\nP\u00edo Garc\u00eda-Escudero visita en Aranjuez una empresa de productos quimicos de limpieza y una bodega de vinos de Madrid, bodegas El Regajal.\n\n#VotaLIBERTAD #YoConAyuso",
    "hashtags": [
        "VotaLIBERTAD",
        "YoConAyuso"
    ],
    "mentions": [
        "IdiazAyuso"
    ],
    "images": [
        "https:\/\/pbs.twimg.com\/media\/Ez5cuCHXMAMrb4P?format=jpg&name=small",
        "https:\/\/pbs.twimg.com\/media\/Ez5cuCAXEAIGW6O?format=jpg&name=small",
        "https:\/\/pbs.twimg.com\/media\/Ez5cuCBXEAAvzke?format=jpg&name=360x360",
        "https:\/\/pbs.twimg.com\/media\/Ez5cuCHXoAgjBfp?format=jpg&name=360x360"
    ],
    "videos": [],
    "link": "",
    "replies_relation_target_id": "",
    "replies_relation_target_url": "",
    "quotes_relation_target_id": "",
    "quotes_relation_target_url": ""
}

Ejemplo 4

1379020366828425218.png

{
    "tweet_id": "1379020366828425218",
    "tweet_url": "https:\/\/twitter.com\/ppmadrid\/status\/1379020366828425218",
    "username": "ppmadrid",
    "name": "PP Comunidad de Madrid",
    "profile_picture": "https:\/\/pbs.twimg.com\/profile_images\/1589390008389099521\/gLWMNjrk_normal.jpg",
    "replies": 2.0,
    "views": null,
    "retweets": 29,
    "likes": 50,
    "quotes": 1,
    "bookmarks": 0,
    "posted_time": "2021-04-05T10:37:31+00:00",
    "content": "El Gobierno de Espa\u00f1a tiene plena corresponsabilidad en el control de las medidas de restricci\u00f3n. \n\nLas cr\u00edticas del Gobierno de Espa\u00f1a al de Madrid son desleales, falsas y lo que est\u00e1n es buscando rentabilidad electoral.\n@Enrique_L_Lopez\n en \n@elmundoes",
    "hashtags": [],
    "mentions": [
        "Enrique_L_Lopez",
        "elmundoes"
    ],
    "images": [],
    "videos": [],
    "link": "https:\/\/t.co\/moldNzzxbn",
    "replies_relation_target_id": "",
    "replies_relation_target_url": "",
    "quotes_relation_target_id": "",
    "quotes_relation_target_url": ""
}

Para los retweets

Ejemplo

1317811543774531584.png retweeted_1317811543774531584.png

{
    "username": "MasMadrid__",
    "tweet_id": "1317811543774531584",
    "tweet_url": "https://twitter.com/equomadrid/status/1317811543774531584"
}

ℹ️ Los detalles del tweet retwiteado son guardados siguiendo la estructura anterior. Sin embargo, como la estructura anterior no guarda la relación de retwitear, solo la de twitear, no podríamos relacionar a los partidos con estos tweets. Por eso, guardamos tanto la información del tweet por un lado, como la acción de retwitear por otro lado.


Explicación

Para los tweeets
  • tweet_id —> ID del tweet
  • tweet_url —> URL del tweet
  • username —> Nick del autor (el @)
  • name —> El nombre de usuario que se pone el autor (Lo que NO es @)
  • profile_picture —> Imagen de perfil del usuario
  • replies —> Número de respuestas que tiene el tweet
  • views —> Número de visitas que tiene el tweet
  • retweets —> Número de retweets que tiene el tweet (NO CUENTAN LAS CITAS)
  • likes —> Número de likes del tweet
  • quotes —> Número de veces que ha sido citado el tweet
  • bookmarks —> Número de veces que se ha guardado el tweet
  • posted_time —> Fecha de publicación en formato ISO8601
  • content —> Contenido del tweet (texto).
  • hashtags —> Hashtags que aparecen en el contenido. Lista separada por comas.
  • menions —> Menciones que aparecen en el contenido. Lista separada por comas de los username mencionados.
  • images —> Imagenes adjuntadas en el tweet. Lista separada por comas con el link a la imagen.
  • videos —> Videos adjuntos al tweet. Lista separada por comas con el link al video.
  • link —> Link externos en el tweet. Una única URL. Hace referencia a cuando se publican noticias o enlaces a webs.
  • replies_relation_target_id —> Si es este tweet es una respuesta este campo será el ID del tweet al que se responde.
  • replies_relation_target_url —> Si es este tweet es una respuesta este campo será la URL del tweet al que se responde.
  • quotes_relation_target_id —> Si es este tweet es una cita este campo será el ID del tweet al que se cita.
  • quotes_relation_target_url —> Si es este tweet es una cita este campo será la URL del tweet al que se cita.
Para los retweeets
  • username —> @ de la cuenta que retwitea. (NO la retwiteada)
  • tweet_id —> ID del tweet retwiteado.
  • tweet_url —> URL del tweet retwiteado.

Ontología

Diagrama

DocumentOntology.png

⚠️ Por favor, las ediciones que hagas hazlas en nuevas versiones. Así mantenemos un histórico y podemos recuperar cosas pasadas.

LINK al diagrama

Las propiedades y relaciones que tendrá el KG están definidas en la ontología, no tengo ningún documento escrito sobre eso.

Especificación

Requisitos

  • Filtrar los discursos:
    • Por autor.
    • Por fecha.
    • Por tema.
    • Por ideología.
  • Conocer:
    • Los periodos electorales.
    • Los partidos políticos.
    • Las cuentas en redes sociales de los partidos políticos.
    • Los manifiestos políticos y las propuestas de los partidos.
    • El hashtag de la campaña electoral de cada partido (si lo hubiera).
  • Representar todas:
    • Las interacciones de cada canal de comunicación.
    • Las métricas del discurso.

Preguntas de competencia

  1. Dame los tweets del partido político Z que tengan relación con el transporte.
  2. Dame los tweets del partido político Z con más likes para cada medida de su programa político.
  3. Dame los tweets citados por el partido político Z que se hayan incluido en un hilo y sean de otras cuentas.
  4. Dame el hilo previo a las elecciones de 2021 de todos los partidos políticos.
  5. Dame el tweet previo a las elecciones de 2015 de todos los partidos políticos.
  6. Dame el usuario de twitter que más veces sea mencionado por el partido político Z.
  7. Dame el usuario de twitter que más veces sea citado por el partido político Z.
  8. Dame el tweet con más citas del partido político Z
  9. Dame los tweets que hayan sido citados por al menos 2 partidos políticos.
    1. Y la cuenta que más veces los haya publicado
  10. Dame los tweets que hayan sido retwitteados al menos por 2 partidos políticos.
    1. Y la cuenta que más veces los haya publicado
  11. Dame el tweet citado o retwitteado por más partidos políticos.
  12. Dame los tweets de un partido político que hayan sido retwitteados por otro.
  13. Dame el hashtag más twitteado por el partido político Z para las elecciones de 2019.
  14. Dame el hashtag más retwitteado por el partido político Z para las elecciones de 2019.
  15. Dame el partido político que más veces haya twitteado en 2021 y el que más haya retwitteado.
  16. Cómo ha cambiado el ODS X en las medidas propuestas por el partido político Z.