{"id":2496,"date":"2022-07-18T18:37:43","date_gmt":"2022-07-18T18:37:43","guid":{"rendered":"https:\/\/lisdatasolutions.sidnpre.com\/?post_type=casos_de_uso&p=2496"},"modified":"2022-07-27T08:53:47","modified_gmt":"2022-07-27T08:53:47","slug":"web-scraping-medicamentos","status":"publish","type":"casos_de_uso","link":"https:\/\/www.lisdatasolutions.com\/es\/casos-de-uso\/web-scraping-medicamentos\/","title":{"rendered":"Web Scraping Medicamentos"},"content":{"rendered":"\n
Utilizando herramientas de web scrapping y RPA se extraen precios de medicamentos de sitios web. Estos datos se unen a informaci\u00f3n de fuentes open data, alimentando un dataware house que contiene series temporales de los precios y su evoluci\u00f3n en el tiempo.<\/p>\n\n\n\n
Los precios de los medicamentos y material sanitario en el entorno de la Uni\u00f3n Europea est\u00e1n fuertemente regulados, siendo los gobiernos de cada pa\u00eds, o incluso cada regi\u00f3n, los que fijan sus precios de acuerdo con la situaci\u00f3n socio-econ\u00f3mica y su clasificaci\u00f3n en gen\u00e9ricos, \u00fanicos o no subvencionados. Los datos publicados por los pa\u00edses suelen estar en formatos dif\u00edciles de tratar, principalmente pdf.<\/p>\n\n\n\n Generamos un dataset potente para poder realizar, en fases posteriores, estudios avanzados sobre los datos. Por ello, en esta primera fase nos centramos en la obtenci\u00f3n y generaci\u00f3n del almac\u00e9n de datos, conect\u00e1ndonos a datos publicados por organismos p\u00fablicos y privados, empleando en algunos casos tecnolog\u00edas de RPA (Robotic Process Automation) y web scrapping que nos permitan extraer informaci\u00f3n de casi cualquier documento o web site.<\/p>\n\n\n\n La primera fase consiste en el dise\u00f1o del modelo de datos que contendr\u00e1 el cat\u00e1logo de referencias, pa\u00edses y clasificaci\u00f3n. Dise\u00f1amos y desarrollamos los web scraper y procesos robotizados de extracci\u00f3n de precios para cada uno de los or\u00edgenes identificados, as\u00ed como para los portales de salud de cada pa\u00eds. Adaptamos los datos al modelo mediante procesos ETL, concluyendo el proceso con el almacenamiento en el repositorio de datos implementado. Utilizando herramientas de web scrapping y RPA se extraen precios de medicamentos de sitios web. Estos datos se unen a informaci\u00f3n de fuentes open data, alimentando un dataware house que contiene series temporales de los precios y su evoluci\u00f3n en el tiempo. Objetivos Extraer los precios de los medicamentos de diferentes or\u00edgenes Generar un datawarehouse […]<\/p>\n","protected":false},"author":1,"featured_media":2497,"comment_status":"open","ping_status":"closed","template":"","meta":{"inline_featured_image":false,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0},"casos-de-uso":[81,76],"acf":[],"yoast_head":"\n<\/figure>\n\n\n\n
Qu\u00e9 hacemos<\/h2>\n\n\n\n
C\u00f3mo lo hacemos<\/h2>\n\n\n\n
Cat\u00e1logo y clasificaci\u00f3n.<\/h3>\n\n\n\n
Destaca la importancia de la informaci\u00f3n de la que se dispondr\u00e1, as\u00ed como el volumen de datos que se podr\u00e1 extraer.<\/p>\n\n\n\nExtracci\u00f3n.<\/h3>\n\n\n\n
Implementamos un datawarehouse y modelo de datos para el almacenamiento de todas las series temporales identificadas.<\/p>\n\n\n\nAlmacenamiento y visualizaci\u00f3n.<\/h3>\n\n\n\n
Desarrollamos y desplegamos los cuadros de mando, informes e indicadores KPI que facilitan la consulta y exploraci\u00f3n de la informaci\u00f3n.<\/p>\n","protected":false},"excerpt":{"rendered":"