Sobre Vicente Almenara:
- Profesional especializado en gestión de bases de datos y realización de soluciones tecnológicas, mediante Python principalmente, para extraer valor de los datos.
- Mis principales tareas se basan en extraer grandes cantidades de datos de distintas fuentes y
analizarlas, estableciendo patrones para descubrir oportunidades de negocio. - A continuación, interpreto los resultados obtenidos en dicho análisis y elaboro informes con los datos más relevantes.
- Estoy acostumbrado a transformar los datos en información útil que ayude a la empresa a elaborar estrategias en las distintas situaciones.
Experiencia
- Realización de trabajos con datawarehouses y uso de distintas herramientas de ETL (extracción, procesamiento y carga de todo tipo de datos) y de business intelligence.
- Gestión de bases de datos (Mysql).
Creación de tablas con diferentes características y modificación y tratamiento masivo de todo tipo de datos.
- Programación con Python de diferentes trabajos (librerías usadas principalmente: Pandas y Numpy), entre ellos tareas de web scraping a numerosas páginas webs (Selenium, Beautiful Soup, selectores CSS...).
- Comprobación del buen funcionamiento de los programas realizados mediante tests (librería principal utilizada: unittest) y mediante el uso de Grafana para comprobar visualmente que todas las métricas siguen un comportamiento correcto.
- Visualización de datos y extracción de conclusiones con Google Data Studio y Power BI.
- Documentación de APIs mediante Swagger.
- Realización de las tareas con software de control de versiones Git (Gitlab) y con Docker.
- Realización diagramas UML (lenguaje unificado de modelado de software) con diagrams.net.
- Acostumbrado a trabajar con metodologías ágiles y gestión de proyectos con Trello.
Educación
Máster en Data Science y Business Analytics.
Universidad Antonio Nebrija, impartido por IMF School en colaboración con Indra.
Principales temas tratados:
- Uso de distintas tecnologías y herramientas de ETL e inteligencia de negocio.
- Lenguaje de programación Python (librerías Numpy y Pandas) y R.
- Lenguaje SQL para base de datos.
- Visualización de datos con Power BI.
- Ecosistema Hadoop (Apache Spark, Hive/Impala, Sqoop, Pig, Flume, Zoekeeper, Oozie).
- Herramienta para el proceso ETL como Pentaho Data Integration (PDI) y para el tratamiento y visualización de datos: Power BI.
- Bases de datos NoSQL: HBase, MongoDB, Cassandra, Neo4J.
- Metodologías ágiles: principalmente marco de trabajo Scrum y herramientas Asana y Trello.