Cesta de la compra

Sistemas de Big Data

Autor Victor Manuel López Fandiño

Editorial RA-MA EDITORIAL

Sistemas de Big Data
-5% dto.    29,90€
28,41€
Ahorra 1,50€
Disponible online, recíbelo en 24/48h laborables

¿Quieres recogerlo en librería?
Envío gratis
España peninsular
  • Editorial RA-MA EDITORIAL
  • ISBN13 9788419857187
  • ISBN10 8419857181
  • Tipo LIBRO
  • Páginas 302
  • Año de Edición 2023
  • Idioma Castellano
  • Encuadernación Rústica

Sistemas de Big Data

Autor Victor Manuel López Fandiño

Editorial RA-MA EDITORIAL

-5% dto.    29,90€
28,41€
Ahorra 1,50€
Disponible online, recíbelo en 24/48h laborables

¿Quieres recogerlo en librería?
Envío gratis
España peninsular

Detalles del libro

El concepto de Big Data no solo hace referencia a grandes colecciones de datos, caracterizadas tanto por su volumen como por la variedad de formatos, sino que incluye también los sistemas y las tecnologías encargadas de almacenar, procesar y dar valor a toda esa información. La motivación para gestionar y analizar estos datos surge de la evidencia de que el estudio de estos grandes volúmenes permite adquirir un conocimiento que no es posible abordando solo conjuntos pequeños.

De forma clara y didáctica, el presente libro proporciona una idea panorámica y completa de los diferentes sistemas involucrados en el tratamiento del dato.
Esta visión general facilita al lector la comprensión sencilla de los temas tratados, y proporciona el posicionamiento y la asimilación de los distintos elementos que componen el ecosistema de tecnologías, servicios y soluciones de Big Data.

Comenzando por las arquitecturas para la organización de la información, el libro se adentra en los sistemas para el almacenamiento y procesado del dato, llegando después a las distintas formas de explotación analítica: descriptiva, predictiva, prescriptiva y cognitiva. El gobierno del dato y la gestión de las distintas operaciones involucradas cierran este amplio e interesante recorrido.

Los contenidos adaptados al Curso de Especialización en Inteligencia Artificial y Big Data.

PRESENTACIÓN
ACERCA DEL AUTOR
CAPÍTULO 1. BIG DATA: DEL DATO A LA INFORMACIÓN
1.1 DATOS, INFORMACIÓN Y CONOCIMIENTO
1.2 CARACTERIZACIÓN DEL DATO
1.2.1 Datos en cuanto al tipo
1.2.2 Datos en cuanto al formato
1.2.3 Datos en cuanto al generador
1.2.4 Datos en cuanto al tamaño
1.2.5 Datos en cuanto a su rol
1.2.6 Datos en cuanto a su latencia
1.2.7 Datos en cuanto a su sensibilidad
1.3 BIG DATA EN CONTEXTO
1.3.1 El modelo de las cinco uves
1.3.2 Empresas orientadas por los datos
1.3.3 Computación en la nube
1.3.4 Gestión y gobierno del dato
1.4 ETAPAS DE ANÁLISIS EN LA EXPLOTACIÓN DE LA INFORMACIÓN
1.4.1 Analítica descriptiva
1.4.2 Analítica prescriptiva
1.4.3 Analítica predictiva
1.4.4 Analítica cognitiva
1.5 ESCENARIOS DE APLICACIÓN DEL BIG DATA
1.6 RESUMEN DEL CAPÍTULO
CAPÍTULO 2. ARQUITECTURAS Y PATRONES PARA BIG DATA
2.1 PATRONES ARQUITECTURALES
2.1.1 Tipologías de patrones
2.2 ARQUITECTURAS DE DATOS CENTRALIZADAS
2.2.1 Generación 0 (1970): sistemas transaccionales
2.2.2 Generación 1 (1980): data warehouse
2.2.3 Generación 2 (1990): almacenes operacionales
2.2.4 Generación 3 (2000): gestión de datos maestros
2.2.5 Generación 4 (2010): data lake
2.2.6 Generación 5 (2020): data lakehouse
2.3 ARQUITECTURAS DE DATOS ORIENTADA POR DOMINIOS
2.3.1 El concepto de data mesh
2.3.2 Organización distribuida de datos según dominios
2.3.3 El dato como producto
2.3.4 Plataforma compartida y gobierno federado
2.4 RESUMEN DEL CAPÍTULO
CAPÍTULO 3. SISTEMAS DE ALMACENAMIENTO
3.1 BASES DE DATOS RELACIONALES
3.1.1 Gestión de cargas analíticas
3.1.2 Escenarios e inconvenientes
3.1.3 Software y soluciones para data warehouse
3.2 SISTEMAS DE ARCHIVOS DISTRIBUIDOS
3.2.1 Apache Hadoop HDFS
3.2.2 Formatos de archivos
3.2.3 Escenarios e inconvenientes
3.2.4 Software y soluciones para Apache Hadoop
3.3 ALMACENES DE OBJETOS
3.3.1 Catálogos de tablas
3.3.2 Escenarios e inconvenientes
3.3.3 Servicios para el almacenamiento de objetos
3.4 BASES DE DATOS NOSQL
3.4.1 El modelo BASE y el teorema CAP
3.4.2 Gestores NoSQL según el modelo de datos.
3.4.3 Software y servicios de bases de datos NoSQL
3.5 RESUMEN DEL CAPÍTULO
CAPÍTULO 4. PROCESAMIENTO DE DATOS POR LOTES
4.1 EXTRACCIÓN, TRANSFORMACIÓN Y CARGA
4.1.1 Extracción
4.1.2 Transformación
4.1.3 Carga.
4.2 MODELADO DE DATOS Y GESTIÓN DE CAMBIOS
4.2.1 Modelos multidimensionales
4.2.2 Cambios en los datos y gestión de la historia.
4.3 TECNOLOGÍAS PARA EL TRATAMIENTO DE DATOS
4.3.1 Apache Hadoop.
© RA-MA ÍNDICE 9
4.3.2 Aplicaciones MapReduce
4.3.3 Apache Spark
4.3.4 Tecnologías para flujos ETL
4.4 MOTORES DE CONSULTA DISTRIBUIDOS
4.4.1 Apache Hive.
4.4.2 Otros motores especializados
4.4.3 Apache Arrow
4.5 RESUMEN DEL CAPÍTULO
CAPÍTULO 5. GESTIÓN DE EVENTOS EN TIEMPO REAL
5.1 TRANSMISIÓN DE EVENTOS
5.1.1 Transmisión de eventos y colas de mensajes
5.1.2 Apache Kafka
5.2 PROCESAMIENTO DE EVENTOS
5.2.1 Consideraciones sobre el análisis de datos en tiempo real
5.2.2 Soluciones para el procesamiento de eventos
5.3 UNIFICACIÓN DE PROCESOS
5.3.1 El modelo Lambda
5.3.2 El modelo Kappa
5.3.3 Revisitando los catálogos de tablas
5.4 RESUMEN DEL CAPÍTULO
CAPÍTULO 6. ANÁLISIS DESCRIPTIVO: EXPLORACIÓN DE LOS DATOS
6.1 MOTIVACIÓN Y OBJETIVOS
6.2 CARACTERIZACIÓN DE LOS DATOS
6.2.1 Observaciones y atributos
6.2.2 Relaciones entre atributos
6.3 ANÁLISIS EXPLORATORIO
6.3.1 Análisis univariante
6.3.2 Análisis multivariante
6.4 ANÁLISIS MULTIDIMENSIONAL
6.4.1 Cuadros de mando y KPI
6.5 SISTEMAS PARA EL ANÁLISIS DESCRIPTIVO
6.5.1 Flujo de construcción de un cuadro de mando
6.5.2 Herramientas y soluciones
6.6 RESUMEN DEL CAPÍTULO
CAPÍTULO 7. ANÁLISIS PREDICTIVO: MINERÍA DE DATOS
7.1 MOTIVACIÓN Y OBJETIVOS
7.2 PREPROCESADO DE LOS DATOS
7.3 MODELIZACIÓN DE LOS DATOS
7.3.1 Aprendizaje supervisado
7.3.2 Aprendizaje no supervisado
7.4 PUESTA EN PRODUCCIÓN E INFERENCIA DE MODELOS
7.4.1 Escenarios de inferencia de modelos
7.5 HERRAMI

Más libros de Victor Manuel López Fandiño