Introducción a las Bases de Datos

Publicado por Marcelo Freri el 26/2/2024

Las bases de datos están presentes en nuestra vida cotidiana más de los que nos damos cuenta. Tu lista de contactos en el móvil, las series que sigues en tu servicio de streaming favorito, tus publicaciones en redes sociales, tus correos electrónicos y hasta tu historial de vacunación se encuentran almacenados en bases de datos.

¿Qué es una Base de Datos?

Una base de datos es un conjunto de datos organizados y almacenados en un sistema informático, diseñado para facilitar el acceso, la gestión y la actualización de la información. Las bases de datos pueden contener diversos tipos de datos, como texto, números, imágenes, sonidos, entre otros, y están diseñadas para ser utilizadas por múltiples usuarios al mismo tiempo.

Las bases de datos son esenciales para la gestión de la información en muchas aplicaciones informáticas, como sistemas de gestión empresarial, aplicaciones web, sistemas de información geográfica, entre otros. Además, permiten realizar consultas y análisis de datos de forma eficiente y precisa, lo que las convierte en una herramienta fundamental en la toma de decisiones en muchas organizaciones.

Tipos de Bases de Datos

Las bases de datos se clasifican en diferentes tipos, como las bases de datos relacionales, las bases de datos jerárquicas, las bases de datos de objetos y las bases de datos documentales, entre otras. Cada tipo de base de datos tiene sus propias características y ventajas, y se utiliza en función del tipo de información que se quiere almacenar y del uso que se le vaya a dar.

  1. Bases de datos relacionales: Son las más utilizadas en la actualidad. Los datos se almacenan en tablas que están relacionadas entre sí a través de claves primarias y foráneas. Esto permite realizar consultas complejas y obtener información a partir de diferentes tablas. Ejemplos de sistemas gestores de bases de datos relacionales son MySQL, Oracle y SQL Server.

  2. Bases de datos jerárquicas: Los datos se almacenan en una estructura de árbol, donde cada registro tiene un único padre y puede tener varios hijos. Este tipo de bases de datos se utilizaba mucho en los años 60 y 70, pero hoy en día se usan menos debido a su baja flexibilidad.

  3. Bases de datos de objetos: Están diseñadas para almacenar y manipular objetos, que son instancias de clases definidas por el usuario. Este tipo de bases de datos se utiliza en aplicaciones que requieren manejar grandes cantidades de datos complejos, como sistemas de diseño asistido por computadora (CAD) o sistemas de información geográfica (GIS).

  4. Bases de datos documentales: Almacenan datos no estructurados o semiestructurados, como documentos de texto, imágenes o audio. Cada documento se almacena como una unidad independiente y se le pueden asignar etiquetas o metadatos para facilitar su búsqueda y recuperación. Ejemplos de bases de datos documentales son MongoDB y CouchDB.

En este artículo nos centraremos en la bases de datos relacionales, por ser las más comunes.

Bases de Datos Relacionales

Componentes

Los principales componentes de una base de datos relacional son:

  • Tablas
  • Claves
  • Índices
  • Vistas
  • Consultas
  • Transacciones

Tablas

En una base de datos relacional, una tabla es una estructura que se utiliza para almacenar datos. Una tabla está compuesta por filas y columnas, similar a una hoja de cálculo.

Las filas, también llamadas registros o tuplas, representan cada uno de los elementos o instancias que se desean almacenar en la tabla. Por ejemplo, en una tabla de clientes, cada fila representaría a un cliente diferente.

Las columnas, también llamadas campos o atributos, representan las características o propiedades de los elementos almacenados en la tabla. Siguiendo con el ejemplo anterior, las columnas podrían ser el nombre, apellido, dirección, teléfono, correo electrónico, etc.

Cada columna de la tabla tiene un nombre único y un tipo de datos asociado, que determina el tipo de información que se puede almacenar en esa columna (por ejemplo, texto, números enteros, fechas, etc.).

Una de las columnas de la tabla suele ser la clave primaria, que es un identificador único para cada fila de la tabla y se utiliza para relacionar la tabla con otras tablas en la base de datos.

Ejemplo de una tabla

En resumen, una tabla en una base de datos relacional es una estructura que permite almacenar datos de forma organizada y estructurada, utilizando filas y columnas para representar elementos y sus propiedades, respectivamente.

Claves

Una clave es un campo o conjunto de campos que se utiliza para identificar de manera única cada fila o registro de una tabla.

Los tipos de claves más comunes son:

  • Clave primaria
  • Clave secundaria
  • Clave foránea
Clave Primaria

Una clave primaria es una columna o conjunto de columnas que identifica de forma única cada fila en una tabla. La clave primaria se utiliza para garantizar la integridad y la consistencia de los datos almacenados en la tabla, ya que cada fila debe tener un valor único para la clave primaria.

Las claves primarias suelen ser automáticas y numéricas, y se generan automáticamente cuando se crea una nueva fila en la tabla. Además, las claves primarias no pueden contener valores nulos y deben ser indexadas para optimizar el acceso a los datos.

Clave Secundaria

Una clave secundaria es una columna o conjunto de columnas que también se utiliza para identificar filas en una tabla, pero que no necesariamente es única para cada fila. A menudo, una clave secundaria se utiliza para establecer relaciones entre tablas en una base de datos relacional, y puede contener valores nulos y duplicados.

Las claves secundarias también se pueden utilizar para optimizar el acceso a los datos al crear índices en las columnas correspondientes. Sin embargo, a diferencia de las claves primarias, las claves secundarias no garantizan la integridad y la consistencia de los datos almacenados en la tabla.

Clave Foránea

La clave foránea se define en una tabla como una columna o conjunto de columnas que contienen valores que coinciden con los valores de la clave primaria de otra tabla. Esta relación permite garantizar la integridad referencial de los datos almacenados en la base de datos, ya que la clave foránea debe contener valores válidos que existan en la tabla referenciada.

El término “foránea” se refiere a que el dato contenido en ella no forma parte del contexto de atributos contenidos en la tabla, sino que pertenecen al contexto de una tabla diferente.

Índices

Un índice es una estructura de datos que se utiliza para optimizar el acceso a los datos almacenados en una tabla.

Un índice funciona de manera similar a un índice en un libro, donde se enumeran los temas y las páginas en las que se pueden encontrar. En el caso de una base de datos, el índice contiene una lista ordenada de valores de una o más columnas de una tabla, junto con una referencia a la ubicación física de los registros correspondientes en la tabla.

Cuando se realiza una consulta a la tabla para buscar datos específicos, el motor de la base de datos puede utilizar el índice para encontrar los registros relevantes más rápidamente, en lugar de tener que escanear toda la tabla secuencialmente. Esto puede mejorar significativamente el rendimiento de las consultas, especialmente en tablas grandes.

Es importante tener en cuenta que el uso de índices también puede tener un impacto en el rendimiento de las operaciones de escritura en la tabla, como la inserción, actualización o eliminación de registros, ya que el motor de la base de datos debe actualizar los índices correspondientes cada vez que se modifican los datos. Por lo tanto, es necesario diseñar cuidadosamente los índices para equilibrar el rendimiento de las consultas y las operaciones de escritura.

Vistas

Se trata de una tabla virtual que se define a partir de una consulta y que permite mostrar los datos almacenados en otras tablas de forma personalizada y simplificada.

Una vista no almacena datos propiamente dichos, sino que se basa en los datos almacenados en otras tablas y presenta una vista lógica de esos datos. La definición de una vista incluye la especificación de las columnas que se van a mostrar, el orden en que se van a presentar los datos y cualquier filtro o restricción que se vaya a aplicar a los datos.

Las vistas pueden ser útiles en varios escenarios, como por ejemplo:

  • Simplificar la consulta de datos: al crear una vista que contenga solo los datos relevantes para una aplicación o usuario en particular, se pueden simplificar las consultas y reducir la cantidad de datos que se necesitan procesar.

  • Ocultar información: al crear una vista que muestre solo una parte de los datos almacenados en una tabla, se puede ocultar información sensible o irrelevante para ciertos usuarios.

  • Combinar datos de varias tablas: al crear una vista que combine datos de varias tablas, se pueden presentar los datos de forma más coherente y facilitar su análisis.

Las vistas se pueden utilizar como si fueran tablas físicas, es decir, se pueden realizar consultas, filtrar datos, ordenar resultados, etc. Sin embargo, es importante tener en cuenta que cualquier cambio en los datos subyacentes de las tablas originales se reflejará en la vista correspondiente.

Consultas

Se conoce como consulta a la operación que se realiza para recuperar o manipular datos almacenados en una o varias tablas.

La consulta se expresa mediante un lenguaje de consulta, como SQL (Structured Query Language), que permite especificar los criterios de búsqueda y seleccionar los campos y filas deseados. Las consultas pueden ser simples o complejas, dependiendo del número de tablas involucradas y de la complejidad de los criterios de selección.

Las consultas se utilizan para realizar diversas operaciones en la base de datos, como por ejemplo:

  • Obtener datos de una o varias tablas según criterios específicos.
  • Insertar nuevos registros en una tabla.
  • Actualizar los datos existentes en una tabla.
  • Eliminar registros de una tabla.
  • Crear nuevas tablas o modificar la estructura de las tablas existentes.
  • Realizar operaciones de agregación y cálculo en los datos almacenados en la base de datos.

Las consultas son una herramienta fundamental en la gestión y el análisis de datos almacenados en bases de datos relacionales, ya que permiten extraer información relevante y procesarla de manera eficiente.

Transacciones

Una transacción es una unidad de trabajo lógica que se compone de una o varias operaciones de lectura y escritura en la base de datos, y que se ejecuta de forma atómica e indivisible.

Cada transacción debe satisfacer cuatro propiedades fundamentales, conocidas como ACID (Atomicity, Consistency, Isolation and Durability):

  • Atomicidad: la transacción se ejecuta como una unidad indivisible, es decir, o se completa en su totalidad o no se realiza ningún cambio en la base de datos.

  • Consistencia: la transacción debe dejar la base de datos en un estado consistente, lo que significa que debe mantener la integridad de los datos y cumplir con todas las restricciones definidas en la base de datos.

  • Aislamiento: cada transacción se ejecuta de forma aislada respecto a las demás transacciones que se estén realizando en la base de datos, por lo que los cambios realizados por una transacción no son visibles para otras transacciones hasta que la primera se ha completado.

  • Durabilidad: una vez completada una transacción, los cambios realizados en la base de datos son permanentes y no se pierden, incluso en caso de fallos del sistema.

Las transacciones son una herramienta fundamental en la gestión de bases de datos, ya que permiten garantizar la integridad y la consistencia de los datos almacenados en la base de datos, especialmente en entornos concurrentes donde varios usuarios pueden acceder y modificar los datos simultáneamente.

Sistemas Gestores de Bases de Datos

Un sistema gestor de bases de datos (DBMS) es un software que permite la creación, mantenimiento, administración y uso de bases de datos. Estos sistemas proveen una interfaz entre la base de datos y los usuarios finales o las aplicaciones de software, permitiendo a los usuarios interactuar con la base de datos de una manera más fácil y eficiente.

Los DBMS son responsables de organizar y almacenar los datos de manera eficiente, garantizar la integridad y seguridad de los datos, permitir el acceso concurrente de múltiples usuarios y aplicaciones, y proporcionar herramientas para la administración, el mantenimiento e incluso el respaldo de la base de datos.

Algunos ejemplos populares de DBMS son:

  • MariaDB
  • MongoDB
  • MS SQL Server
  • MySQL
  • Oracle
  • PostgreSQL

Conclusión

Las bases de datos son una herramienta esencial para las empresas y organizaciones de todos los tamaños. Proporcionan una forma organizada y eficiente de almacenar y recuperar información.

Sus características de almacenamiento y gestión de acceso a los datos les permiten soportar una amplia gama de aplicaciones, desde la gestión de transacciones en tiempo real hasta el análisis de datos empresariales complejos y la minería de datos.