sábado, 22 de octubre de 2011

SEMANA 11- MODELO DE DATOS

MODELO DE DATOS

Un diagrama o modelo entidad-relación (a veces denominado por sus siglas, E-R "Entity relationship", o, "DER" Diagrama de Entidad Relación) es una herramienta para el modelado de datos de un sistema de información. Estos modelos expresan entidades relevantes para un sistema de información así como sus interrelaciones y propiedades.
Modelado Entidad-Relación
El Modelo Entidad-Relación.
  1. Se elabora el diagrama (o diagramas) entidad-relación.
  2. Se completa el modelo con listas de atributos y una descripción de otras restricciones que no se pueden reflejar en el diagrama.
Dado lo rudimentario de esta técnica se necesita cierto entrenamiento y experiencia para lograr buenos modelos de datos.
El modelado de datos no acaba con el uso de esta técnica. Son necesarias otras técnicas para lograr un modelo directamente implementable en una base de datos. Brevemente:

  • Conversión en tablas (en caso de utilizar una base de datos relacional).

    • 
    Definicion de modelo de datos
    ``Un modelo de datos es un sistema formal y abstracto que permite describir los datos de acuerdo con reglas y convenios predefinidos. Es formal pues los objetos del sistema se manipulan siguiendo reglas perfectamente definidas y utilizando exclusivamente los operadores definidos en el sistema, independientemente de lo que estos objetos y operadores puedan significar. ‘‘  
    ``Un modelo de datos es una combinación de tres componentes:
    1. una colección de estructuras de datos (los bloques constructores de cualquier base de datos que conforman el modelo);
    2. una colección de operadores o reglas de inferencia, los cuales pueden ser aplicados a cualquier instancia de los tipos de datos listados en (1) , para consultar o derivar datos de cualquier parte de estas estructuras en cualquier combinación deseada;
    3. una colección de reglas generales de integridad, las cuales explícita o implícitamente definen un conjunto de estados consistentes --estas reglas algunas veces son expresadas como reglas de insertar-actualizar-borrar. ‘‘
    Un modelo de datos puede ser usado de las siguientes maneras:
    • i) como una herramienta para especificar los tipos de datos y la organización de los mismos que son permisibles en una base de datos específica;
    • ii) como una base para el desarrollo de una metodología general de diseño para las bases de datos;
    • iii) como una base para el desarrollo de familias de lenguajes de alto nivel para manipulación de consultas ( querys ) y datos;
    • iv) como el elemento clave en el diseño de la arquitectura de un manejador de bases de datos.
    El primer modelo de datos desarrollado con toda la formalidad que esto implica fue el modelo relacional , en 1969, mucho antes incluso que los modelos jerárquicos y de red. A pesar de que los sistemas jerárquicos y de red como software para manejar bases de datos son previos al modelo relacional, no fue sino hasta 1973 que los modelos de tales sistemas fueron definidos, apenas unos cuantos años antes de que estos sistemas empezaran a caer en desuso.
    “El modelo de datos es el proceso que implica crear una representación que tienen los usuarios de los datos Si el modelo de datos representa en forma incorrecta la visión que poseen los usuarios de los datos, encontrarán las aplicaciones difíciles de usar, incompletas y por supuesto en el desarrollo de las bases de datos y sus aplicaciones..”
    “Un modelo de datos es una serie de conceptos que puede utilizarse para describir un conjunto de datos y las operaciones para manipularlos.
    Hay dos tipos de modelos de datos: los modelos conceptuales y los modelos lógicos.
    • Los modelos conceptuales se utilizan para representar la realidad a un alto nivel de abstracción. Mediante los modelos conceptuales se puede construir una descripción de la realidad fácil de entender.
    • En los modelos lógicos , las descripciones de los datos tienen una correspondencia sencilla con la estructura física de la base de datos.
    En el diseño de bases de datos se usan primero los modelos conceptuales para lograr una descripción de alto nivel de la realidad, y luego se transforma el esquema conceptual en un esquema lógico. El motivo de realizar estas dos etapas es la dificultad de abstraer la estructura de una base de datos que presente cierta complejidad.
    Un esquema es un conjunto de representaciones lingüísticas o gráficas que describen la estructura de los datos de interés.
    Los modelos conceptuales deben ser buenas herramientas para representar la realidad, por lo que deben poseer las siguientes cualidades:
    • Expresividad : deben tener suficientes conceptos para expresar perfectamente la realidad.
    • Simplicidad : deben ser simples para que los esquemas sean fáciles de entender.
    • Minimalidad : cada concepto debe tener un significado distinto.
    • Formalidad : todos los conceptos deben tener una interpretación única, precisa y bien definida.
    En general, un modelo no es capaz de expresar todas las propiedades de una realidad determinada, por lo que hay que añadir aserciones que complementen el esquema.”
     

    Resumen:

    Un modelo de datos es una serie de conceptos que puede utilizarse para describir un conjunto de datos y las operaciones para manipularlos.
    Más explícitamente:
    Un modelo de datos es la combinación de una colección de estructuras de datos, operadores o reglas de inferencia y de reglas de integridad, las cuales definen un conjunto de estados consistentes. El cual puede ser usado como una herramienta para especificar los tipos de datos y la organización de los mismos. Además para la manipulación de consultas y datos, así mismo es el elemento clave en el diseño de la arquitectura de un manejador de BD.
    El primer modelo de datos fue el relacional en 1969, mucho antes incluso que los modelos jerárquicos y de red.
    . Técnica de Aplicaciones
       El problema de las bases de datos es cómo buscar en ellas; no porque sea especialmente dificultoso sino porque – a pesar de los intentos efectuados – no hay un único lenguaje o modelo de interrogación.
    Por eso, es importante tomarse un tiempo cada vez que nos enfrentemos a una base de datos, y consultar la ayuda que casi todas incorporan.
     No obstante, hay una serie de rasgos que suelen ser comunes (aunque su utilización pueda ser diferente):
         Toda consulta se traduce en una especie de ecuación, que es la que interroga al sistema. Muchas veces oiremos hablar de ella como ecuación de búsqueda.
         Puede buscarse por un único campo (sólo en un tipo de datos del registro: materias, títulos,...), por varios a la vez o por todos (o al menos, por los más significativos).
    Normalmente, los términos están normalizados (se establece que un nombre de autor o una materia, por ej., aparezca siempre de la misma forma).
         Se utiliza la lógica booleana para buscar por varios términos a la vez. Cuando veamos el término búsqueda avanzada, generalmente hace referencia a la utilización de tal lógica.
    Los elementos básicos de la misma (llamados operadores booleanos) son los siguientes:
    Y :  representa una intersección (en Matemáticas “Ç”) y reduce los resultados
    Significa que los términos buscados deben encontrase todos a la vez en los registros que recuperemos. Acota, por tanto, los resultados: sirve para reducir su número.
    Algunas otras formas en que aparece son: AND, + , .AND., ...
    Ej.: "economics and spain " recupera sólo los registros donde aparezcan a la vez los dos términos
    O :  representa una unión (en Matemáticas “È”). Amplía los resultados.
    Su uso provoca que en los resultados aparezca uno cualquiera de los términos buscados en solitario, cualquier combinación de ellos (si son más de dos) y todos ellos a la vez.
    Generalmente, obtenemos demasiados resultados, produciéndose ruido documental (información que no responde a lo que nos interesa en una búsqueda).
    Otras formas de representación: OR, / , .OR., ...
    Ej.: "economics or social" recupera los registros que contengan alguno de los términos o los dos a la vez.
    NOT :  representa la negación: excluye (en Matemáticas “Ë”)
    Todo término que siga al operador será considerado como no pertinente y eliminará del resultado los registros que lo contengan
    Se representa también como: NOT, — , .NOT., ...
    Existen otros operadores booleanos, que son combinación de los anteriores. Pondremos como ejemplo el “O exclusivo” (NOR): funciona exactamente como el O; pero invalida los registros en que aparezcan todos los términos implicados a la vez: sólo serán válidos los que contengan un único término (uno, u otro, u...)
    Ej.: "Economics not spain" recupera sólo los registros que incluyan economics pero no spain.
         Truncamientos: Consiste en indicar una serie de caracteres que queremos que aparezcan en nuestra consulta; pero sin que escribamos la palabra completa.
    Se utilizan una serie de símbolos, llamados comodín, que pueden suplir a cualquier número de caracteres o a uno sólo: los más utilizados son * y s
    Los truncamientos pueden situarse a la izquierda, a la derecha o en ambos lados. Los más frecuentes son los de la derecha.
    Sirven para recuperar palabras que pertenecen a la misma familia. En rigor, sería como buscar varios términos utilizando el O booleano.
    Ej. Econom*
    Si * equivale a cualquier nº de caracteres, obtendremos Economía, econometría, económico (si no se tienen en cuenta las tildes), economicos, econometrices, economia ,...
    Sería como haber utilizado en la búsqueda todos esos términos conectados con O.
     Todos estos son elementos que encontraremos en cualquier base de datos (en cierto modo, están también en la base de cualquier catálogo).

    No hay comentarios:

    Publicar un comentario