viernes, 8 de marzo de 2013

10 Bases De Datos Grandes Del Mundo y Sus Tamaños y Leyes de Cod.





1.World Data Centre for Climate
Esta es la base de datos más grande del mundo, ubicada en Alemania, tuvo un costo de más de 53 millones de euros, los datos que maneja son:
·         220 terabytes de datos web.
·         6 petabytes de datos adicionales.


2. National Energy Research Scientific Computing Center
·         2.8 petabytes de datos
·         Es operada por más de 2,000 científicos.


3. AT&T
·         323 terabytes de información
·         1.9 trillones de llamadas telefónicas guardadas.


4. Google
·         91 millones de búsquedas por día
·         Realiza más de 50% de las búsquedas en Internet a nivel mundial
·         Incontables perfiles de personas a nivel mundial almacenados.



5. Sprint
·         2.85 trillones de filas en la base de datos
·         365 millones de detalles de llamadas procesadas por día
·         En los picos se guardan 70,000 detalles de llamada por segundo.


6. ChoicePoint
·         250 terabytes de datos personales
·         Información de más de 250 millones de personas.


7. YouTube
·         100 millones de videos vistos por día
·         65,000 videos agregados por día
·         Tiene el 60% de los videos que hay en línea
·         Al menos 45 terabytes de videos.


8. Amazon
·         59 millones de clientes activos
·         Más de 42 terabytes de datos.


9. CIA (Central Intelligence Agency)
·         Estadísticas y datos detallados de más de 250 países
·         Gran número desconocido de información clasificada.


10.            Biblioteca del congreso de Estados Unidos
·         130 millones de de cosas (libros, fotos, mapas, etc.)
·         29 millones de libros
·         Se agregan 10,000 nuevas cosas por día
·         852 kilómetros de estanterías
·         5 millones de documentos digitales
·         20 terabytes de datos en texto.


GRÁFICA DE LOS TAMAÑOS DE LAS BASES DE DATOS 










LEYES DE CODD.

  • Regla 0: el sistema debe ser relacional, base de datos y administrador de sistema. Ese sistema debe utilizar sus facilidades relacionales (exclusivamente) para manejar la base de datos.
  • Regla 1: la regla de la información, toda la información en la base de datos es representada unidireccionalmente, por valores en posiciones de las columnas dentro de filas de tablas. Toda la información en una base de datos relacional se representa explícitamente en el nivel lógico exactamente de una manera: con valores en tablas.
  • Regla 2: la regla del acceso garantizado, todos los datos deben ser accesibles sin ambigüedad. Esta regla es esencialmente una nueva exposición del requisito fundamental para las llaves primarias. Dice que cada valor escalar individual en la base de datos debe ser lógicamente direccionable especificando el nombre de la tabla, la columna que lo contiene y la llave primaria.
  • Regla 3: tratamiento sistemático de valores nulos, el sistema de gestión de base de datos debe permitir que haya campos nulos. Debe tener una representación de la "información que falta y de la información inaplicable" que es sistemática, distinto de todos los valores regulares.
  • Regla 4: catálogo dinámico en línea basado en el modelo relacional, el sistema debe soportar un catálogo en línea, el catálogo relacional debe ser accesible a los usuarios autorizados. Es decir, los usuarios deben poder tener acceso a la estructura de la base de datos (catálogo).
  • Regla 5: la regla comprensiva del sublenguaje de los datos, el sistema debe soportar por lo menos un lenguaje relacional que;
1.  Tenga una sintaxis lineal.
2.  Puede ser utilizado de manera interactiva.
3.  Soporte operaciones de definición de datos, operaciones de manipulación de datos (actualización así como la recuperación), seguridad e integridad y operaciones de administración de transacciones.
  • Regla 6: regla de actualización, todas las vistas que son teóricamente actualizables deben ser actualizables por el sistema.
  • Regla 7: alto nivel de inserción, actualización, y cancelación, el sistema debe soportar suministrar datos en el mismo tiempo que se inserte, actualiza o esté borrando. Esto significa que los datos se pueden recuperar de una base de datos relacional en los sistemas construidos de datos de filas múltiples y/o de tablas múltiples.
  • Regla 8: independencia física de los datos, los programas de aplicación y actividades del terminal permanecen inalterados a nivel lógico cuandoquiera que se realicen cambios en las representaciones de almacenamiento o métodos de acceso.
  • Regla 9: independencia lógica de los datos, los cambios al nivel lógico (tablas, columnas, filas, etc.) no deben requerir un cambio a una solicitud basada en la estructura. La independencia de datos lógica es más difícil de lograr que la independencia física de datos.
  • Regla 10: independencia de la integridad, las limitaciones de la integridad se deben especificar por separado de los programas de la aplicación y se almacenan en la base de datos. Debe ser posible cambiar esas limitaciones sin afectar innecesariamente las aplicaciones existentes.
  • Regla 11: independencia de la distribución, la distribución de las porciones de la base de datos a las varias localizaciones debe ser invisible a los usuarios de la base de datos. Los usos existentes deben continuar funcionando con éxito:
1.  cuando una versión distribuida del SGBD se introdujo por primera vez
2.  cuando se distribuyen los datos existentes se redistribuyen en todo el sistema.
  • Regla 12: la regla de la no subversión, si el sistema proporciona una interfaz de bajo nivel de registro, a parte de una interfaz relacional, que esa interfaz de bajo nivel no se pueda utilizar para subvertir el sistema, por ejemplo: sin pasar por seguridad relacional o limitación de integridad. Esto es debido a que existen sistemas anteriormente no relacionales que añadieron una interfaz relacional, pero con la interfaz nativa existe la posibilidad de trabajar no relacionalmente.








No hay comentarios:

Publicar un comentario