Comprendre l'avenir: l'évolution des bases de données

Print E-mail
Technologie - Général
Monday, 28 November 2011 14:17

C'est certainement l'une des plus provocatrices et moi est la plus attirer l'attention de l'analyse des tendances du phénomène qui prend de grandes dates d'affaires dans les niveaux: l'énorme difficulté à le comprendre sans descendre de la systématique derrière elle. Une question pertinente en effet: tout en essayant d'expliquer les données Big "prescription" comme des formules magiques des rapports d'analystes comme Forrester, McKinsey, Gartner, etc. ou par certains cas d'application, le gestionnaire du milieu ne seront pas en mesure de comprendre ce qui se cache vraiment derrière ce monde, a fortiori, de leurs possibilités.

Que faisons-nous vraiment? Pour moi, la plus grande difficulté inhérente à la compréhension de la différence des données de Big est d'obtenir une idée de ce que le régime implique le déplacement de bases de données à différents niveaux le savons tous, l'idée de non-bases de données relationnelles ou NoSQL. Un monde qui est souvent définie en négatif ", ce qui n'est pas», ajoutant ainsi encore des difficultés conceptuelles.

Il semble intimidant, mais attendez, ne débranchez pas encore :-) Essayons d'approcher le concept: la base de données basée sur SQL (Structured Query Language, ou Structured Query Language ) est ce que la grande majorité des utilisateurs savent. Nous pouvons répondre à de nombreux niveaux différents: de ceux qui les exploitent, les poignées de la langue en tant que tels, de comprendre les règles de normalisation d'une base de données conventionnelle est en mesure d'analyser leurs limites à ceux qui s'imaginent qu'ils sont tout simplement système électronique comme un grand comme un tiroir de fichiers et de dossiers dans un fichier. Une base de données relationnelle basée sur SQL, généralement gérés par des systèmes comme Oracle, MySQL, DB2, Informix, Microsoft SQL Server, Sybase, PostgreSQL, etc, est une opération qui nous la trouvons, pour ainsi dire, «naturelle» de suivre les règles ACID (atomicité, cohérence, isolation et durabilité, ou Atomicité, Cohérence, Isolation et Durabilité), qui permet à ces déclarations peuvent être considérées comme une transaction, et de répondre à une vision unique, dans lequel un ensemble de données est stockée dans une manière non équivoque et défini les relations. La vision de tables avec des lignes et des colonnes dans une requête renvoie toujours les mêmes champs.

Que si nous étendons le concept pour accueillir d'autres réalités plus en plus courante dans les opérations normales aujourd'hui? Est-ce que toutes les données claires de ces structures? Ou nous sommes tout simplement exclu de notre analyse tout ce que notre base de données opérationnelle est incapable de percevoir? Les bases de données NoSQL (Not Only SQL, SQL ne signifie pas qu'il est mort ou ne devrait pas être utilisé, mais il ya de meilleures solutions) représentent beaucoup de détendre les limitations inhérentes aux bases de données conventionnelles et comment travailler avec. Les collections de documents champs vaguement défini, au lieu de tables avec des lignes et de colonnes, qui permettent une analyse beaucoup plus rapide et efficace et, surtout, ne se limite pas à la structure conventionnelle. L'idée est de stocker des données sur une échelle massive, ce qui répond très bien à l'énorme quantité de données générées par le monde d'aujourd'hui, et analysés sans nécessairement suivre des normes qui ne sont pas nécessairement les adapter. Où bases de données relationnelles sont chers et lents, l'alternative est beaucoup plus efficace façon NoSQL et peu coûteux à manipuler les données sans nécessairement avoir à tenir compte d'une structure rigide. Strictement parlant, ce système n'est même pas une base de données définie comme telle, mais un système de stockage distribué pour gérer les données dotée d'une certaine structure, une structure qui peut aussi être extrêmement flexibles.

Le problème? Pour la plupart des gens, la difficulté de «réflexion» dans un système. Nos mentalités de s'adapter à un système rigide avec des règles claires et des structures marquées. Les parallèles avec les magasins divisé en étagères, classeurs et dossiers sont quelque chose qui fonctionne pour nous mentalement. Cependant, la façon de gérer un système de ce type, par exemple, rechercher des bases de données énormes qui contiennent des références les uns aux autres et les relations totalement hétérogène de toutes sortes, pas nécessairement unique? Dans de nombreux cas, on parle de systèmes qui ont été spécifiquement développés par des sociétés comme Google, Yahoo!, Facebook et autres à gérer leurs propres opérations, la plupart utilisant une source ouverte, en vue d'obtenir une structure avec un coût et des performances raisonnable, a permis d'énormes quantités de données portant sur de nombreuses relations complexes entre eux.

Dans un sens, de comprendre le sujet doit «désapprendre». Mais le besoin de faire est évident, compte tenu de l'adaptation de ces structures pour les problèmes de fonctionnement dans le monde dans lequel nous vivons aujourd'hui. Mais il est simple pour un certain temps, de nombreuses entreprises se poursuivra ou torturer leurs systèmes de bases de données relationnelles à l'infini et au-delà avec le coût et la performance tout simplement absurde, ou directement perdu un monde analytique qui sont incapables ou envisager la manière de collecter . Un monde qui émergera de nombreux avantages concurrentiels que nous voyons dans l'avenir.


Font