SQL completa sobre Hadoop ? Splice Machine abre su base de datos para los ensayos

SQL completa sobre Hadoop ? Splice Machine abre su base de datos para los ensayos

Splice Machine dice el lanzamiento esta semana de su versión beta pública se abre la pila de Hadoop por primera vez a una base de datos SQL con todas las funciones , capaz de ejecutar transacciones y análisis de forma simultánea.

La empresa, que ha estado trabajando con 15 clientes de charter y recaudó $ 15 millones de financiación en febrero, ha hecho su producto del mismo nombre disponible como una descarga gratuita para fomentar las pruebas y el desarrollo.

"Es radicalmente diferente a cualquier otra cosa que está ahí fuera , porque es la primera verdadera base de datos transaccional de ANSI SQL en la pila Hadoop . Puede alimentar aplicaciones simultáneas . La gente puede leer y escribir a partir de la base de datos al mismo tiempo", CEO de la máquina de empalme y co- dijo el fundador de Monte Zweben .

" Esto no es sólo la ciencia de datos más para Hadoop , donde una serie de datos está cargado en el sistema de archivos Hadoop , ejecuta algunos análisis sobre el mismo utilizando MapReduce o incluso una capa de SQL , y luego volcar los resultados de nuevo en un informe .

"Esto se trata en tiempo real , aplicaciones simultáneas , y esto no ha sido posible hasta ahora. "

Splice Machine ha tomado la base de datos relacional Apache Derby Java y se retiraba la capa de almacenamiento , reemplazándola con la base de datos Apache HBase NoSQL . A continuación, la empresa modificó el planificador , optimizador y ejecutor dentro de Derby para aprovechar la arquitectura distribuida de HBase .

Lea esta

Seguridad Hadoop : Hortonworks compra XA seguro - y planea convertirla código abierto
Seguridad Hadoop : Hortonworks compra XA seguro - y planea convertirla código abierto

Leer más
"Ahora lo que pasa es que Derby, al igual que su versión original, elabora un plan de salida en código byte SQL - una representación muy eficiente de una ejecución de SQL - y podemos distribuir dicho a los nodos HBase , por lo que el cálculo puede realizarse en paralelo y cerca de donde los datos se almacenan para la eficiencia máxima , " dijo Zweben .

"Luego empalmar los resultados juntos de nuevo - de ahí el nombre de la empresa. "

Según Zweben , los conocimientos necesarios para utilizar el software de la máquina de empalme son el conocimiento de SQL y cierta familiaridad con el sistema de archivos Hadoop , para ser capaz de configurar e instalar .

" Pero ellos no tienen que ser los programadores de Java y que no necesitan saber MapReduce ", dijo .

" El significado es que hasta ahora ser capaz de alimentar las aplicaciones en tiempo real en la pila de Hadoop probada se limitaba sólo a muy bajo nivel, los sistemas de almacenamiento de valores clave como HBase .

"La gran comunidad de desarrolladores de aplicaciones y la gente que realmente no podía sacar provecho de ella , ya que tendrían que ser dominios capaces de programar en Java. “

Zweben dijo Splice máquina no está ofreciendo todo su código de nuevo a los proyectos de Hadoop y HBase pero es un contribuyente .

" Nos corregir errores y contribuir a lugares donde tiene sentido para toda la comunidad de nuevo en tan buenas participantes HBase y Hadoop en la comunidad , pero también tenemos algunos software propietario , así - . Un poco como lo hace todo el mundo ", dijo .

"Siguen algunos específicos IP para los accionistas de la empresa, sino que contribuyen a la comunidad de código abierto de manera abierta y que son así . "

Zweben dijo que el mercado de bases de datos es actualmente confuso debido a la variedad de opciones disponibles , pero para aquellos cuyas bases de datos se encuentran bajo la presión de la primera opción es la posibilidad de escalar hacia arriba, con minjobs hardware propietario costoso, o escalar a cabo en grupos de productos básicos más baratos.

Incluso si deciden escalada, la gente entonces se enfrentan a tres opciones.

"El primero es en mi opinión una opción muy pobre y eso es NoSQL . NoSQL definitivamente tiene la característica de escala en sus arquitecturas , pero desafortunadamente usted tirar al bebé junto con el agua del baño ", dijo Zweben .

" Todos los servicios que ofrece SQL tengan que escribirse ahora en el nivel de aplicación por los desarrolladores , lo cual es costoso y propenso a errores , ya sea de agregación o se une o transacciones. Todas estas cosas , además de todas las herramientas alrededor SQL , tiene que ser reescrito y eso es un error.

" NoSQL puede ser grande para páginas web sencillas , pero si usted está haciendo una aplicación real que necesita una base de datos SQL. "

Así que si la opción es SQL , las opciones se vuelven si a escala en una arquitectura propietaria o en Hadoop .

Pro Tech Research

Los pasos críticos para la estrategia de los grandes datos SMB exitosa
Investigación : Tendencias Big Data - Los costos , beneficios , resultados , dotación de personal
Hadoop emerge como el marco básico de datos grande
Big Data Guía para profesionales de TI
"La gente de todo el mundo en desarrollo en Hadoop y HBase - dos tecnologías de escalado horizontal y de código abierto - están contribuyendo tanto IP y la tecnología en términos de las arquitecturas de Hadoop y HBase , además de todos los sistemas en todo Hadoop y su ecosistema" dijo Zweben .

"Nuestros competidores en el espacio NewSQL , que son esencialmente los vendedores escalada, que tienen que escribir todo ese código ellos mismos. Tienen que escribir un sistema de archivos distribuido. Tienen que escribir una tienda rápida valor clave. Tienen que construir toda la otras herramientas ".

Zweben dijo que las nuevas versiones y nuevas funcionalidades para Splice Machine serán anunciados este año , incluyendo el trabajo en las extensiones de la arquitectura , como la computación in-memory .

El producto ÁCIDO compatible está disponible en una base freemium para desarrollos de prueba y experimentación. Se utiliza en entornos de producción, Splice La máquina tiene un precio de lista derecho de licencia anual de $ 5.000 por nodo.