viernes, 25 de noviembre de 2011

En las nubes

Haría falta estar muy desconectado del mundo de la informática en general y de la corporativa en particular para no estar al tanto de las tendencias en cuanto a arquitectura de sistemas basados en 'la nube'.

Literalmente y de forma paradójica, se estaría en las nubes.

La autoridad al respecto de los chistes malos (ARCM) acaba de retirarle el carnet de chistoso por una buena temporada.

Resulta curioso que muchas de las representaciones esquemáticas de internet antes de la moda del cloud computing fuesen precisamente nubes. Pero al final, como todo, es un concepto que estaba inventado y que se ha puesto más de moda hoy en día por la facilidad en cuanto a comunicaciones de banda ancha se refiere que cada vez más permite símiles de arquitecturas cliente-servidor geográficamente muy distantes.

Las grandes compañías de software de gestión (Sap, Oracle, etc) están apostando fuertemente por el cloud computing. De hecho, su apuesta es muy clara: en lugar de tener tus aplicaciones en tu casa, las tienes en la mía, de manera que te puedes olvidar totalmente de los problemas que representa la gestión del hardware, la microinformática y los temas de software por un precio módico.

El tema del precio módico es flagrante y realmente es terriblemente competitivo si lo comparas con el coste de comprar licencias. ¿Cómo le sale a cuenta a un fabricante todo esto? Pasemos a la sección telefónica:

El CPD
- ¿Dígame?
- Hola, soy el señor SAP
- A sus pies, eminencia. ¿En que puede este humilde vasallo de vuecencia serviros?
- Necesitaría montar un CPD grande.
- ¿Cómo de grande?
- Alemán. Como para 500 implantaciones de ERP. Y quiero pagar poco.
- ¿Cómo de poco?
- ¿Tú eres el nuevo?

La oferta
- ¿Dígame?
- Hola, soy el señor SAP y tengo una propuesta que hacerte que no podrás rechazar.
- Sorpréndeme...
- Poner tu SAP en nuestra arquitectura cloud, de manera que sólo nos pagas el alquiler de máquina y de licencias. En lugar de costarte medio millón de euros te costará 2500 al mes.
(música del 1,2,3)
Medio millón dividido por 2500€ suponen 200 meses para amortizar.
- Dentro de 200 meses estaré ya jubilado casi
- ¿Qué decías?
- Que claro

La trampa
- ¿Dígame?
- Hola, no soy el señor SAP.
- No, el señor SAP soy yo.
- Mira, que me estaba planteando instalar un CRM que se conecte contra mi ERP de forma sencilla, pero como mi ERP es tuyo y está en tus instalaciones...
- Sin problemas, te instalamos el CRM y entonces pasas a pagarnos 5000€ al mes. Oferta de amigo.
- Sí, pero es que resulta que tu CRM no me va todo lo bien que querría y me he planteado coger uno específico para nuestro negocio y claro, hay que integrarlo, hay volumen de datos por el medio...
- ... es que la disponibilidad de los servicios informáticos básicos del sistema cloud de nuestro cpd debe direccionarse adecuadamente a través del firewall de manera que cuando te conectes no salte e impida de forma continuada el acceso por políticas de seguridad espartanas...
- Ufff, qué mal me lo pones
- No, si estaba leyendo en voz alta un prospecto de un medicamento
- Pues ha sonado fatal. 5000 al mes, ¿no?
- Muchas gracias por su interés.

Plantear un sistema cloud tiene sus ventajas e inconvenientes. Lo que está claro es que nadie vende euros a 90 céntimos. Mucho cuidado con vuestras implantaciones al respecto.

viernes, 18 de noviembre de 2011

201X (rellenar la X): Año del BI (cómo no...)

Cuando se acerca finales de año suelen surgir, aparte de los habituales anuncios de que ya es Navidad en El Corte Inglés (¡no os compréis relojes allí, que adelantan dos meses las fechas!) multitud de informes de lo bien o mal que nos van a ir las cosas el año siguiente.
Con unas elecciones generales por el medio, la crisis de deuda Europea, un paro galopante y una confianza en la economía más que baja, cuesta creerse que el año que viene vaya a ser mejor que el 2010 y el 2011 (al menos en lo que a BI se refiere).

A principios de año, en el grupo de Profesionales del BI de Linkedin, se debatía acerca de si 2011 iba a ser, finalmente, el año del BI (como año en que iba a haber un incremento importante de los servicios)... Pero es que en el 2010 también se hizo y en el 2009... Todos los años van a ser el año del BI.

Y sí, es cierto, el mercado va banalizándose y el tema BI ya no es tan desconocido como antes y muchas empresas lo ven como algo imprescindible, pero de ahí a que haya un estallido importante en la adopción de estos sistemas... No deja de ser una tendencia que poco a poco se va imponiendo en ámbitos de pyme cuando antes, por temas tecnológicos y económicos, sólo estaba disponible para las grandes empresas.

Bueno, en este sentido, hoy me toca meterme con IDC. Esta empresa, como Gartner, se encarga de realizar estudios de mercado de temas tecnológicos (que luego vende a unos cuantos miles de euros el ejemplar) y que predicen inventan analizan el posicionamiento y las tendencias de los mercados de cara a que las empresas se vayan preparando.

Echad un ojo a esta imagen (del blog de outsourceando):
Podéis ver en ella que la crisis no nos va a afectar nada de nada. Los consultores de BI podemos estar tranquilos. Es más, vamos a tener cada vez más trabajo.
Bien. Pasemos a las matemáticas:
(música del 1,2,3...)
- Por 137,4 millones de eeeeuros en el 2011, dígame cuántos técnicos de BI pueden trabajar.
Asumamos una facturación (facturación, no sueldo) de 60000€ anuales (algo bastante normalito tirando a bajo para lo que se estila hoy en día) y dividamos esos millones por esta producción:
- ¡2.290!
- ¡Campana y se acabó!

¿Creéis realmente que en España sólo hay 2300 profesionales del mundo del BI? ¿Sólo? ¿Y que además su media de facturación mensual sea sólo de algo más de 5000€? Señores de IDC, ruego un poco más de rigor a la hora de presentar un gráfico con esta información, que luego se descontextualiza y mal vamos.
- Eso es un error, IDC es una empresa que contrasta sus informaciones y seguramente tú las has descontextualizado y luego pasa lo que pasa...

Puede ser, no digo que no, pero no soy yo quien se vende como analista independiente y metódico (al menos en mi blog por el que, de momento, no cobro) y que luego me pillen en un renuncio como aparece en esta muy bien traída entrada del foro de BI Fácil cuestionando con datos incuestionables mi credibilidad.

miércoles, 16 de noviembre de 2011

Some Kind of Monster

Si os gusta el heavy metal en general y Metallica en particular os recomiendo que le echéis un ojo al documental que da nombre a este artículo en el que se explica el proceso creativo de la banda para el disco St. Anger, con sus momentos felices y no tanto entre el fin de la gira de Reload y el primer concierto de la nueva gira, pasando por la selección de Robert Trujillo como nuevo bajista y haciendo las paces con Dave Mustaine.

El documental como tal (premio nacional de poesía) no tiene nada que ver con la informática salvo en el fondo: un entorno informático no deja de ser algún tipo de monstruo. Me explicaré con mis habituales parábolas (Abel educa y divierte):

- ¿Sí, dígame?
- ¿Informática? Tengo una duda. Hay un dato que en mi cuadro de mandos no me cuadra con lo que estoy sacando del SAP.
- ¿De cuándo es el dato de SAP?
- De esta mañana
- Entonces no estará en el cuadro de mandos hasta mañana o pasado.
- Pero eso no puede ser...
- Poder sí que puede... Otra cosa es que debiera ser así o no.

Esta situación se repite con más frecuencia de la que sería deseable y todo por la complejidad de los mecanismos que llevan ese dato desde su origen al punto en que el usuario acaba 'disfrutando' de él:
- Salida: Terminal punto de venta
- Paso 1: Cargar en ERP
- Paso 1b: reprocesar ERP (¡opcional!)

- Paso 2: Extraer del ERP mediante extractor a fichero plano
- Paso 3: Cargar en ODS mediante proceso ETL estándar
- Paso 4: Cargar en DWH mediante proceso ETL complejo (integración)
- Paso 4b: Cuadrar (¡recomendable!)  y si posible: automáticamente
- Paso 5: Cargar en Datamart específico mediante proceso ETL
- Paso 6: Generar cubo específico de análisis
- Paso 6b: Actualizar la metadata del sistema de reporting/cuadro de mando
- Paso 6c: Recargar caché/base de datos específica/módulo especial chachiguay del sistema de reporting
- Paso 7: Obtener el dato mediante el sistema de reporting/cuadro de mando

Con suerte, el ticket de compra del pantalón de turno acabará en el maremagnum de datos del cuadro de mandos al día siguiente (tal vez incluso a primera hora) pero tras pasar por varios sistemas, varias transformaciones y multitud de cálculos, tiempo de proceso, posibilidad de descuadres, etc.
Vamos, que a veces obtener el dato correcto al final del proceso parece cosa de suerte teniendo en cuenta la cantidad de transformaciones que experimenta (que ni el Dr. Jekyll en sus malos tiempos). Y todo porque, como decía antes, los sistemas decisionales en concreto y la informática de gestión en general se han convertido en alguna clase de monstruo que coarta (o puede hacerlo) el crecimiento y la escalabilidad de los sistemas y de la compañía por la terrible complejidad de trabajar con N entornos, M tecnologías y Ñ interfícies.

Es en este momento cuando:
- Informática, ¿dígame?
- Oye, que necesitaría que se incluyera en el cuadro de mando un nuevo indicador de SAP.
- ¡Uf! Pues eso va a tardar, hay que tocar 4 ETLs mínimo, recuadrar todos los sistemas, hacer pruebas... Por lo menos hasta dentro de un par de semanas no lo vas a tener.
- Pues es una pena, porque es el indicador de prima por productividad para este año...
- Nada, hombre, eso lo tienes mañana casi... Ya me esforzaré...

Si contamos con que el 80% del tiempo de un proyecto (mínimo) es por razones relacionadas con las ETL, ¿no puede ser que nos estemos equivocando mucho (¡muchísimo!) en cómo trabajamos los datos? ¿Sería posible realizar una organización escalable con una estructura fija como el modelo estrella recursiva que hiciera innecesario tener que meter mano a un DWH?
Las herramientas de BI han simplificado (en cierta manera) el acceso a la información, pero la elaboración y preparación de esta información, a pesar de que hay ETLs excelentes, sigue siendo el talón de Aquiles de cualquier proyecto, pudiendo llevarlo al traste. ¿No opináis que debería ser mucho más simple?

viernes, 11 de noviembre de 2011

The simpler, the better

Si un día tenéis una conversación con un director de una compañía, especialmente si es dueño de la compañía, podéis hacerle la siguiente pregunta:

- ¿Y usted qué querría poder analizar?

Y si lo que responde es diferente a 'todo' os invito a una cerveza (aportando las pruebas adecuadas).

Vivimos un momento complicado en la analítica de información en las empresas. Antaño el concepto 'silo de información datos' era algo que las best practices del análisis trataban de evitar: datos almacenados, muchas veces olvidados, que sólo ocupan espacio y que se utilizan lo justo en la analítica de negocio, llegando en ocasiones al petabyte (pocas, por el momento).

Un petabyte (8 petabits) es un montón de información. Una burrada. Ante tamaños tan grandes es imposible que con nuestra capacidad humana nos hagamos la idea del a cantidad de información de la que estamos hablando.
Es como cuando se habla del fondo de rescate europeo. La cifra de un billón de euros se dice pronto pero representa 166 billones de pesetas... Que yo hay meses (y seguramente vidas con sus reencarnaciones) que no los cobro.


Actualmente el volumen de información que permiten los sistemas actuales por la reducción de precio hace que la unidad del terabyte sea algo casi doméstico y los sistemas de bases de datos almacenan cada vez más información. ¿Es realmente necesaria tanta información?

En el artículo anterior me preguntaba hacia dónde se dirigiría la próxima revolución en temas analíticos (no dejaba de ser una introducción a este artículo, para preparar el terreno...). Y parece que el próximo paso son los entornos 'In Memory'. SAP Hana o Qlikview son un par de buenos ejemplos (cada uno a su escala) de soluciones de almacenamiento columnar que permiten una reducción importante del volumen de información que se utiliza.

Cuando hablaba, hace tiempo, del procesador cuántico decía que ante una capacidad de proceso ilimitada, las optimizaciones serían las justas porque al final no importaba. La nube, el análisis InMemory y todas las nuevas tecnologías que comienzan a mostrar las orejas parecen predecir un aumento importantísimo de la capacidad de análisis de información, tanto en velocidad como en cantidad. Nos faltaría poder deglutirla sin atragantarnos ni empacharnos con ella.

Hay una serie de premisas que creo que aplican para este caso en concreto y que me gusta repetir de tanto en tanto:
1) The simpler, the better
2) The sooner, the better
y si los puntos 1 y 2 no son posibles:
3) Don't forget the butter

Seguiremos informando.