SOLUCIONES PRÁCTICAS
De terabyte a petabyte: Encontrando a los malos
en la era de la gran cantidad de información
L
a carga de información se ha convertido en una vía de doble circulación. Estamos expuestos a un
flujo constante de información todos los
días—consumiéndola de las redes sociales, los teléfonos celulares, los ayudantes
personales digitales (PDAs, por sus siglas
en inglés), Internet y otras fuentes. Pero
también entregamos algo a cambio. La información es obtenida en cada interacción con
la tecnología. Estos almacenes masivos de
conjuntos de información y datos se han
vuelto tan grandes y tan difíciles de manejar
que no pueden ser procesados por las herramientas tradicionales de administración de
información dentro de un plazo de tiempo
aceptable. Bienvenidos a la era de la gran
información (“big data”).
La gran información es un término general
utilizado para describir esta voluminosa
cantidad de información semi-estructurada
y no estructurada. La información no estructurada, que representa aproximadamente
el 80 por ciento de la información de una
organización, en su mayoría se encuentra
en archivos de texto. La información semiestructurada está disponible electrónicamente en sistemas de bases de datos, en
información de la web y en formatos de
intercambio de información. Los ejemplos
incluyen XML, correo electrónico y EDI. A
fin de procesar estos enormes conjuntos
de información, las organizaciones se están
volcando a tecnologías innovadoras, no
tradicionales que puedan capturar, administrar y procesar la información en su totalidad. Las tecnologías que se aplican a la gran
información incluyen las bases de datos
de procesamiento masivamente paralelo
(massively parallel processing, o MPP, por
sus siglas en inglés), los sistemas de archivos
distribuidos, las bases de datos distribuidas,
las plataformas de computación de nube
(cloud computing platforms), Internet, los
sistemas de almacenamiento escalables, la
búsqueda y procesamiento de datos y los
análisis avanzados.
La definición de gran información es tridimensional: volumen (medido en terabytes y
petabytes); velocidad (la velocidad a las cual
es obtenida); y la variedad (rangos de tipos y
fuentes de datos). La gran información se ha
creado por una razón simple—la obtención
de datos infunde caso todo lo que hacemos,
desde abrir una cuenta en el banco hasta
buscar en Google, hasta llamar a su mejor
amigo en Texas. A medida que nuestras vidas
se basan cada vez más en la tecnología, esto
continuará alimentando la explosión de la
gran información.
sus operaciones comerciales, la conducta del
cliente y las interacciones. El valor puede ser
aplicado a una gran cantidad de áreas dentro
de la institución, incluidas:
Extrayendo el valor de la
gran información
• Administración de las relaciones con el
cliente (CRM, por sus siglas en inglés)
Walmart registra un millón de transacciones por hora. Twitter registra más de 90
millones de tweets por día. Los usuarios
de Facebook crean más de 30.000 millones
de piezas de contenido cada mes, que van
desde vínculos en la web, noticias y blogs
hasta fotos. Cada conexión en un sitio de
la web, cada comunicación de dispositivo a dispositivo y cada interacción en
los medios sociales contiene información
crítica y valiosa. La gran información
produce en masa información de negocios.
• Vigilancia de operaciones y análisis de
patrones
Por ejemplo, PayPal y Amazon han tenido
años de acumular bases de datos que
contienen detalles de transacciones para
cientos de millones de clientes con miles de
comerciantes. Al utilizar esta información,
han desarrollado herramientas de detección de fraude que dependen de enormes
conjuntos de información que contienen no
solo información financiera para las transacciones, sino las direcciones IP, información
de los navegadores y otros datos técnicos
para predecir, identificar e impedir la actividad fraudulenta.
En un mundo que se ha vuelto cada vez
más digital, el acumular y analizar grandes
conjuntos de información traerá enormes
beneficios a las organizaciones en un amplio
espectro de industrias que incluyen a los
servicios financieros.
Las instituciones financieras que piensan
hacia el futuro están explorando soluciones
que les ayudarán a analizar la masiva cantidad de información obtenida. Esta información representa detalles granulares de
38 ACAMS TODAY | MARZO–MAYO 2012 | ACAMS.ORG | ACAMSTODAY.ORG
• Evaluación y administración del riesgo
• Detección de lavado de dinero y fraude
• Cumplimiento y reporte regulatorio
• Calificación del riesgo crediticio
Los departamentos IT enfrentan el desafío
técnico de analizar y reportar sobre cantidades de información muy grandes en un
plazo de tiempo razonable. Este período
de tiempo es dictado por los usuarios
del negocio que se basan en el análisis y
reporte para dar soporte a las funciones de
cumplimiento, administración del riesgo y
otras funciones estratégicas. Para obtener
el valor máximo, los IT y aquellos que toman
las decisiones comerciales deben colaborar
en un enfoque holístico para administrar la
información de una institución.
Al reconocer que las bases de datos, la arquitectura y metodologías tradicionales ya no
son suficientes, las instituciones financieras
están comenzando a adoptar las nuevas
tecnologías necesarias para procesar, descubrir y analizar grandes conjuntos de información. Los análisis avanzados que pueden
ser realizados sobre volúmenes, velocidades
y variedad de datos cada vez mayores, dan un
valor real a la organización.
Creación de información puesta en
práctica para combatir el crimen
financiero
El análisis avanzado es una colección de
técnicas y herramientas relacionadas basada
en la inteligencia artificial, la obtención y
análisis de información, estadísticas, análisis
predictivo, visualización de información y
procesamiento natural del lenguaje. Conocido a menudo como análisis de descu-