Big data e Internet de las cosas

¿Qué es Big Data?

Se denomina Big Data a la gestión y análisis de enormes volúmenes de datos que no pueden ser tratados de manera convencional, ya que superan los límites y capacidades de las herramientas de software habitualmente utilizadas para la captura, gestión y procesamiento de datos, engloba infraestructuras, tecnologías y servicios que han sido creados para dar solución al procesamiento de enormes conjuntos de datos estructurados, no estructurados o semiestructurados (mensajes en redes sociales, señales de móvil, archivos de audio, sensores, imágenes digitales, datos de formularios, emails, datos de encuestas, logs etc,) que pueden provenir de sensores, micrófonos, cámaras, escáneres médicos, imágenes.

VOLUMEN

La cantidad de datos. Mientras que el volumen indica más datos, la naturaleza granular de los datos es única. Los big data requieren procesar altos volúmenes de datos Hadoop no estructurados y de baja densidad; es decir, datos de valor desconocido, como fuentes de datos de Twitter, flujos de clics en una página web y una aplicación móvil, tráfico de red, equipos con sensores que capturan datos a la velocidad de la luz, y mucho más. Es la tarea de los big data convertir estos datos Hadoop en información valiosa. Para algunas organizaciones, puede significar decenas de terabytes; para otras, cientos de petabytes.

VELOCIDAD

El ritmo en que se reciben los datos y, quizás, se ponen en práctica. Normalmente, los datos de velocidad más alta fluyen directamente a la memoria en lugar de escribirse en el disco. Algunas aplicaciones de Internet de las cosas tienen ramificaciones de estado y seguridad que requieren evaluación y acción en tiempo real. Otros productos inteligentes de Internet funcionan en tiempo real o prácticamente en tiempo real. Por ejemplo, las aplicaciones de comercio electrónico para los consumidores buscan combinar la ubicación del dispositivo móvil y las preferencias personales para hacer ofertas de marketing de tiempo limitado. En términos operativos, las experiencias de aplicaciones móviles tienen una mayor cantidad de usuarios, un mayor tráfico de red y la expectativa de respuestas inmediatas.

VARIEDAD

Nuevos tipos de datos no estructurados. Los tipos de datos no estructurados o semiestructurados, como texto, audio y video, requieren un procesamiento adicional para extraer el significado y los metadatos de respaldo. Una vez comprendidos, los datos no estructurados tienen muchos de los mismos requisitos que los datos estructurados, como resumen, linaje, auditabilidad y privacidad. Surgen complejidades adicionales cuando los datos de una fuente conocida cambian sin previo aviso. Los cambios de esquema frecuentes o en tiempo real son una carga enorme para los entornos de transacción y análisis.

VALOR

Los datos tienen un valor intrínseco, pero debe ser descubierto. Hay una variedad de técnicas cuantitativas y de investigación para extraer el valor de los datos; desde descubrir una preferencia u opinión del consumidor a realizar una oferta importante por ubicación o identificar una pieza del equipo que está a punto de fallar. El avance tecnológico es que el costo del cálculo y del almacenamiento de datos ha disminuido considerablemente, lo que proporciona una infinidad de datos desde los cuales se lleva a cabo una comparación entre el análisis estadístico de todos los datos con las muestras anteriores. El avance tecnológico hace que sea posible tomar decisiones mucho más precisas y adecuadas. Sin embargo, encontrar el valor también requiere nuevos procesos de descubrimiento que involucran a analistas, usuarios empresariales y ejecutivos inteligentes y perspicaces. El desafío real de los big data es humano y tiene que ver con aprender a hacer las preguntas correctas, reconocer patrones, formular hipótesis informadas y predecir comportamientos.

De acuerdo con un estudio realizado por Cisco, entre el 2011 y el 2016 la cantidad de tráfico de datos móviles crecerá a una tasa anual de 78%, así como el número de dispositivos móviles conectados a Internet excederá el número de habitantes en el planeta. Las naciones unidas proyectan que la población mundial alcanzará los 7.5 billones para el 2017 de tal modo que habrá cerca de 18.9 billones de dispositivos conectados a la red a escala mundial, esto conllevaría a que el tráfico global de datos móviles alcance 10.8 Exabytes mensuales o 130 Exabytes anuales. Este volumen de tráfico previsto para 2016 equivale a 33 billones de DVDs anuales o 813 cuatrillones de mensajes de texto. Lo que genera una necesidad de la generación de BigData.

Todo proyecto de Big Data se basa en tres capas tecnológicas:

  • Almacenamiento.- Facilita el acceso y disponibilidad de los datos. Dónde tener los datos.
  • Procesamiento.- Bases tecnológicas para operar grandes cantidades de información. Cómo trabajar con los datos.
  • Análisis.- Produce información de valor para el negocio. Qué hacer con los datos.

Beneficios del Big Data:

  • Mayor conocimiento
  • Mejores capacidades organizativas y de planificación
  • Retorno a la inversión

Para el 2020 habrá 1.7 mb de nueva información cada segundo.

La casa blanca ha invertido más de USD 200 millones en proyectos de big data

Solo porque la información está siendo recolectada no quiere decir que es útil.

Solo el 0.5% de todos los datos recolectados serán analizados.

El Big Data no puede ser posible sin el consumidor.

¿Cómo analizar una Big Data?

Analizar una variedad de datos al explorar y experimentar para interacciones personalizadas más precisas, y una anticipación más rápida y precisa de las conductas y las situaciones cambiantes. Agilice los descubrimientos y las siguientes mejores acciones en actividades operacionales.

¿Por qué integrar una Big Data?

Reduce los riesgos de datos y extiende las políticas de protección de información, incluidos autenticación, autorización, seguimiento de datos y controles de auditoría, al tiempo que transmite y procesa fácilmente big data.

¿Cómo aplicar una Big Data?

Centrar esfuerzos en la creación de productos y servicios valiosos para sus clientes en lugar de centrarse en la tecnología que los habilita. Aprovechar las aplicaciones especialmente diseñadas con análisis integrado y modelos de datos, como experiencia de clientes, administración de talentos, atención de la salud y servicios públicos.

¿Para qué se usa esa información?

Para una empresa de marketing o para un político que trata de buscar votos, es algo muy interesante. Con la Big Data también incrementamos mucho el poder de predicción de las ciencias sociales. Puede costar millones de dólares desarrollar un algoritmo de inteligencia artificial. Pero una vez que está desarrollado, lo aplicas a todo el mundo. Entonces se está empezando a usar rápidamente en otros países. En predicción de localización de telefonía móvil, Telefónica, una empresa muy activa en América Latina, ha trabajado mucho. Incluso ya empezó a vender este tipo de datos. Entonces, si quieres abrir una empresa en alguna capital de América Latina para vender corbatas, les pagas y te dicen en qué momento y dónde caminan los hombres. Y tú sabes exactamente en qué salida del metro instalar tu nueva tienda de corbatas.

Industrias como la de la salud, los deportes y el marketing, tienen claro el papel que el Big Data está jugando en el desarrollo de sus estrategias. “El marketing tiene que replantearse y diría que de aquí a tres años será mucho más explosivo

“Hoy en día la persona escoge sus productos con base en lo que lee en las redes sociales, en las experiencias de su círculo. Va a ser un gran reto que las marcas puedan conectar sus mensajes en estas multipantallas y que el dinero que se invierte en marketing tenga realmente un propósito”

“Para poder capitalizar la tecnología en la que muchas compañías están invirtiendo, se requiere formar un recurso que sea capaz de entender la parte técnica y hacer un puente entre ésta y la parte de negocio. Formar profesionales que tengan esa capacidad de pensar en los dos ámbitos y de integrar esas dos cosas se va a volver el principal cuello de botella para monetizar el Big Data”

Big Data y Metadata

  • El contenido de datos no estructurados representa hasta el 80% del total de activos de información de una empresa.
  • El contenido de datos semi-estructurado y no estructurado se distribuye muy a menudo en muchos sistemas operativos internos, aplicaciones empresariales, redes, servidores y dispositivos inteligentes conectados
  • Con el aumento de las iniciativas de Big Data, el valor de los metadatos se está convirtiendo rápidamente en la vanguardia y está surgiendo como una prioridad crítica para el éxito de Big Data
  • Una capacidad esencial para desarrollar y madurar servicios de procesamiento de datos grandes es establecer un programa de administración de metadatos empresarial completo. La importancia de los metadatos para Big Data no puede ser subestimada.
  • Los metadatos son uno de los sub-segmentos de más rápido crecimiento de la gestión de datos empresariales. Sin metadatos, las empresas pueden y perderán las profundas ideas que Big Data puede generar.
  • Los metadatos pueden gestionar todo el ciclo de vida de los datos, los procesos, los procedimientos y los clientes o usuarios que afectan a la información comercial específica y pueden proporcionar una pista de auditoría que puede ser esencial, especialmente para las empresas reguladas en cualquier momento dado.
  • Los metadatos de Big Data son la base para aprovechar estas enormes cantidades de datos de nuevas fuentes de datos y repositorios de información diferentes antes de que se vuelvan incontrolables.
  • Metadatos es la información que describe otros datos - 'datos sobre datos'. Son los datos descriptivos, administrativos y estructurales los que definen los activos de datos de una empresa. Sin embargo, los metadatos identifican específicamente los atributos, propiedades y etiquetas que describirán y clasificarán la información. Se definiría más apropiadamente como «información sobre datos».
  • Los grandes datos requerirán procesamiento a través de ciertos análisis para construir los principios de estas nuevas definiciones de metadatos. Los metadatos pueden correlacionarse con los metadatos definidos a partir de otras fuentes de datos tradicionales (estructuradas) al proporcionar un modelo global de metadatos completo para toda la empresa.
  • Los metadatos pueden vincular los activos de datos de su empresa asociando criterios relevantes. Le permite asociar como activos de datos y disociar activos de datos diferentes de sus diversas fuentes de datos grandes. Al aprovechar esta asociación de metadatos, los usuarios de Big Data y análisis pueden localizar rápidamente la información correcta a pesar de la gran cantidad de contenido que se encuentra dentro y dentro de estos repositorios dispares.
  • Un campo como ID de producto también es un medio para vincularse a otras fuentes de datos, para fines de integración de datos cruzados.
  • Un medio muy eficiente para visualizar las instrucciones para el manejo de grandes datos y metadatos es mediante la utilización de un servicio de mapeo de datos. Un servicio de asignación de datos conectará datos visualmente entre los campos de origen y de destino al aplicar la lógica de negocios para el proceso de transformación de datos que se puede visualizar a través de un diagrama de flujo de integración.

Big Data en Ecuador

  • Cadena de farmacias. "La información que poseen de las tarjetas de afiliación más los registros de ventas pueden dar datos interesantes de cada cliente para aplicar planes puntuales".
  • Empresas grandes, como las operadoras telefónicas o las del sector del retail, aprovechan las ventajas del big data.
  • Teojama Comercial, empezó a administrar el big data desde finales de julio 2013; en 50 años que lleva la empresa nunca había organizado su información. Eso permitió determinar por qué sus 13,000 clientes prefieren sus productos: "por marca, por privilegio, o reconocimiento específico.
  • El uso del big data todavía es limitado, debido a los costos elevados a la hora de organizar su información, según Marcelo del Castillo, director Regional de Branding; Google Analytics, Facebook o Twitter, se pueden conocer gustos y tendencias de los públicos externos, señala Vera. "Estas plataformas permiten a las compañías que no tienen muchos recursos tener una pequeña base de datos".
  • SRI, Supermaxi.

Big Data y corrupción

La asimetría en el acceso a la información. Podríamos llegar a una situación en la que una minoría tiene acceso a datos y dispone del conocimiento y las herramientas necesarias para analizarlos, mientras que una mayoría no. Esta situación exacerbaría la asimetría ya existente en la distribución del poder entre los Gobiernos o las empresas, de una parte, y las personas, de otra. Iniciativas para promover datos abiertos (open data) y programas de educación que fomenten la alfabetización digital y el análisis de datos son dos ejemplos de medidas que se podrían desarrollar para mitigar esto.

IOT: Internet de las cosas

Es un concepto que se refiere a la interconexión digital de objetos cotidianos con internet. Alternativamente, Internet de las cosas es la conexión de Internet con “cosas u objetos” que personas. La información es creada por sus usuarios mediante los dispositivos móviles. Al ser digital, es medible.

El internet de las cosas debería codificar de 50 a 100,000 mil millones de objetos y seguir el movimiento de estos; puesto que se calcula que todo ser humano está rodeado de por lo menos de 1,000 a 5,000 objetos.

Según la empresa Gartner, en 2020, habrá en el mundo aproximadamente 26 mil millones de dispositivos con un sistema de conexión al internet de las cosas.

El sector privado es donde el Internet de las Cosas se está haciendo cada vez más popular

  • La industria de producción en masa: la maquinaria que se encarga de controlar los procesos de fabricación, robots ensambladores, sensores de temperatura, control de producción, todo está conectado al Internet en cada vez más empresas lo que permite centralizar el control de la infraestructura.
  • Control de infraestructura urbana: control de semáforos, puentes, vías de tren, cámaras urbanas. Cada vez más ciudades implementan este tipo de infraestructuras basadas en el Internet de las Cosas que permiten monitorear el correcto funcionamiento de sus estructuras además de adaptar más flexiblemente su funcionamiento ante nuevos eventos.
  • Control ambiental: una de las áreas en las que está teniendo más éxito el Internet de las cosas, pues permite acceder desde prácticamente cualquier parte a información de sensores atmosféricos, meteorológicos, y sísmicos.
  • Sector salud: cada vez más clínicas y hospitales alrededor del mundo confían en sistemas que les permiten al personal de salud monitorear activamente a los pacientes de manera ambulatoria y no invasiva.

También hay aplicaciones del Internet de las Cosas para el transporte, la industria energética, y prácticamente todos los sectores comerciales. Como hemos dicho, el gran pendiente es el mercado de consumo, o lo que es lo mismo, los hogares, un lugar al que probablemente es cuestión de tiempo para que veamos la gran explosión del IoT.

Credits:

Grupo 3- MICD Stephanie Obando Pablo Torres Yalilé Loaiza Aldrín Flores Jorge Donoso Omar Fiallos

Report Abuse

If you feel that this video content violates the Adobe Terms of Use, you may report this content by filling out this quick form.

To report a Copyright Violation, please follow Section 17 in the Terms of Use.