Para compartir:

Desafíos de datos persisten mientras las empresas aceleran la adopción de IA

Los desafíos de datos siguen siendo uno de los mayores obstáculos para quienes quieren escalar inteligencia artificial de verdad en las empresas. Y este no es un problema que esté disminuyendo con el tiempo — al contrario, se está haciendo más evidente a medida que más organizaciones intentan poner la IA a funcionar a gran escala.

Un nuevo informe conjunto de Snowflake y Omdia arrojó una luz muy interesante sobre este panorama: el 79% de las organizaciones enfrentan múltiples desafíos técnicos y relacionados con datos en el momento en que intentan avanzar con IA. Y el dato que más llama la atención no es ese. Es el hecho de que, incluso ante tantos obstáculos, más del 90% de esas mismas empresas ya están usando datos para entrenar modelos de IA.

Es decir, la carrera por la adopción de IA está ocurriendo ahora mismo, con o sin infraestructura de datos en el punto adecuado. Esto plantea una cuestión que vale mucho la pena entender mejor: ¿usar datos es lo mismo que tener datos lo suficientemente confiables para que la IA razone bien? La respuesta corta es no. Y es exactamente ahí donde está el problema que la mayoría de las empresas todavía no ha resuelto.

Lo que realmente está frenando a las empresas

Cuando el informe de Snowflake y Omdia señala que casi 8 de cada 10 organizaciones enfrentan múltiples desafíos técnicos y de datos al intentar escalar IA, eso no sorprende a quienes están dentro del sector. Lo que sí sorprende es la velocidad con la que las empresas siguen adelante a pesar de todo. La presión competitiva para adoptar IA es tan grande que muchas organizaciones están construyendo soluciones sobre una base de datos que aún no está lista para soportar ese nivel de complejidad. Es como intentar construir un edificio de 30 pisos sobre un terreno que todavía no fue preparado adecuadamente.

Los tres problemas más mencionados por las empresas participantes del estudio son bastante conocidos por los equipos de datos e ingeniería:

  • Romper los silos de datos de IA — mencionado por el 65% de los encuestados como algo desafiante
  • Medir y monitorear la calidad de los datos de IA — señalado por el 62% como desafiante o muy desafiante
  • Preparar los datos para que estén listos para IA — también mencionado por el 62% de los participantes

Estos problemas no son nuevos. Existen desde hace años. Pero cuando colocas una capa de IA encima de ellos, los errores se amplifican de una manera que puede comprometer toda la estrategia. Un modelo entrenado con datos malos no entrega resultados malos de forma obvia — entrega resultados malos de forma convincente, y eso es mucho más peligroso.

Otro punto que destaca el informe es la velocidad con la que los equipos necesitan moverse. Los líderes de negocio están exigiendo resultados con IA en plazos cada vez más cortos, mientras que los equipos técnicos saben que resolver silos de datos, mejorar pipelines y garantizar trazabilidad lleva tiempo. Esa tensión entre velocidad y calidad es real, y está en el centro de la mayoría de los proyectos de IA que se estancan o entregan menos de lo que prometen.

Reciba el mejor contenido sobre innovación en su correo electrónico.

Todas las noticias, consejos, tendencias y recursos que buscas, directamente en tu bandeja de entrada.

Al suscribirte al boletín informativo, aceptas recibir comunicaciones de Método Viral. Nos comprometemos a proteger y respetar siempre tu privacidad.

Baris Gultekin, Vicepresidente de IA de Snowflake, resumió bien esta aparente contradicción: las empresas no están esperando hasta que todo esté perfectamente limpio y listo, porque simplemente no pueden darse ese lujo. Pero usar datos no es lo mismo que tener contexto utilizable. El modelo hace su trabajo, pero está razonando sobre un retrato incompleto o inconsistente del negocio.

Silos de datos: el enemigo silencioso de la IA

Los silos de datos aparecen repetidamente como uno de los mayores villanos de la adopción de IA en las empresas. Y tiene todo el sentido. Cuando los datos quedan atrapados en sistemas aislados — ya sean CRMs, ERPs, plataformas de marketing o bases de datos heredadas — la IA simplemente no puede ver el panorama completo. Razona con base en fragmentos, y los fragmentos llevan a conclusiones incompletas. Para modelos de lenguaje y sistemas de IA generativa, esto es especialmente crítico, porque dependen de un contexto amplio para generar respuestas útiles y precisas.

El problema de los silos no es puramente técnico — también es organizacional. Diferentes equipos construyen y mantienen sus propios repositorios de datos con lógicas distintas, formatos variados y sin estandarización entre ellos. Cuando llega la hora de consolidar todo eso para alimentar un modelo de IA, el trabajo de limpieza, transformación e integración puede ser monumental. Y muchas veces ese trabajo se subestima en la planificación inicial del proyecto, lo que genera retrasos, frustraciones y, eventualmente, resultados de IA que quedan muy por debajo de las expectativas creadas.

Resolver los silos de datos exige más que tecnología. Exige un cambio cultural dentro de las organizaciones, con equipos diferentes dispuestos a compartir datos, estandarizar procesos y aceptar que la propiedad de los datos no es exclusiva de un único departamento. Plataformas como la propia Snowflake fueron creadas con ese objetivo en mente — centralizar el acceso a los datos sin necesariamente mover todo a un único lugar, sino creando una capa de acceso unificado que permite que la IA trabaje con información de múltiples fuentes de forma coherente y segura.

Calidad de datos: la base que la IA necesita para funcionar

Existe una frase que circula mucho entre profesionales de datos: garbage in, garbage out. Resume bien lo que ocurre cuando la calidad de datos se ignora en un proyecto de IA. Si los datos de entrada son imprecisos, desactualizados, duplicados o inconsistentes, el modelo va a aprender patrones erróneos y reproducirlos a escala. El resultado es una IA que parece funcionar, que responde con confianza, pero que está sistemáticamente equivocada en aspectos que pueden tener un impacto real en los negocios.

El informe refuerza que el 40% de los encuestados señalaron la calidad de datos como una preocupación principal, y el 62% dijo que medir y monitorear esa calidad es algo desafiante o muy desafiante. Son números que muestran que la mayoría de las organizaciones sabe que tiene un problema, pero todavía no ha encontrado una forma eficiente de resolverlo al ritmo que la adopción de IA exige.

Datos de alta calidad requieren procesos continuos de monitoreo, validación, limpieza y enriquecimiento. Requieren pipelines bien construidos, catalogación adecuada y metadatos bien documentados. Todo eso cuesta tiempo y recursos, y en muchas organizaciones esas inversiones fueron postergadas durante años porque los sistemas heredados funcionaban lo suficientemente bien para las necesidades de reportes y análisis tradicionales. Ahora, con la IA exigiendo un nivel mucho más alto de confiabilidad en los datos, esas deudas técnicas están llegando con intereses.

La buena noticia es que el mercado está respondiendo con herramientas cada vez más sofisticadas para observabilidad de datos, detección automática de anomalías y gobernanza en tiempo real. Las plataformas modernas de datos ya ofrecen recursos nativos para rastrear el linaje de los datos, identificar problemas de calidad antes de que lleguen al modelo y garantizar que los equipos tengan visibilidad sobre lo que se está usando para entrenar y alimentar la IA. Pero adoptar estas herramientas también requiere madurez organizacional, y es ahí donde muchas empresas todavía están dando sus primeros pasos. 🐢

Los números muestran que el problema está empeorando

Un detalle importante del informe que no se puede ignorar es que esos porcentajes de dificultad aumentaron respecto al año anterior. Es decir, los problemas conocidos están persistiendo y, en algunos casos, empeorando. Esto indica que el ritmo de adopción de IA está creciendo más rápido que la capacidad de las empresas para resolver sus problemas estructurales de datos.

Cuando se habla de cuán listos están realmente los datos para IA, los números son reveladores. Solo el 32% de los encuestados considera sus datos estructurados como listos para IA. Para datos no estructurados, ese número baja al 20%, con apenas un 7% afirmando que al menos la mitad de sus datos no estructurados estaban listos. Y ese número cayó respecto al año anterior, lo que muestra una tendencia preocupante.

Los datos no estructurados — como documentos, correos electrónicos, audios, videos y textos libres — representan la mayor parte de los datos generados por las empresas hoy. Si la gran mayoría de esos datos no está lista para alimentar modelos de IA, existe un cuello de botella enorme entre lo que las empresas quieren hacer con IA y lo que realmente pueden entregar de forma confiable.

Sistemas heredados e interoperabilidad también pesan

Además de los problemas de calidad y silos, el informe identifica otras barreras significativas. Problemas de interoperabilidad fueron mencionados por el 42% de los encuestados, lo cual tiene sentido cuando se considera que muchas organizaciones operan con decenas de herramientas y plataformas diferentes que no se comunican bien entre sí. La capacidad de proporcionar datos en tiempo real también fue señalada como un desafío por el 42% de los participantes.

Un dato particularmente impactante tiene que ver con los sistemas heredados: el 55% de los encuestados dijo que sus sistemas heredados son incompatibles con los requisitos modernos de IA, en comparación con el 38% en otras industrias. Esto muestra que ciertos sectores están significativamente más rezagados en la modernización de su infraestructura de datos, lo que crea una desventaja competitiva real cuando se trata de aprovechar el potencial de la inteligencia artificial.

Aun así, las empresas están usando datos para entrenar IA

A pesar de toda esta falta de preparación y de la abundancia de desafíos, los números de adopción son impresionantes. El 92% de los encuestados dijo que está usando sus datos para entrenar o aumentar LLMs (modelos de lenguaje de gran escala). De ellos, el 95% está utilizando datos estructurados o semi-estructurados, y el 91% está usando datos no estructurados.

Estos números muestran que la adopción de IA no está esperando a que la infraestructura de datos sea perfecta. Las empresas están avanzando porque el costo de esperar parece mayor que el costo de seguir adelante con datos imperfectos. Y hasta cierto punto, eso tiene sentido — los proyectos de IA pueden revelar problemas de datos que jamás se descubrirían en análisis estáticos, y el aprendizaje práctico tiene un valor enorme.

Herramientas que usamos a diario

Pero existe un riesgo real en este enfoque. Como explicó Gultekin, el éxito inicial está ocurriendo, pero escalar es difícil porque la capa de contexto todavía no está completamente construida. Las empresas que van a destacarse no serán las que corran detrás de modelos mejores, sino las que logren poner sus datos en un lugar donde la IA pueda razonar de forma confiable. Esta es una distinción crucial que separa los proyectos de IA que generan valor sostenible de aquellos que se quedan atrapados en pruebas de concepto prometedoras pero que nunca llegan a producción a escala.

Estar listo para IA va más allá de tener datos disponibles

Una de las conclusiones más importantes que se puede extraer de este informe es que estar listo para IA no significa simplemente tener datos almacenados en algún lugar accesible. Significa tener datos que sean confiables, rastreables, bien documentados, gobernados e integrados de forma que la IA pueda utilizarlos con contexto suficiente para generar valor real. Ese es un estándar significativamente más alto de lo que la mayoría de las organizaciones puede alcanzar hoy, y reconocer esto es el primer paso para avanzar de forma más sólida.

El hecho de que más del 90% de las empresas ya estén usando datos para entrenar modelos de IA, incluso sin resolver sus problemas estructurales de datos, muestra que la presión por resultados está superando la cautela técnica. Esto no es necesariamente un error, ya que aprender en la práctica tiene valor y los proyectos de IA pueden revelar brechas que no aparecerían de otra forma. Pero es un riesgo calculado que necesita gestionarse con conciencia. Las empresas que avanzan sin una estrategia clara para la evolución de la calidad y la gobernanza de los datos tienden a llegar a un punto donde los problemas acumulados hacen difícil escalar o confiar en los resultados generados por la IA.

El camino más inteligente parece ser un equilibrio entre avanzar con los proyectos de IA y, al mismo tiempo, invertir de forma paralela y continua en la madurez de los datos. No tiene que ser perfecto antes de empezar, pero necesita mejorar mientras se avanza. Las organizaciones que logran mantener ese equilibrio son las que, a mediano plazo, consiguen cosechar los beneficios reales de la adopción de IA sin verse sorprendidas por fallas estructurales que comprometan la confianza en los sistemas que construyeron. 🚀

Qué esperar de aquí en adelante

El informe de Snowflake y Omdia sirve como un recordatorio importante: los desafíos de datos no desaparecen solo porque la IA llegó. Se vuelven más visibles, más urgentes y más costosos de ignorar. Las empresas que entiendan esto más temprano van a salir adelante no solo en la velocidad de la adopción, sino en la calidad y la sostenibilidad de los resultados que consigan generar con inteligencia artificial.

El panorama actual muestra una industria que está aprendiendo en la práctica, cometiendo errores previsibles y, poco a poco, entendiendo que la verdadera ventaja competitiva en IA no está en el modelo más avanzado o en la herramienta más cara. Está en la capacidad de construir y mantener una base de datos sólida, gobernada y continuamente mejorada. Las organizaciones que fijen esa capa de contexto, como describió Gultekin, serán las que van a transformar potencial en resultados reales y escalables. Y esta carrera, por lo que todo indica, apenas está comenzando. 💡

Imagen de Rafael

Rafael

Operaciones

Transformo los procesos internos en máquinas de entrega, garantizando que cada cliente de Viral Method reciba un servicio de primera calidad y resultados reales.

Rellena el formulario y nuestro equipo se pondrá en contacto contigo en un plazo de 24 horas.

Publicaciones relacionadas

Las acciones de Amazon podrían subir tras la asociación con OpenAI.

Alianza entre Amazon y OpenAI podría impulsar ingresos de IA y valorizar acciones, dice Citi; impacto estratégico en AWS y

Moratoria sobre los centros de datos de IA: El debate sobre la energía

Moratoria: Sanders y AOC proponen pausa en construcción de centros de datos de IA en EE.UU. para evaluar impactos ambientales

Blockchain y los agentes de IA están cambiando los pagos con criptomonedas.

Agentes de IA impulsan pagos cripto con blockchain, stablecoins y x402, facilitando transacciones autónomas, micropagos y economía entre máquinas

Receba o melhor conteúdo de inovação em seu e-mail

Todas as notícias, dicas, tendências e recursos que você procura entregues na sua caixa de entrada.

Ao assinar a newsletter, você concorda em receber comunicações da Método Viral. A gente se compromete a sempre proteger e respeitar sua privacidade.

Rafael

Online

Atendimento

Calculadora Preço de Sites

Descubra quanto custa o site ideal para seu negócio

Páginas do Site

Quantas páginas você precisa?

4

Arraste para selecionar de 1 a 20 páginas

📄

⚡ Em apenas 2 minutos, descubra automaticamente quanto custa um site em 2026 sob medida para o seu negócio

👥 Mais de 0+ empresas já calcularam seu orçamento

Fale com um consultor

Preencha o formulário e nossa equipe entrará em contato.