Ex-investigadores de Meta Recaudan $8 Millones para Memories.ai para Construir una IA que Entienda Videos Largos

Por
Tomorrow Capital
6 min de lectura

Revolución de la Memoria: Cómo la ronda semilla de 8 millones de dólares de Memories.ai podría transformar el futuro de la inteligencia de video

En un mundo sumergido en datos de video, un pequeño equipo de exinvestigadores de Meta cree haber resuelto una de las limitaciones más persistentes de la IA: la incapacidad de comprender verdaderamente contenido de video extenso. Su solución podría remodelar industrias desde la seguridad hasta el entretenimiento, al tiempo que crea nuevas fronteras de inversión en infraestructura de IA.

La dimensión olvidada de la visión artificial

Memories.ai, fundada por los exinvestigadores de Meta Reality Labs, el Dr. Shawn Shen y Enmin Zhou, salió del anonimato el 24 de julio de 2025, con una ronda de financiación semilla de 8 millones de dólares. La ronda fue liderada por Susa Ventures con la participación de Samsung Next, Fusion Fund, Crane Venture Partners, Seedcamp y Creator Ventures.

La startup ha desarrollado lo que denominan un Modelo de Memoria Visual Grande (LVMM), diseñado para superar las limitaciones de los sistemas actuales de IA que tienen dificultades para procesar más de unas pocas horas de metraje de video. Según la compañía, su tecnología puede escalar para analizar hasta 10 millones de horas de video, mucho más allá de las capacidades existentes en la industria.

La ronda de financiación —el doble de lo que la compañía había previsto inicialmente— fue liderada por Susa Ventures con la participación de Samsung Next, Fusion Fund, Crane Venture Partners, Seedcamp y Creator Ventures.

Recuperación digital: El problema de mil millones de dólares a la vista

La limitación que aborda Memories.ai representa una ineficiencia masiva en múltiples industrias. Mientras que la IA basada en texto ha visto modelos capaces de procesar cientos de miles de tokens, el análisis de video suele fallar después de solo minutos de contenido.

"Las empresas tienen petabytes de video que no pueden buscar o analizar eficazmente", señala un analista sénior de tecnología de un importante banco de inversión. "Los equipos de seguridad ven interminables horas de metraje manualmente. Las empresas de medios no pueden encontrar escenas en sus propios archivos. Los departamentos de marketing luchan por extraer información de los videos de sus campañas."

Esta ineficiencia se traduce en una oportunidad de mercado sustancial. El mercado global de análisis de video, valorado en aproximadamente 12.330 millones de dólares en 2024, se proyecta que alcance casi 94.560 millones de dólares para 2034, creciendo a una CAGR del 22,6% durante ese período.

Memoria computacional que escala con la realidad

Lo que distingue el enfoque de Memories.ai es tanto la escala como la arquitectura. El LVMM primero ingiere y comprime video en bruto en una capa de memoria estructurada, y luego establece relaciones contextuales entre elementos visuales a lo largo de marcos de tiempo arbitrarios.

"Los modelos tradicionales analizan el video fotograma a fotograma o en clips cortos, perdiendo todo el contexto entre segmentos", explica Zhou. "Nuestro sistema imita la memoria humana: retiene información importante mientras filtra el ruido, crea conexiones entre eventos relacionados y permite la recuperación de momentos específicos mediante lenguaje natural."

Según los informes, la tecnología puede escalar para procesar hasta 10 millones de horas de metraje, órdenes de magnitud más allá de las capacidades actuales. Más impresionante aún, gran parte de este procesamiento puede ocurrir directamente en los dispositivos de los usuarios en lugar de exclusivamente en la nube.

De las cámaras de seguridad a los archivos de Hollywood

Las primeras aplicaciones se centran en sectores sumergidos en datos de video:

En seguridad y vigilancia, el sistema puede mostrar al instante metraje relevante a través de vastos archivos, transformando potencialmente la investigación de incidentes de días a minutos. Para las empresas de medios, promete hacer que las enormes bibliotecas de contenido sean instantáneamente buscables por escena, accesorio, personaje o acción.

Los equipos de marketing pueden analizar tendencias en miles de videos de redes sociales, mientras que las empresas de robótica ven potencial para máquinas que aprenden continuamente de experiencias visuales.

Quizás lo más intrigante para las aplicaciones de consumo es que la tecnología podría permitir a los usuarios buscar en sus colecciones de video personales con consultas en lenguaje natural como "encuentra el video de los primeros pasos de mi hija" o "muéstrame todos los atardeceres en la playa de nuestras vacaciones."

La carrera por el dominio de la memoria de video

Memories.ai no está sola en reconocer esta oportunidad. TwelveLabs ha recaudado 80 millones de dólares en múltiples rondas, con la participación de NEA, NVIDIA NVentures, Databricks, Snowflake y otros. Sin embargo, su tecnología está actualmente optimizada para videos de hasta solo 60 minutos de duración.

Otros competidores incluyen mem0 (respaldada por YC, centrada principalmente en la memoria de texto), Letta (10 millones de dólares en financiación semilla de Felicis), y ofertas de gigantes tecnológicos como la API de Video Intelligence de Google y Amazon Rekognition.

"Lo que distingue a Memories.ai es tanto la escala a la que apuntan como sus capacidades en el dispositivo", observa un socio de capital de riesgo especializado en inversiones en IA. "Si pueden cumplir al menos la mitad de lo que prometen con un rendimiento aceptable, superarán a los actores actuales."

El camino a seguir: Oportunidades y desafíos

A pesar de la prometedora tecnología y el sustancial mercado, Memories.ai enfrenta obstáculos significativos. La compañía debe demostrar que su sistema puede mantener la precisión y el rendimiento a escala en implementaciones del mundo real, no solo en demostraciones controladas.

Construir una operación de ventas empresariales representa otro desafío para el equipo, fuertemente centrado en la investigación, que actualmente cuenta con solo 15 empleados. Gestionar los costes computacionales de procesar millones de horas de video mientras se mantiene la competitividad de precios presenta otro obstáculo.

"La ventana para crear una ventaja competitiva defendible es corta", advierte un socio de una destacada firma de inversión en tecnología. "Copilot Memory de Microsoft se lanza el próximo mes, y tanto Google como Amazon están expandiendo rápidamente sus capacidades de video."

Horizonte de inversión: Leyendo las señales

Para los inversores que observan el sector de la inteligencia de video, varios indicadores pueden señalar la trayectoria de Memories.ai:

Métricas de conversión: Estar atento a los anuncios de programas piloto que se conviertan en contratos anuales de seis cifras, particularmente en los verticales de seguridad y medios donde el punto de dolor es más agudo.

Éxito en la implementación en el borde (Edge): La capacidad de realizar análisis sustanciales en el dispositivo representa una ventaja competitiva potencial, especialmente a medida que las regulaciones de privacidad se endurecen a nivel global.

Economía unitaria: La eficiencia de procesamiento resultará crucial; el coste computacional por hora de video debe disminuir sustancialmente para mantener márgenes saludables a escala.

Asociaciones estratégicas: Buscar posibles colaboraciones con fabricantes de dispositivos (aprovechando las capacidades en el dispositivo) o integradores de sistemas de seguridad que puedan acelerar la adopción empresarial.

Los observadores del mercado sugieren tres posibles resultados: adquisición estratégica por parte de un actor más grande (Adobe, NVIDIA o AWS como candidatos probables), crecimiento hacia una oferta pública independiente, o integración en hardware de borde (edge) como un "SDK de memoria".

Aunque la tecnología parece prometedora, los inversores institucionales deben realizar una validación técnica exhaustiva antes de comprometer capital sustancial. Probar el sistema contra un conjunto de datos "frío" de más de 40.000 horas de metraje y comparar las métricas de precisión/recuperación frente a los competidores proporcionaría información valiosa sobre si Memories.ai puede cumplir sus ambiciosas afirmaciones.

Mientras empresas y consumidores luchan por igual con volúmenes cada vez mayores de datos de video, la carrera por construir máquinas que realmente comprendan y recuerden lo que ven promete remodelar tanto los mercados tecnológicos como las experiencias de los usuarios en los próximos años.

También te puede gustar

Este artículo ha sido enviado por nuestro usuario bajo las Normas y directrices para la presentación de noticias. La foto de portada es arte generado por computadora únicamente con fines ilustrativos; no indicativa del contenido factual. Si crees que este artículo infringe los derechos de autor, no dudes en informarlo enviándonos un correo electrónico. Tu vigilancia y cooperación son invaluables para ayudarnos a mantener una comunidad respetuosa y legalmente conforme.

Suscríbete a nuestro boletín

Obtenga lo último en negocios empresariales y tecnología con vistazos exclusivos a nuestras nuevas ofertas

Utilizamos cookies en nuestro sitio web para habilitar ciertas funciones, proporcionarle información más relevante y optimizar su experiencia en nuestro sitio web. Puede encontrar más información en nuestra Política de privacidad y en nuestros Términos de servicio . La información obligatoria se puede encontrar en el aviso legal