Una startup cuyo producto compite con GitHub Copilot y otros asistentes de programación alimentados por inteligencia artificial ha alcanzado el estatus de unicornio.
El jueves, Codeium anunció que cerró una ronda de financiación de la Serie C de $150 millones liderada por General Catalyst que valora a la empresa en $1.25 mil millones post-money. La ronda, que también contó con la participación de los inversores existentes Kleiner Perkins y Greenoaks Capital, eleva la financiación total de la empresa a casi un cuarto de billón de dólares ($243 millones) en apenas tres años desde su lanzamiento.
El cofundador y CEO de Codeium, Varun Mohan, dijo a TechCrunch que Codeium ni siquiera ha tocado la trancha de $65 millones de la Serie B que recaudó en enero. En aquel entonces, hace apenas ocho meses, Codeium estaba valorado en medio billón de dólares.
“A pesar de haber apenas comenzado a utilizar nuestra financiación existente, creemos que esta inyección de capital nos permitirá aumentar significativamente la I+D y el crecimiento mientras realizamos apuestas estratégicas aún más grandes”, dijo.
Codeium fue fundada en 2021 por Mohan y su amigo de la infancia y compañero de graduación en MIT, Douglas Chen. Antes de Codeium, Chen estuvo en Meta, donde ayudó a construir herramientas de software para auriculares de realidad virtual como el Oculus Quest. Mohan era líder tecnológico en Nuro, la startup de entrega autónoma, responsable de gestionar el equipo de infraestructura de autonomía.
La startup comenzó como una empresa radicalmente diferente llamada Exafunction, centrada en la optimización y virtualización de GPU para cargas de trabajo de inteligencia artificial. Pero en 2022, Mohan y Chen percibieron una oportunidad más grande en la programación generativa, y decidieron rebrandearse y pivotar.
“A pesar del flujo de herramientas de inteligencia artificial generativa, los desarrolladores siguen luchando con tareas de codificación que consumen mucho tiempo”, dijo Mohan. “Muchas de las soluciones impulsadas por IA proporcionan fragmentos de código genéricos que requieren un trabajo manual significativo para integrarse y asegurarse dentro de las bases de código existentes. Ahí es donde entra nuestra asistencia de codificación de IA.”
La plataforma de Codeium, alimentada por modelos de IA generativa entrenados en código público, ofrece sugerencias en el contexto de toda la base de código de una aplicación. Soporta alrededor de 70 lenguajes de programación e se integra con varios entornos de desarrollo populares, incluyendo Microsoft Visual Studio y JetBrains.
Para atraer a los desarrolladores lejos de Copilot y otros competidores, Codeium ha lanzado un generoso nivel gratuito para empezar. La estrategia parece haber funcionado: Hoy, la startup tiene más de 700,000 usuarios y más de 1,000 clientes empresariales, incluyendo Anduril, Zillow y Dell.
Quentin Clark, director gerente de General Catalyst, insinuó que Codeium ganó algunos de sus contratos más grandes al abrazar un enfoque firmemente centrado en el cliente para la investigación de productos.
“El enfoque del equipo siempre ha sido seguir a sus clientes, lo que llevó a la empresa a construir soluciones en sus términos, desplegables en cualquier entorno y que admiten más lenguajes que cualquier otro”, dijo Clark en un comunicado. “Lo que Codeium ha creado no es solo una demostración, un anuncio o una idea, es un negocio en pleno crecimiento, con grandes empresas adoptando el producto en toda su organización.”
Las empresas a menudo son reacias a exponer el código propietario a un tercero —por ejemplo, se informó que Apple prohibió al personal usar Copilot el año pasado, citando preocupaciones sobre fugas de datos confidenciales. Para intentar disipar tales temores, Codeium comenzó a ofrecer una opción de instalación autohospedada junto con su plan estándar de software como servicio.
Ahora las empresas pueden desplegar el servicio de Codeium en su propio hardware si lo desean. O pueden adoptar una configuración híbrida, manteniendo sus datos en sus propios dispositivos mientras usan los servidores de Codeium para sus necesidades informáticas.
Siempre existe cierto riesgo en las transferencias de datos a la nube, pero Mohan afirmó que Codeium utiliza un fuerte cifrado. “Nunca entrenamos nuestro modelo propietario de autocompletado generativo en datos de usuarios, nunca vendemos datos y nos aseguramos de que la transmisión de datos esté encriptada”, agregó.
Codeium también ha tomado medidas para eliminar el código con licencia "no permisiva" (por ejemplo, código con copyright) de los conjuntos de datos que utilizó para entrenar sus modelos de IA. Algunas herramientas de generación de código entrenadas usando código con licencias restrictivas o protegido por derechos de autor han demostrado regurgitar ese código cuando se les solicita de cierta manera, lo que representa un riesgo de responsabilidad (los desarrolladores que incorporan el código podrían ser demandados). Mohan dijo que no es el caso con Codeium, gracias a su enfoque de preparación y filtrado de datos de entrenamiento.
“También eliminamos cualquier dato restante que se asemeje a código que esté explícitamente con licencia no permisiva solo en caso de que otras personas hayan copiado código sin proporcionar la atribución y licencia adecuadas”, agregó. “Además, contamos con un filtrado y registro de atribución posgeneración de última generación en caso de que estos grandes modelos probabilísticos produzcan código similar al código público, ya sea con licencia permisiva o no permisiva.”
Pero ¿qué hay de las alucinaciones? La mayoría de las herramientas de codificación de IA son conocidas por inventar cosas, lo que puede ser bastante destructivo en un entorno empresarial.
Un análisis realizado por la startup de herramientas para desarrolladores GitClear encontró que las herramientas de IA generativa han resultado en más código erróneo siendo enviado a las bases de código en los últimos años. Y un estudio de Purdue encontró que más de la mitad de las respuestas que ChatGPT de OpenAI da a las preguntas de programación son incorrectas. Los investigadores de seguridad han advertido sobre el potencial de dichas herramientas para amplificar errores existentes en el software.
Una encuesta reciente de la empresa de ciberseguridad Synk encontró que nueve de cada diez desarrolladores se preocupan por las más amplias implicaciones de seguridad de usar plataformas de codificación de IA. Pero Mohan afirmó que la tecnología de Codeium, supuestamente superior y rica en contextos profundos, produce resultados más confiables que la mayoría.
“Nuestro motor de conciencia de contexto es capaz de fundamentar los resultados en lo que ya existe en la base de código de un usuario, lo que lleva a sugerencias con menos alucinaciones y más adhesión a la sintaxis, semántica y estándares existentes”, dijo.
Ya sea que los benchmarks respalden eso o no, la estrategia de ventas de Codeium parece estar resonando con los ejecutivos adecuados: Los ingresos alcanzaron ocho cifras este año. Mohan dijo que la startup con sede en San José, con 80 empleados, planea aumentar la plantilla a 120 para 2025 mientras apunta a hacer una mayor diferencia en un mercado con competidores formidables como Tabnine, Anysphere y Poolside.
Alcanzar a Copilot, que tenía más de 1.3 millones de usuarios de pago hasta abril, probablemente no esté en las cartas para Codeium —al menos no inmediatamente. Pero no tiene por qué estarlo. Como señaló acertadamente Mohan, dada la amplia adopción de herramientas de codificación de IA entre los desarrolladores (a pesar de sus reservas), incluso una pequeña parte del segmento incipiente será lucrativa.
Polaris Research proyecta que el mercado de herramientas de código de IA tendrá un valor de $27.17 mil millones para 2032.
“Un exceso de hype es un desafío al que se enfrenta la industria”, dijo Mohan. “Esto hará que sea más difícil para cada empresa convencer realmente a los usuarios finales de que están en la vanguardia de la posibilidad. Pero creemos que las empresas de IA que buscan la verdad y son realistas, como Codeium, eventualmente se abrirán paso a través de este ruido.”