
📌 Rol: AI Researcher – Multilingual Data
🌎 Ubicación: 100% remoto (Worldwide)
💼 Tipo de Contrato: Full-Time
🎓 Formación: No especificado
📋 Descripción General
Buscan un/a AI Researcher enfocado/a en datos multilingües para investigar, escalar y llevar a producción modelos de lenguaje en múltiples idiomas, incluyendo low-resource languages. El rol combina research de frontera, prototipos y aplicación real en sistemas productivos, con fuerte énfasis en publicación académica y ejecución en entorno startup.
📋 Responsabilidades Principales
• Diseñar y ejecutar research sobre datasets multilingües (recolección, filtrado, deduplicación y métricas de calidad).
• Desarrollar estrategias para low-resource y long-tail languages.
• Investigar cross-lingual transfer, alignment y robustez en LLMs.
• Construir y mantener benchmarks de evaluación multilingüe.
• Colaborar con ingeniería en training pipelines y decisiones de arquitectura.
• Publicar research en conferencias top y traducir hallazgos a mejoras en producción.
🎯 Requisitos
• Background sólido en NLP/ML con foco en modelos multilingües o cross-lingual.
• Publicaciones en conferencias/journals reconocidos (ACL, EMNLP, NeurIPS, ICML, ICLR, etc.).
• Experiencia con datasets de texto a gran escala en múltiples idiomas.
• Conocimiento en tokenization, data quality, bias y transfer learning.
• Capacidad de prototipar en Python con frameworks modernos.
• Autonomía y ritmo de ejecución tipo startup.
🏖️ Beneficios
• Ownership real sobre la dirección del research.
• Balance entre papers y producción.
• Acceso a datasets grandes e infraestructura moderna.
• Compensación competitiva + equity significativa en etapa temprana.