Sr Backend & Scraping Engineer (Python)
InterfellDescripción del puesto
Descripción del rol: <\/span><\/span><\/span><\/span><\/b>Diseñar, desarrollar y mantener soluciones de extracción y procesamiento de datos, y servicios backend basados en APIs con estándares de seguridad, escalabilidad y observabilidad; a la vez que estabiliza y mejora los productos de scraping existentes para asegurar continuidad operativa y acelerar entregas en un equipo en expansión.<\/span><\/span><\/span><\/span>
<\/p>
<\/p>
RESPONSABILIDADES<\/span><\/span><\/span><\/span><\/b>
<\/p>
<\/p>
Alcance y Límites del Rol<\/span><\/span><\/span><\/span><\/b>
<\/div>
<\/p>
En alcance (In Scope):<\/span><\/span><\/span><\/span><\/b>
<\/div>
- Desarrollo de scrapers robustos (rotación de proxies, manejo de CAPTCHAs, autenticación, tolerancia a cambios de DOM).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Diseño/implementación de APIs REST con autenticación, paginación y buenas prácticas de seguridad.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Orquestación y monitoreo de pipelines (scheduling, reintentos, alertas, logging, métricas).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Normalización y transformación de datos (ETL/ELT) y diseño de esquemas de almacenamiento.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Pruebas unitarias e integración; validación de calidad de datos.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Observabilidad: logging estructurado, métricas y trazas.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Documentación técnica y revisiones de código; colaboración con stakeholders (ES/EN).<\/span><\/span><\/span><\/span>
<\/p><\/li><\/ul>Fuera de alcance (Out of Scope):<\/span><\/span><\/span><\/span><\/b>
<\/p>
- Diseño UI/UX/front -end más allá de endpoints y contratos de APIs.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Ventas/negociación comercial directa (apoyo técnico cuando se requiera).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Operación de infraestructura física on‑premise (se trabaja sobre cloud).<\/span><\/span><\/span><\/span>
<\/p><\/li><\/ul>
<\/p>
Responsabilidades Clave<\/span><\/span><\/span><\/span><\/b>
<\/p>
- Convertir requerimientos de negocio en soluciones técnicas mantenibles.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Diseñar arquitecturas resilientes y costo -eficientes sobre cloud.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Reducir tiempos de inactividad ante cambios en fuentes objetivo (self‑healing).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Elevar estándares de calidad y rendimiento (profiling, optimización y automatización).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Asegurar cumplimiento normativo y de Términos de Servicio en scraping y datos.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Promover buenas prácticas (seguridad, versionamiento, CI/CD, documentación).<\/span><\/span><\/span><\/span>
<\/p><\/li><\/ul>
<\/div><\/span>
Requisitos<\/h3>Must have:<\/span><\/span><\/span><\/span><\/b>
<\/p>
<\/p>
- Python avanzado (asincronía, manejo de errores, tipado, empaquetado).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Scraping: Requests/HTTPX, Playwright/Selenium, BeautifulSoup/lxml, selectores CSS/XPath.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- APIs con FastAPI (o equivalentes), autenticación (tokens, OAuth), paginación.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Git (PRs, code review) y CI/CD (GitHub Actions/GitLab CI).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- SQL (PostgreSQL/MySQL) y NoSQL (MongoDB/Redis); modelado y performance.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Docker; nociones de orquestación y despliegue (K8s deseable).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Observabilidad (logging estructurado, métricas, trazas y alertas).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Fundamentos de nube (AWS/Azure/GCP).<\/span><\/span><\/span><\/span>
<\/p><\/li><\/ul>Nice to have:<\/span><\/span><\/span><\/span><\/b>
<\/p>
- Mensajería/colas (Kafka/RabbitMQ), tareas programadas (Celery/Arq).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Inglés B1.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Data lakes/warehouses (S3/BigQuery/Snowflake) y dbt/Airbyte/Prefect.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Vector DBs/embeddings (FAISS/Pinecone) y LLM ops.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Go/Rust/Node.js para componentes de alto rendimiento.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Seguridad (gestión de secretos, rate limiting, OWASP).<\/span><\/span><\/span><\/span>
<\/p><\/li><\/ul>Competencias Conductuales<\/span><\/span><\/span><\/span><\/b>
<\/p>
- Proactividad y sentido de urgencia; ownership extremo.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Pensamiento analítico y resolución creativa de problemas.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Adaptabilidad a cambios frecuentes y priorización efectiva.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Comunicación clara con audiencias técnicas y no técnicas.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Trabajo colaborativo y disposición a compartir conocimiento.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Orientación al cliente y a la calidad de las entregas.<\/span><\/span><\/span><\/span>
<\/p><\/li><\/ul>
<\/div><\/span>
Ventajas<\/h3>
- Beneficios de ley.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Bono de almuerzo de $500.000 COP.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Uber entre oficina y domicilio (en horarios específicos).<\/span><\/span><\/span><\/span>
<\/p><\/li>
- 2.000 USD para formación luego del primer año.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Aprendizaje continuo.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Certificaciones en GCloud pagadas por la empresa.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Viajes corporativos.<\/span><\/span><\/span><\/span>
<\/p><\/li>
- Snacks en la oficina.<\/span><\/span><\/span><\/span>
<\/p><\/li><\/ul>
<\/span><\/span><\/span><\/p>Para optimizar nuestros procesos<\/i> <\/i><\/span><\/b>, te pedimos que solo te postules si cumples con los requisitos indicados y estos están reflejados en tu perfil (CV).<\/i><\/b>
<\/i><\/b><\/div>De no ser así, te invitamos a seguir atento a futuras oportunidades donde puedas destacar.<\/i><\/b> <\/i><\/b><\/span>¡Gracias por tu comprensión!<\/i><\/b>
<\/i><\/b><\/span><\/span><\/span><\/p>
<\/div><\/span>
- Beneficios de ley.<\/span><\/span><\/span><\/span>
- Proactividad y sentido de urgencia; ownership extremo.<\/span><\/span><\/span><\/span>
- Mensajería/colas (Kafka/RabbitMQ), tareas programadas (Celery/Arq).<\/span><\/span><\/span><\/span>
- Python avanzado (asincronía, manejo de errores, tipado, empaquetado).<\/span><\/span><\/span><\/span>
- Convertir requerimientos de negocio en soluciones técnicas mantenibles.<\/span><\/span><\/span><\/span>
- Diseño UI/UX/front -end más allá de endpoints y contratos de APIs.<\/span><\/span><\/span><\/span>
¿Te interesa este puesto?