Portada
Carlos Carrillo

México · Remoto (Mundial)

Carlos Carrillo

AI + Data Engineer & Architect | 20+ años · Snowflake · Azure · Cloudflare | Diseña y entrega productos de datos + IA end-to-end — del assessment al edge | Creador de Octorato | Remoto (EN/ES)

México · Remoto (Mundial)

00

Acerca de

La mayoría de los ingenieros usa IA — yo soy de los pocos que construyó el sistema operativo sobre el que corre su agente. Soy el creador de Octorato, un AI Agent OS open-source: reglas versionadas, 180+ personas de agente especializadas y un connectome de grafos con gates de flujo estrictos y aislamiento del trabajo por cliente. Todo eso se apoya en 20+ años de ingeniería de datos con SQL Server, Snowflake y Azure — la base que hace creíble la IA. Arquitecto y entrego de punta a punta, solo — desde pipelines ETL incrementales y data warehouses en Snowflake/Azure SQL hasta chatbots RAG, dashboards en tiempo real y motores de trading algorítmico, hasta el despliegue y operación en el edge de Cloudflare. Herramientas de IA que realmente construyo — no solo uso: pipelines de evaluación LLM, búsqueda por embeddings vectoriales y algoritmos de grafos. Totalmente remoto por años con equipos de EE.UU. y LATAM — entrega estructurada y documentada entre zonas horarias.

"Vivir en paz, libre de estructuras rígidas — construyendo proyectos que fluyen naturalmente a través de inteligencia y consciencia. La tecnología debe servir a la vida, no al revés."

01Experiencia

Experiencia

Senior Data Engineer

dataqbs Freelance

ene 2011 — Actual

Guadalajara, Mexico · Remote

Consultoría independiente entregando ingeniería de datos, BI, automatización asistida por IA y consultoría de arquitectura para clientes de EE.UU. y LATAM — colaborando con firmas tecnológicas (NewFire Global, Empresas Dragón) en engagements empresariales en salud, minería, retail y consultoría. También distribuye productos propios de dataqbs: el AI Agent OS Octorato, el marketplace Open Garage, el catálogo público Real Estate (Séptimo Piso), el bot MEMO-GRID, un motor de evaluación LLM, y este sitio portfolio con chatbot RAG.

PythonSQL ServerPostgreSQLSnowflakeSSIS/SSRS/SSASTableauPower BIDataiku DSSAzure Data FactoryNode.jsPlaywrightccxtpandasAstroSvelteConfluence APIADO REST APIMicrosoft GraphMiro APINetworkXReportLabAzure MLClaude Code

Data Integration Lead

Hexaware Technologies Tiempo completo

mar 2025 — mar 2026

Mexico · Remote

Me sumé al equipo de integración de datos apoyando la modernización de operaciones conectadas de un cliente minero global. Colaboré en pipelines de sincronización incremental, herramientas de pruebas de regresión, optimización de vistas Snowflake, y el rollout de dashboards de producción y chatbots de IA en 7 sitios mineros.

SnowflakeAzure SQLADX/KQLAzure FunctionsApp ServicePythonStreamlitDockerGitHub EnterpriseCopilotMERGE/UpsertCDC/DeltaCTE RefactoringETL/ELTIoT Sensor DataMining AnalyticsEntra ID/KerberosCI/CD

ETL Engineer

SVAM International Inc. Contrato

nov 2022 — sep 2024

Mexico · Remote

Lideré migración de SQL Server on-prem y SSIS a Snowflake para analítica de certificaciones estudiantiles.

SnowflakeSQL ServerSSISSalesforce APISharePoint

02Certificaciones

Certificaciones

Anthropic

Certificate of Completion: Introduction to Agent Skills

Anthropic

Emitido por Anthropic · 2026

ID de Credencial: t3j2knij9735

Anthropic

Certificate of Completion: AI Fluency Framework & Foundations

Anthropic

Emitido por Anthropic · 2026

ID de Credencial: 3fg9fxpyta6i

03Proyectos

Proyectos Destacados

Octorato — AI Agent OS

AI / ML

Octorato le da a un agente de programación con IA una identidad duradera que persiste entre sesiones y máquinas — reglas versionadas, skills reutilizables y personas de agentes especialistas guardadas como archivos planos en git. Impone un flujo estructurado (describe, delega, valida, divulga) y mantiene el trabajo de cada cliente aislado de la base de conocimiento compartida. Aún en desarrollo activo.

  • Memoria de agente basada en archivos que persiste entre sesiones, máquinas y proyectos
  • Sistema de skills y agentes especialistas cargados bajo demanda por tarea
  • Manifiestos de cambio pre-escritura y gates de validación post-escritura obligatorios
  • Aislamiento estricto entre el trabajo por cliente y la base de conocimiento compartida
  • Usado para desplegar varios productos en el edge de Cloudflare
TypeScriptPythonBashGitMarkdownCloudflare Workers

Azure Data Architecture Assessment

Data Eng.

Auditoría integral de plataforma de datos Azure para Empresas Dragón — SQL Server, ADF, Azure ML, Blob Storage en 3 ambientes.

  • Documento de Diseño Técnico de 4,100+ líneas con generación PDF profesional
  • 30+ hallazgos en SQL Server, ADF, Azure ML y Blob Storage
  • Auditoría multi-ambiente: DEV, TEST, PROD con extracción de esquemas
  • Análisis de stored procedures con recomendaciones de hardening
  • Optimización de costos: identificación de oportunidades de ahorro en servicios Azure
  • Entregable PDF profesional con layout de marca y tabla de contenido
SQL ServerAzure Data FactoryAzure MLAzure Blob StoragePythonReportLab

Enterprise PostgreSQL Audit Framework

Data Eng.

Contribuí a un framework completo de auditoría y gestión de esquemas para Azure Database for PostgreSQL en una empresa de salud animal, como parte de un engagement de FussionHit. Incluye exportación DDL por objeto con templates Nunjucks, descubrimiento automatizado de esquemas, generación de schema_knowledge.json amigable con LLM, y 60+ mejoras de base de datos basadas en tickets en optimización de índices, remediación de FK, normalización de timestamps, y revisiones de stored procedures. También un Documento de Diseño Técnico de 4,100 líneas evaluando una migración de SQL Managed Instance vs PostgreSQL para una plataforma de salud.

  • 60+ tickets: optimización de índices, remediación de FK, renombramientos de esquema, correcciones de timestamps
  • TDD de 4,100 líneas evaluando migración SQL MI vs PostgreSQL para una plataforma de salud
  • Exportador DDL templado por objeto (Nunjucks) para snapshots compatibles con CI/CD
  • Documentos de Diseño Técnico para 5+ sistemas de bases de datos
  • Generación automatizada de hoja de tiempo con Harvest API
PostgreSQLNode.jsJavaScriptNunjucksAzure PostgreSQL

Enterprise Knowledge Capture Platform

Data Eng.

Contribuí a las herramientas de consultoría multi-cliente de NewFire Global. 28 herramientas Node.js (10,000+ LOC) que se autentican a través de Okta/Microsoft SSO vía Playwright, y capturan sistemáticamente contenido de wikis de Azure DevOps, espacios Confluence, canales/calendario de Teams, documentos SharePoint, notebooks Databricks, tableros Miro y Google Drive. Incluye renderizador de diagramas de arquitectura SVG/PNG config-driven con swimlanes, logos embebidos y validación de superposición. Pipeline de publicación Confluence para convertir conocimiento capturado en páginas wiki estructuradas. En engagements de salud, capturó 8.5M+ caracteres en 16 servicios conectados (302 archivos, 159MB) para transferencia de conocimiento.

  • 28 herramientas en 6 categorías: scrapers SSO, clientes API, extractores de contenido, renderizadores de diagramas, publicadores, diagnósticos
  • 10,000+ LOC con arquitectura modular (shared/ + clients/<nombre>/)
  • Scraping autenticado por SSO: Okta, Microsoft, Databricks, Confluence, SharePoint
  • Diagramas de arquitectura SVG/PNG config-driven con swimlanes y auto-layout
  • Pipeline de publicación Confluence: Markdown → páginas wiki estilizadas
  • 8.5M+ caracteres capturados de 16 servicios (ADO 2.1M, Confluence 907K, Teams, Google Drive)
  • Investigación de Iceberg REST Catalog para lakehouse Databricks
  • Extensión VS Code para integración de Calendario M365 y Transcripciones
Node.jsPlaywrightConfluence REST APIADO REST APIMicrosoft GraphMiro APIexceljsmammothpdf-parsejs-yamlSVG

IROC Video Wall Dashboard

Data Eng.

Dashboard de monitoreo de producción basado en Streamlit para operaciones IROC en 7 sitios mineros de un importante productor de cobre norteamericano, entregado como engagement de Hexaware Technologies. Presenta métricas en tiempo real desde Snowflake y Azure Data Explorer (ADX), 34 KPIs cubriendo cumplimiento de dig, tasas de trituración, tiempos de ciclo y tonelaje ROM. Incluye chatbot de IA con RAG usando GitHub Copilot SDK, modelo semántico con 16 resultados de negocio por sitio, y auto-refresh cada 60 segundos.

  • 34 KPIs a través de 7 sitios mineros con auto-refresh en tiempo real
  • Chatbot de IA con RAG + GitHub Copilot SDK (costo cero para enterprise)
  • Modelo semántico: 16 resultados de negocio × 7 sitios con consultas ADX + Snowflake
  • Listo para Docker con despliegue en Azure Container App
  • 100% cobertura KPI-a-consulta verificada
PythonStreamlitSnowflakeAzure Data ExplorerKQLGitHub Copilot SDK

MEMO-GRID

FinTech

Microservicio de grid trading en producción usando ccxt con Binance Spot. Incluye optimización de hiperparámetros Optuna (50K pruebas), motor de backtest con modelado de comisiones reales, análisis de atribución (descomposición alfa vs beta), proyecciones Monte Carlo, y 22 herramientas de análisis. Incluye seguimiento de inventario FIFO, dimensionamiento adaptativo de pasos, y soporte de despliegue systemd.

  • HPO con 50,000 pruebas Optuna (muestreador TPE) para parámetros de grid ETH/BTC
  • Motor de backtest abarcando 2017–2026 con modelado de comisión maker
  • Análisis de atribución: descomposición de retorno alfa vs beta
  • Proyecciones Monte Carlo con intervalos de confianza
  • 33 pruebas unitarias con cobertura completa
PythonccxtOptunapandasNumPyPyYAMLpytest

dataqbs.com Portfolio

AI / ML

Este mismo sitio — un portafolio estilo LinkedIn con chatbot de IA RAG, construido con Astro + Svelte + Tailwind en Cloudflare Pages.

  • Chatbot RAG con embeddings vectoriales + streaming LLM con Groq
  • Pipeline de conocimiento: markdown → 88 chunks con embeddings de 768 dims
  • i18n (EN/ES/DE), modo oscuro, diseño estilo LinkedIn
  • Cloudflare Pages + Workers AI + almacenamiento KV
  • Construido con el framework de agentes Octorato
AstroSvelteTailwind CSSCloudflare Workers AIGroqTypeScript

Open Garage

AI / ML

Marketplace SaaS full-stack para ventas de garaje vecinales, desplegado como aplicación Cloudflare Pages. Incluye descripciones de artículos con IA usando modelos de visión Workers AI (Llama 3.2 90B), autenticación Google OAuth, almacenamiento KV multi-tenant con aislamiento por garaje, traducción automática a ES/EN/DE, captura de cámara móvil con compresión automática, integración WhatsApp, panel de administración con logs de auditoría, y dashboard de superadmin. 15 endpoints API, 20+ componentes Svelte, servicio de imágenes con caché en el edge.

  • 15 endpoints API con 20+ componentes Svelte en Cloudflare Pages
  • Descripciones de artículos con visión IA vía Workers AI (Llama 3.2 90B Vision)
  • Almacenamiento KV multi-tenant con aislamiento de namespace por garaje
  • Autenticación Google OAuth + JWT con gestión de sesiones
  • Auto-traducción a ES/EN/DE con detección de idioma
  • Captura de cámara móvil con compresión en cliente y subida por chunks
  • Panel admin + dashboard superadmin con logs de auditoría y sistema de ban
  • Construido con el framework de agentes Octorato
AstroSvelteTypeScriptCloudflare Workers AICloudflare KVGoogle OAuthTailwind CSSTurnstile

Real Estate Catalog (Séptimo Piso)

Data Eng.

Catálogo público de propiedades (dataqbs.com/realestate) construido con Astro + Svelte sobre Cloudflare D1, KV y R2. EasyBroker es la fuente autoritativa: un pipeline de ingesta diaria sincroniza listados, imágenes y precios en D1. Incluye una cola de revisión de imágenes en admin, publicación diaria automatizada en Facebook Page con carruseles de fotos adaptativos, un badge EXCLUSIVA para listados propios, filtrado por facetas, i18n, y un cambio de marca white-label config-driven para que el mismo motor potencie cualquier agencia en minutos.

  • Ingesta diaria autoritativa de EasyBroker en Cloudflare D1 (listados, imágenes, precios)
  • Publicación diaria automatizada en Facebook Page con carruseles de fotos adaptativos
  • Cola de revisión de imágenes en admin con flujo aprobar/rechazar
  • Cambio de marca white-label config-driven (rebrand de agencia en minutos)
  • Filtrado por facetas, i18n y headers de seguridad SSR en Cloudflare Pages
  • Construido con el framework de agentes Octorato
AstroSvelteTypeScriptCloudflare D1Cloudflare KVCloudflare R2EasyBroker APIFacebook Graph APITailwind CSS

Multi-Reach — Social Publisher & Admin

Automation

Plataforma interna que publica contenido de tres productos (Real Estate, Open Garage y el blog diario de noticias de IA) en Facebook Pages en horario automatizado. Un cron de Cloudflare Worker dirige un scheduler que intercala contenido PRO/FREE, arma carruseles de fotos adaptativos y registra historial de ejecución. Un dashboard de admin en vivo muestra KPIs por producto, una tira de heartbeat de crons con botones de reintento por job, y controles de disparo manual respaldados por un centinela D1 para idempotencia.

  • Scheduler por cron publicando en Facebook Pages a través de 3 productos
  • Dashboard de admin en vivo con KPIs por producto y tira de heartbeat de crons
  • Disparos manuales de cron con idempotencia por centinela D1 (sin doble publicación)
  • Carruseles de fotos adaptativos que se reducen ante límites de payload de Meta
  • Intercalado PRO/FREE con pools de contenido separados
  • Construido con el framework de agentes Octorato
AstroSvelteTypeScriptCloudflare WorkersCron TriggersCloudflare D1Cloudflare KVFacebook Graph API

Ore Tracing & Stockpile Simulation

Data Eng.

Sistema de trazado de mineral end-to-end que simula comportamiento de stockpile usando modelos de bloques 3D y rastrea mineralogía a través del circuito de conminución (trituradoras secundarias/terciarias → molinos → flotación). Incluye calibración predictiva de básculas industriales con filtrado Kalman, estimación de tiempo de crush-out, modelos de propagación basados en lag, y simulación nowcast para múltiples sitios mineros. El pipeline de datos lee datos de sensores a resolución de 1 minuto desde un data warehouse en la nube, ejecuta simulaciones, y escribe estados minerales trazados para analítica downstream.

  • Simulación de stockpile basada en física 3D con seguimiento de masa a nivel de bloque
  • Trazado de composición mineral a través de circuitos trituradora → molino → flotación
  • Corrección de báscula con filtro Kalman con ponderación de inercia
  • Predicción nowcast y de tiempo de crush-out para planificación operativa
  • Despliegue multi-sitio con arquitectura YAML config-driven
PythonSnowflakeAzure ML PipelinesDagsterNumPySciPyPyYAMLDynaconf

04Habilidades

Habilidades

💻 Lenguajes

Python Avanzado
SQL Experto
JavaScript / TypeScript Avanzado
KQL (Kusto) Avanzado
Bash Avanzado
Node.js Avanzado
PowerShell Intermedio

☁️ Datos y Nube

Snowflake Experto
Azure (SQL, ADF, Functions) Avanzado
Azure Data Explorer (ADX) Avanzado
Microsoft Fabric Intermedio
Cloudflare (Pages, Workers, AI) Intermedio

🤖 IA y ML

LLM Evaluation & Prompt Eng. Avanzado
RAG (Retrieval-Augmented Gen.) Avanzado
Snowflake Cortex AI Avanzado
Vector Embeddings & Search Avanzado
GitHub Copilot SDK Avanzado
Claude Code (Agent SDK) Avanzado
Optuna (HPO) Avanzado
Fine-Tuning (PEFT / LoRA) Intermedio

📦 Librerías y Frameworks

pandas / NumPy Experto
ccxt (crypto exchanges) Experto
Streamlit Avanzado
Playwright Avanzado
Astro / Svelte Intermedio
Nunjucks / Jinja2 Avanzado
NetworkX Avanzado
ReportLab Avanzado
Rich / rapidfuzz Avanzado

🔧 DevOps y Herramientas

GitHub Actions CI/CD Avanzado
Poetry / pip Experto
ruff / pre-commit / pytest Avanzado
Docker Intermedio
QEMU / KVM Intermedio
Linux (Pop!_OS) Avanzado

🗄️ Bases de Datos

SQL Server Experto
Snowflake Experto
PostgreSQL Experto
Azure SQL / Azure PostgreSQL Avanzado
SQLite Avanzado

05Contacto

Contacto