Machine Learning no es magia ni ciencia ficción — es estadística aplicada con buenos datos. Mercado Libre detecta fraudes en milisegundos, Spotify predice qué canción quieres escuchar, y los bancos LATAM aprueban créditos en segundos: todo con ML. Esta guía desmitifica el campo y muestra cómo empezar.
from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import accuracy_score import pandas as pd # Cargar datos df = pd.read_csv("clientes.csv") X = df[["edad", "saldo", "meses_cliente", "productos"]] y = df["se_fue"] # 1=churn, 0=se quedó # Dividir en entrenamiento y prueba X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Entrenar modelo modelo = RandomForestClassifier(n_estimators=100, random_state=42) modelo.fit(X_train, y_train) # Evaluar y_pred = modelo.predict(X_test) print(f"Accuracy: {accuracy_score(y_test, y_pred):.2%}")
El módulo de Python para análisis incluye introducción a machine learning con scikit-learn y proyectos reales de predicción aplicados a datos de empresas LATAM.