Seguramente habrás escuchado muchas veces el término de aprendizaje automático (o también conocido como Machine Learning en inglés) y es probable que no sepas a ciencia cierta qué significa.
Este término se ha puesto de moda últimamente, se ha convertido en uno de los campos de la informática más interesantes y con más futuro. En mi blog, aprenderás todos los conceptos relacionados con el aprendizaje automático de una manera sencilla y clara.
En este artículo te explicaré su definición fácil de entender. A continuación, también veremos ejemplos para que te ayuden a verlo de una manera más práctica y puedas comprobar que realmente te ha quedado claro.
¿Preparado para sumergirte en el mundo del Machine Learning? ¡Vamos allá!
¿Qué es el Machine Learning?
Arthur Samuel definió el Machine Learning como el campo de estudio que proporciona a los ordenadores la capacidad de aprender sin programarse explícitamente. Dicho de otra manera, la habilidad de un programa informático de realizar una tarea a través de experiencias pasadas.
Otra definición del aprendizaje automático
El científico informático americano Tom Mitchell ofreció otra definición de Machine Learning más precisa y moderna:
Se dice que un programa aprende de una experiencia E respecto a una tarea T y con una medida de rendimiento P, si su rendimiento en la tasca T, mesurado por P, mejora la experiencia E.
Tom Mitchell
La manera más fácil de entender los conceptos de E, T y P es mediante algunos ejemplos. ¡Vamos a verlo!
Ejemplo práctico: jugando a ajedrez
Siguiendo la definición de Arthur Samuel, la capacidad de un ordenador de jugar a ajedrez se puede dividir en tres conceptos:
- E: la experiencia de jugar muchas partidas de ajedrez.
- T: la tarea de jugar al ajedrez en sí.
- P: la probabilidad de que un ordenador gane la partida de ajedrez.
Un programa, después de jugar muchas partidas, puede aprender a jugar al ajedrez y mejorar su probabilidad de ganar en partidas futuras.
Otro ejemplo práctico: clasificando correos electrónicos no deseado
Imagina que tu cliente de correo electrónico observa en los correos que tu marcas como no deseado, y puede aprender cómo lo haces. ¿Cuáles son los conceptos E, T y P en este caso?
- E: la experiencia de ver que correos clasificas como deseado o no deseado.
- T: la tarea de clasificar los correos en deseado o no deseado.
- P: el porcentaje de acierto de clasificar un correo no deseado.
Dos clasificaciones
De manera general, todos los problemas de aprendizaje automático se pueden dividir en dos clasificaciones:
- Aprendizaje supervisado (supervised learning): en este tipo de problemas entrenamos nuestro modelo con un conjunto de datos que ya tienen solución (ya están etiquetadas). De esta manera, el programa puede ver una relación entre los datos de entrada y la solución que tiene que dar.
- Aprendizaje no supervisado(unsupervised learning): a diferencia al aprendizaje supervisado, en estos problemas solo se entrenan los modelos con un conjuntos de datos sin etiquetar, por este motivo no tenemos ni idea de su solución.
Conclusión
El primer paso para introducirse en el mundo del Machine Learning es aprender qué es y con qué tipo de problemas batallaremos.
¡Ya sabes mucho más que la mayoría de gente! El aprendizaje automático es un campo tan reciente e innovador que es muy importante poder explicar bien de qué se trata y ver brevemente los tipos de ejercicios más habituales que uno se puede encontrar.
¿Te atreves a seguir aprendiendo? Vamos a ello 🙂