Analisis de datos
Web scraping es una técnica utilizada por programadores de software para extraer información de sitios web. Usualmente, se simula la navegación de un humano en la World Wide Web ya sea utilizando el protocolo HTTP manualmente, o incrustando un navegador en una aplicación. El web scraping está relacionado fuertemente con la indexación de la web, […]
Originalmente, las herramientas de la librería Pandas, fueron desarrolladas para series temporales financieras. Las robustas y flexibles estructuras de datos en Pandas pueden ser aplicadas a series temporales en cualquier dominio, incluyendo negocios, ciencia, ingeniería, salud pública y muchos otros. Con esta herramienta se pueden organizar, transformar, analizar y visualizar datos en cualquier nivel de granularidad […]
Durante los últimos años, muchas empresas han implementado servicios basados en la nube; como resultado, varias empresas comenzaron a construir y proveer dichos servicios. Amazon marcó tendencia, con Amazon Web Services (AWS). Aunque AWS comenzó en 2006 como un negocio paralelo, ahora genera $14.5 billones en ingresos cada año. Otras empresas que lideran en este […]
La ciencia de datos es un campo de la ciencia que busca extraer el conocimiento o el mejor entendimiento posible de datos estructurados o no estructurados involucrando múltiples disciplinas, métodos científicos y sistemas. Iniciar en esto, puede ser sumamente abrumador, y mas aun cuando no se manejan los términos básicos que son utilizados comúnmente en […]
Una base de datos es una colección de datos organizada en diferentes tablas. Existen varios tipos de bases de datos, siendo las más utilizadas: las planas y las relacionales. Por un lado, en una base de datos plana toda la información sobre cualquier evento u operación se almacena en una sola fila en una sola […]
Un analista de datos necesita interactuar con estructuras de datos complejas como las bases de datos relacionales. Dichas bases de datos, se basan en un modelo relacional de datos, las cuales consta de muchas tablas las cuales están enlazadas entre sí y representan un tipo de entidad. Cada fila representa una instancia del tipo Entidad […]
Glob es un término comúnmente empleado para describir la expansión o la coincidencia de los valores devueltos cuando se utilizan expresiones regulares o coincidencias de patrones. Cada vez que quieras operar con un grupo de archivos que tengan nombres similares, puedes usar un patrón Glob para hacerlo. Globbing es un término técnico que se utilizar […]
Siempre necesitarás importar los datos, limpiarlos, manejarlos y visualizarlos para poder construir modelos predictivos e interpretarlos. No obstante, antes de hacer cualquiera de estos pasos, necesitarás saber cómo introducirlos en tu entorno de programación. En la lección de este curso, vas a aprender cómo importar datos de archivos planos a Python. Python soporta una gran […]
Python es uno de los lenguajes de programación más empleados en el campo del análisis de datos, por su versatilidad y sinfín de librerías adaptadas a dicho fin. En esta lección, te mostraremos todas las librerías que un buen científico de datos debe conocer obligatoriamente, conjuntamente con una pequeña explicación para que sepas dónde, cuándo […]
El algoritmo de Machine Learning más aplicable para nuestros problemas más usuales es el SVC lineal. Antes de entrar en SVC lineal con nuestros datos, vamos a mostrar un ejemplo muy simple que le ayudará a solidificar su comprensión del SVC lineal. El objetivo de un SVC lineal (Support Vector Classifier) es adecuarse a los […]