Utilice Excel como herramienta para copiar datos de la web

Se llama raspado y puede usarse para bien o para mal.

El web scraping es el acto de extraer datos, información o imágenes de un sitio web mediante un método automatizado. Piense en ello como copiar y pegar en automático.

Escribimos o usamos una aplicación para ir a los sitios web que queremos y hacer una copia de las cosas específicas que queremos de esos sitios web. Es mucho más preciso que descargar un sitio web completo.

Como cualquier herramienta, el web scraping se puede usar para bien o para mal.
Algunas de las mejores razones para eliminar sitios web serían clasificarlos en un
motor de búsqueda en función de su contenido, comparar precios o monitorear
la información del mercado de valores. Incluso podría usarlo como una especie de herramienta de investigación.

¿Cómo puedo rastrear sitios web con Excel?

Lo crea o no, Excel ha tenido la capacidad de extraer datos
de sitios web durante mucho tiempo, al menos desde Excel 2003. Es solo que el
raspado web es algo en lo que la mayoría de la gente no piensa, y mucho menos piensa en usar un
programa de hoja de cálculo para Hacer el trabajo. Pero es sorprendentemente fácil y poderoso.
Aprendamos cómo se hace creando una colección de
atajos de teclado de Microsoft Office .

Encuentre los sitios que desea raspar

Lo primero que vamos a hacer es buscar las páginas web específicas de las que queremos obtener información. Vayamos a la fuente y busquemos en https://support.office.com/. Vamos a utilizar el término de búsqueda “atajos de uso frecuente”. Podemos hacerlo más específico usando el nombre de la aplicación específica, como Outlook, Excel, Word, etc. Puede ser una buena idea marcar la página de resultados para que podamos volver a ella fácilmente.

Haga clic en el resultado de la búsqueda, “Métodos abreviados de teclado en Excel para
Windows”. Una vez en esa página, busque la lista de versiones de Excel y haga clic en Versiones más nuevas . Ahora estamos trabajando con
lo último y lo mejor.

Podríamos volver a nuestra página de resultados de búsqueda y abrir los
resultados de todas las demás aplicaciones de Office en sus propias pestañas y marcarlas. Es
una buena idea, incluso para este ejercicio. Aquí es donde la mayoría de la gente se detendría para
recopilar accesos directos de Office, pero no nosotros. Los vamos a poner en Excel para que
podamos hacer lo que queramos con ellos, cuando queramos.

Abra Excel y raspe

Abra Excel y comience un nuevo libro de trabajo. Guarde el libro como accesos directos de Office . Si tiene OneDrive,
guárdelo allí para que funcione la función Autoguardado
.

Una vez guardado el libro, haga clic en la pestaña Datos .

En la cinta de la pestaña Datos, haga clic en Desde Web .

Se abrirá la ventana del asistente Desde Web
. Aquí es donde colocamos la dirección web o URL del sitio web
del que queremos extraer datos. Cambie a su navegador web y copie la URL.

Pegue la URL en el campo URL
del asistente Desde Web. Podríamos elegir usar esto en modo Básico o Avanzado . El modo avanzado nos brinda muchas más opciones sobre cómo
acceder a los datos del sitio web. Para este ejercicio, solo necesitamos el
modo básico . Haga clic en Aceptar .

Excel ahora intentará conectarse al sitio web. Esto puede
tardar unos segundos. Veremos una ventana de progreso, si es así.

Se abrirá la ventana del navegador
y veremos una lista de tablas del sitio web a la izquierda.
Cuando seleccionamos uno, veremos una vista previa de la tabla a la derecha. Seleccionemos la tabla Accesos directos de uso frecuente .

Podemos hacer clic en la pestaña <strong>Vista </strong>web
para ver el sitio web real, si necesitamos buscar la tabla
que queremos. Cuando lo encontremos, podremos pinchar sobre él y quedará seleccionado para
importar.

Ahora, hacemos clic en el botón Cargar
en la parte inferior de esta ventana. Hay otras opciones que podríamos elegir,
que son más complejas y están más allá del alcance de hacer nuestro primer raspado. Solo ten en
cuenta que están ahí. Las capacidades de web scraping de Excel son muy poderosas.

La tabla web se cargará en Excel después de unos segundos.
Veremos los datos a la izquierda, donde el número 1 está en la imagen de abajo. El número 2 destaca la consulta
utilizada para obtener los datos del sitio web. Cuando tenemos varias consultas en un
libro de trabajo , aquí es donde seleccionamos la que necesitamos usar.

Observe que los datos ingresan a la hoja de cálculo como una
tabla de Excel . Ya está configurado para que podamos filtrar u ordenar los datos.

Podemos repetir este proceso para todas las demás páginas web que
tienen los accesos directos de Office que queremos para Outlook, Word, Access, PowerPoint
y cualquier otra aplicación de Office.

Mantener actualizados los datos raspados en Excel

Como beneficio adicional para usted, vamos a aprender cómo mantener
actualizados nuestros datos extraídos en Excel. Esta es una excelente manera de ilustrar cuán
poderoso es Excel para la extracción de datos. Incluso con esto, solo estamos haciendo el
scraping más básico que Excel puede hacer.

Para este ejemplo, usemos una página web de información bursátil como https://www.cnbc.com/stocks/.

Repase lo que hicimos antes y copie y pegue la nueva URL de la barra de direcciones.

Llegará a la ventana del navegador y verá las tablas disponibles. Seleccionemos los principales índices bursátiles de EE. UU.

Una vez que se raspan los datos, veremos la siguiente
hoja de cálculo.

A la derecha, vemos la consulta de los principales índices bursátiles de EE. UU.
Seleccione eso para que quede resaltado. Asegúrese de que estamos en la pestaña Herramientas de tabla y en el área de Diseño
. Luego haga clic en la flecha hacia abajo debajo de Actualizar .
Luego haga clic en Propiedades de conexión .

En la ventana <strong>Propiedades de</strong> la consulta
, en la pestaña Uso
, podemos controlar cómo se actualiza esta información. Podemos establecer un
período de tiempo específico para actualizar, o para actualizar cuando abramos el libro de trabajo la próxima vez, o para
actualizar en segundo plano, o cualquier combinación de estos. Una vez que elegimos lo que
necesitamos, hacemos clic en Aceptar para cerrar la
ventana y continuar.

¡Eso es todo! Ahora puede realizar un seguimiento de los precios de las acciones, los resultados deportivos o cualquier otro dato que cambie con frecuencia desde una hoja de cálculo de Excel. Si es bueno con las ecuaciones y funciones de Excel, puede hacer casi todo lo que quiera con los datos.

Tal vez intente identificar las tendencias de las acciones, ejecute un grupo de deportes de fantasía en el trabajo o tal vez simplemente realice un seguimiento del clima. ¿Quién sabe? Tu imaginación y los datos disponibles en Internet, son los únicos límites.

Leave a Comment

Your email address will not be published. Required fields are marked *