Vídeo recomendado
https://youtu.be/diWPPPhW-9E

3 questões de scraping

A Web está aí, não há como negar. Ela é onipresente em praticamente toda operação eletrônica realizada nos dias de hoje. Como não podia ser diferente, o Excel, ferramenta máxima para analistas e profissionais das mais diversas áreas do mercado precisa estar alinhado com esta necesssidade. E ele está! Neste forum, o debate é focado em expor dúvidas, sugestões, modelos de código e exemplos de uso do Excel na Integração com tecnologias Web.
TUVOK
Colaborador
Colaborador
Mensagens: 73
Registrado em: Ter Jul 21, 2015 9:44 am

3 questões de scraping

Mensagem por TUVOK »

Bom dia!

Estou trabalhando em um projeto e preciso de ajuda para conseguir realizar 3 procedimentos:
-Puxar da tabela somente o registro que contiver determinada palavra;
-Pegar somente da quarta e sexta colunas de uma tabela o valor mais alto e a data mais recente;
-inserir em cada uma das células no excel/destino comentários com a tabela completa de onde saiu os valores acima.

Mais uma vez, muito obrigado pela atenção!

Abraços!


Disable adblock

This site is supported by ads and donations.
If you see this text you are blocking our ads.
Please consider a Donation to support the site.


Avatar do usuário
webmaster
Administrador
Mensagens: 3114
Registrado em: Sex Jul 24, 2009 2:44 pm
Contato:

Re: 3 questões de scraping

Mensagem por webmaster »

Aqui:

https://www.youtube.com/watch?v=1RPs8NTp9ig

Umas das opções que o Selenium oferece é ao invés de jogar os dados da tabela no Excel, retornar ela num array. Se fizer isso, terá controle total dos dados da mesma, podendo fazer qualquer coisa depois disso.


TUVOK
Colaborador
Colaborador
Mensagens: 73
Registrado em: Ter Jul 21, 2015 9:44 am

Re: 3 questões de scraping

Mensagem por TUVOK »

Sinceramente que eu pensei nisso no caso do valor máximo de data e valor em dinheiro, mas essa era uma das coisas que eu esperava que me ensinasse!


Avatar do usuário
webmaster
Administrador
Mensagens: 3114
Registrado em: Sex Jul 24, 2009 2:44 pm
Contato:

Re: 3 questões de scraping

Mensagem por webmaster »

Lá vai:

Código: Selecionar todos

Dim driver As WebDriver
 
Sub ExtrairTabelaDaPaginaParaAPlanilha()
    Set driver = New ChromeDriver
    Dim destino As Range
    Set destino = Range("A1")
 
    driver.Get "https://pt.wikipedia.org/wiki/Subdivis%C3%B5es_do_Brasil"
 
    Dim tabela As WebElement
 
    Set tabela = driver.FindElementByXPath("/html/body/div[3]/div[3]/div[4]/div/table")
 
    If tabela Is Nothing Then
        MsgBox "Elemento não encontrado"
    Else
        tabela.AsTable.ToExcel destino
    End If
 
    driver.Quit
End Sub


Sub ExtrairTabelaDaPaginaParaUmArray()
    Set driver = New ChromeDriver
    Dim destino As Range
    Dim data()
 
    driver.Get "https://pt.wikipedia.org/wiki/Subdivis%C3%B5es_do_Brasil"
 
    Dim tabela As WebElement
 
    Set tabela = driver.FindElementByXPath("/html/body/div[3]/div[3]/div[4]/div/table")
 
    If tabela Is Nothing Then
        MsgBox "Elemento não encontrado"
    Else
        data = tabela.AsTable.data
    End If
    
    'Print all cells
    
    For c = 1 To UBound(data, 1)
        For r = 1 To UBound(data, 1)
            Debug.Print data(r, 1) 'Coluna 1
            Debug.Print data(r, 2) 'Coluna 2
            Debug.Print data(r, 3) 'Coluna 3
            Debug.Print data(r, 4) 'Coluna 4
        Next
    
    Next
 
    driver.Quit
End Sub


Disable adblock

This site is supported by ads and donations.
If you see this text you are blocking our ads.
Please consider a Donation to support the site.


TUVOK
Colaborador
Colaborador
Mensagens: 73
Registrado em: Ter Jul 21, 2015 9:44 am

Re: 3 questões de scraping

Mensagem por TUVOK »

Excelente!

Com sua ajuda até já consegui resolver a 1ª questão e acho que não terei problemas com a última, mas a 2ª, a do maior numa coluna, esta estou tendo um pouco de dificuldade.

Pode me ajudar?

Como sempre, muito obrigado!


Disable adblock

This site is supported by ads and donations.
If you see this text you are blocking our ads.
Please consider a Donation to support the site.


Responder