NemProgrammering.dk logo

Webscraping med Python

Lær Python programmering » Webscraping med Python # 19
Inkluderet:
Livstidsadgang
27 videolektioner
7 timers undervisning
Stil spørgsmål
Kursusbevis

Information om denne video

Underviser: Simon Rotendahl   Video: 18:15   Lektion nr. 19 af 27

I videoen her skal vi se hvordan, du med Python, kan hente en hjemmeside ned, og gå igennem dens indhold. For at kunne arbejde med hjemmesider, skal man kunne noget HTML (og gerne CSS også). Jeg giver en kort introduktion til det, her i videoen, nok til at du vil kunne følge med, men hvis du vil fortsætte med at arbejde med hjemmesider og Python, så er du nødt til at lære det, nemprogrammering.dk har dog et gratis HTML og CSS kursus, så det er der rig mulighed for!

En vigtig ting at bide mærke i, er at metoden brugt i videoen her (og den næste), kun virker med hjemmesider der starter med http:// og IKKE med https://, så hvis du får en fejl, så check det. Det er muligt at gøre med https, men det er mere kompliceret.

I næste videoen fortsætte vi!

Spørgsmål og kommentarer

Kun medlemmer med adgang til dette kursus kan stille spørgsmål og kommentere. Bliv medlem her!

  • Palle R. siger:

    Jeg synes videoen er utydelig. Jeg vil gerne kunne se, hvilke koder der står på videoen.

    1. Simon R. siger:

      Hej Palle,

      Opløsningen på videoen er det samme som de andre videoer, så den burde være tydelig, har du evt. checket at den står til full HD? Altså trykke på indstillingshjulet ved siden af ‘fuldskærm’ knappen, og så trykke på 1080p under ‘Quality’.

      Og godt nytår :)

      Mvh.
      Simon

  • Jacob k. siger:

    der stor dette når jeg prøver programmet

    Traceback (most recent call last):
    File “.\parse.py”, line 6, in
    dmiBS = bs4.Beautifulsoup(dmi.read()),
    AttributeError: module ‘bs4’ has no attribute ‘Beautifulsoup’

    og programmet er sådan her

    import urllib.request as urllibR
    import bs4
    url = ‘https://www.aula.dk/portal/#/overblik’

    dmi = urllibR.urlopen(url)
    dmiBS = bs4.Beautifulsoup(dmi.read()),
    print(dmiBS)

    og når jeg prøver at indstillier står der det her

    PS C:\Users\Lars Heine Knudsen\Desktop\kode4,0> pip install beautifulsoup4
    Requirement already satisfied: beautifulsoup4 in c:\users\lars heine knudsen\appdata\local\programs\python\python38-32\lib\site-packages (4.9.1)
    Requirement already satisfied: soupsieve>1.2 in c:\users\lars heine knudsen\appdata\local\programs\python\python38-32\lib\site-packages (from beau
    tifulsoup4) (2.0.1)
    WARNING: You are using pip version 19.2.3, however version 20.2.2 is available.
    You should consider upgrading via the ‘python -m pip install –upgrade pip’ command.

    1. Simon R. siger:

      Hej Jacob

      Det er simpelthen fordi Python er lidt hård i forhold til store og små bogstaver, den vil have du skriver
      dmiBS = bs4.BeautifulSoup(dmi.read())
      og ikke
      dmiBS = bs4.Beautifulsoup(dmi.read())

      Det er sådan nogle ting der er super nemme at overse desværre :)

      Mvh.
      Simon