Programmation et script

Extraire toutes les URL en utilisant une belle soupe et Python3

Extraire toutes les URL en utilisant une belle soupe et Python3

Le lien suivant extrait toutes les URL pour une page Web donnée.

#!/ usr / bin / env python3 # version python: 3.4.2 # BS4 Version: 4.3.2-2 de Urllib.Demandez une URLOpen d'importation à partir de BS4 Import BeautifulSoup HTML = Urlopen ("http: // gnu.org ") # insérer votre URL pour extraire BSOBJ = BeautifulSoup (HTML.lire()); pour lien dans bsobj.find_all ('a'): imprimer(lien.get ('href'))

Enregistrez le script ci-dessus dans un fichier par exemple. extraire-url.py et le rendre exécutable:

$ chmod + x extrait-url.py 

Exécutez le script:

$ ./ extraire-url.py 
Réinitialisation de l'appareil à large bande mobile USB Vodafone avec USB_MODESWITCH
La première fois que j'ai utilisé mon appareil à large bande mobile Vodafone USB sur mon système Fedora Linux, cela a parfaitement fonctionné . Cepend...
Thecus NTOP 10TOP 10 entrant dans une interface de commande de chargeur de démarrage Redboot
Si vous possédez un stockage NAS THECUS 2100 et que vous devez vous remettre d'un accident de logiciel, vous avez deux options. L'une consiste à utili...
La mise en cache des FAI pour réduire la bande passante - WGET et Meta Solution
C'est une pratique courante des FAI pour mettre en cache tout fichier possible en le téléchargeant à nouveau. Dans un résultat global, cela permettra ...