Bonjour, je voudrais savoir si il y a un moyen de bypass le captcha datadome leboncoin.
Je suis en train de créer un programme en python avec sélénium pour scraper les annonces lbc mais
mon problème est le captcha que je suis obligé de remplir manuellement, y’a t’il un moyen, par exemple une extension à ajouter au webdriver ou autre ?
Je précise que je me suis mis à python depuis peu dans le cadre d’un projet, donc je me débrouille vite fait mais je ne suis pas un pro.
Peux-tu partager stp un exemple de Captcha qui t’ai demandé ? Je sais qu’il y a des librairies en Python qui se développent pour les passer.
Après pour LBC tout dépend le temps que tu as devant toi mais je sais que beaucoup se cassent les dents sur le Web Scraping de la Plateforme (qui était plutôt simple à scraper il y a quelques années )
Oui ont peut utiliser playwright ou puppeteer, mais Datadome bannit une très large plage d’adresses IP, du coup il faut en plus passer par des proxys qui proposent des IP résidentielles (et ça monte assez vite niveaux tarifs)
Sinon on propose un (on espère) joli outil no-code
Avec:
_ 35 listings par minutes
_ 50 attributs par listings
_ 15 minutes de collecte gratuite par jour
Et on gère tout pour vous: captcha, rotations d’IPs, browser fingerprinting, captchas diverses et variés, challenges javascript, modification de structure web etc.
(des vertes et des pas mûres)
Et un article tutoriel accessible directement sur notre blog.
Curieux d’avoir vos retours!