Bonjour a tous,
Je suis entrain de développer un service web de statistiques sur les joueurs de poker en ligne du reseau Winamax.
Un peu comme ce site https://fr.sharkscope.com/ pour les connaisseurs.
En gros, ce site est le leader de la statistiques de poker en ligne, mais il a plein de défauts, d’où mon idée d’en faire un mieux.
Pour récupérer les informations des tournois, je me base pour l’instant sur cette url : https://www.winamax.fr/les-tournois_planning
Partant de là, je récupére les résultats des tournois pour alimenter ma base de donnée.
Sauf que, ça serait trop beau si ça marchait comme ça, au bout de quelques tournois, une dizaine, on me demande une captcha.
Je ne suis pas un développeur expérimenté, mais il me semble que pour pallier le problème, soit je fais appel au vilain death by captcha, mais éthiquement je trouve ça moyen, soit je passe un bon vieux OCR en espérant que ça marche. J’ai tenté l’OCR, ça marche a peu près sur 10% des captcha.
La question que je me pose, c’est est-ce que c’est illégal de faire ça ? Parce que je contourne quand même un moyen de sécurité.
Après en soit ce n’est pas bien méchant ce que je fais, c’est juste de simple requête http sur un serveur web.
En aucun cas ça ne posera de problème sur leur serveur.
J’ai envoyé un mail a Winamax pour les prévenir de mon projet, et je leur ai demandé si je pouvais avoir un accès a leur API.
Il m’ont répondu qu’ils me donnerais l’accès si je leur produit une maquette inintéressante. Dans le mail j’ai bien préciser que j’allais scrapper leur page de tournois.
Techniquement je fais ça en Java a l’aide de htmlUnit.