Python 캡차 우회

Python 캡차 우회

모든 사이트에서 캡차 해결용 Python 패키지를 자동으로 통합합니다.

reCAPTCHA, hCaptcha, Arkose captcha, Geetest 를 우회하기 위한 2Captcha 캡차 해결 서비스 API와의 쉬운 통합 및 기타 캡차 해결을 위한 위한 Python 패키지

GitHub에 게시된 Python 및 Selenium을 사용한 캡차 우회 예제 예제 가 있습니다. 이 리포지토리에는 캡차 해결 프로세스를 자동화하기 위해 바로 사용할 수 있는 스크립트가 포함되어 있어 기존 프로젝트에 쉽게 통합할 수 있습니다.

빠른 시작

설치

스크립트 패키지는 패키지 설치 관리자를 사용하거나 수동으로 설치될 수 있습니다

Pip

라이브러리 패키지를 자동으로 설치하려면 표준 Python 패키지 해결 방법 Pip을 사용해야 합니다. a href='https://pypi.org/project/pip/#files' rel='' target='_blank'>링크에서 다운로드하시고, 지침에 따라 설치하십시오. 응용 프로그램을 설치한 후 다음의 명령을 사용하십시오:

pip3 install 2captcha-python

API와 쉽게 통합될 수 있는 라이브러리와 모듈을 찾을 수 있는 GitHub 저장소를 방문하시길 바랍니다.

구성

설치된 패키지를 구성하는 데 필요한 모든 파라미터에 관한 설명

TwoCaptcha 클래스의 인스턴스는 다음과 같이 생성될 수 있습니다:

from twocaptcha import TwoCaptcha

solver = TwoCaptcha('YOUR_API_KEY')

또한 생성된 인스턴스에 대한 일부 옵션을 원하는 대로 바꿀 수도 있습니다:

config = {
            'server':           '2captcha.com',
            'apiKey':           'YOUR_API_KEY',
            'softId':            123,
            'callback':         'https://your.site/result-receiver',
            'defaultTimeout':    120,
            'recaptchaTimeout':  600,
            'pollingInterval':   10,
        }
solver = TwoCaptcha(**config)
TwoCaptcha 인스턴스 옵션
옵션기본 값설명
서버'2captcha.com'API 서버. 'rucaptcha.com'에 계정이 등록되어 있으면 해당 계정으로 설정할 수 있습니다.
softId-2Captcha 소프트웨어 카탈로그에 게시된 뒤 생성된 귀하의 소프트웨어 아이디
callback-캡차 인식 결과를 수신하는 웹 서버의 URL. URL은 계정의 핑백 설정에 먼저 등록되어야 합니다.
defaultTimeout120reCAPTCHA를 제외한 모든 캡차 유형에 대한 폴링 시간 초과(초). 모듈이 res.php API 엔드포인트에서 응답을 얻으려고 시도하는 시간을 정의함
recaptchaTimeout600reCAPTCHA의 폴링 시간 초과(초). 모듈이 res.php API 엔드포인트에서 응답을 얻으려고 시도하는 시간을 정의함
pollingInterval10res.php API 엔드포인트로의 요청 사이 간격(초), 5초 미만의 값을 설정하는 것은 권장하지 않음
중요: TwoCaptcha 인스턴스에 대해 callback이 정의되면, 모든 수단이 캡차 아이디만 반환하고 결과를 얻기 위해 API를 폴링하지 않습니다. 결과는 콜백 URL로 전송됩니다. 수동으로 답변을 얻으려면 getResult 수단을 사용하십시오.

캡차 해결

이미지 기반 캡차를 제출할 때, {{site_name}의 작업자가 올바르게 캡차를 해결할 수 있도록 추가적인 옵션을 제공할 수 있습니다

캡차 옵션
옵션기본값설명
numeric0캡차에 숫자 또는 기타 기호가 포함되어 있는지 여부를 정의합니다 자세한 내용은 API 문서를 참조하십시오
minLength0답변 최소 글자수
maxLength0답변 최대 글자수
phrase0답변에 여러 단어가 포함되어 있는지 여부를 정의합니다
caseSensitive0답변이 대소문자를 구분하는지 여부를 정의합니다
calc0캡차가 계산이 필요한지 정의합니다
lang-캡차 언어를 정의합니다, 지원하는 언어 목록을 참조하십시오
hintImg-캡차를 해결할 작업자에게 힌트가 표시된 이미지
hintText-캡차를 해결할 작업자에게 표시되는 힌트 또는 작업 텍스트
simpleCaptcha

일반 캡차 (이미지 속 왜곡된 텍스트)를 우회하려면 다음의 방법을 사용합니다. 또한 해당 방법은 이미지에 있는 텍스트를 인식하는 데 사용될 수 있습니다.

result = solver.normal('path/to/captcha.jpg', param1=..., ...)
textCaptcha

해당 방법은 일반 텍스트로 제공된 질문에 대답해야 하는 캡차를 우회하는 데 사용할 수 있습니다.

result = solver.text('If tomorrow is Saturday, what day is today?', param1=..., ...)
recaptchaV2

해당 방법을 사용하면 reCAPTCHA V2를 해결하고, 토큰을 가져와 보호를 우회할 수 있습니다.

result = solver.recaptcha(sitekey='6Le-wvkSVVABCPBMRTvw0Q4Muexq1bi0DJwx_mJ-',
  url='https://mysite.com/page/with/recaptcha',
  param1=..., ...)
recaptchaV3

해당 방법은 reCAPTCHA V3 해결사를 제공하고 토큰을 반환합니다.

result = solver.recaptcha(sitekey='6Le-wvkSVVABCPBMRTvw0Q4Muexq1bi0DJwx_mJ-',
  url='https://mysite.com/page/with/recaptcha',
  version='v3',
  param1=..., ...)
funCaptcha

FunCaptcha (Arkoselabs) 해결 방법. 토큰 반환.

result = solver.funcaptcha(sitekey='6Le-wvkSVVABCPBMRTvw0Q4Muexq1bi0DJwx_mJ-',
  url='https://mysite.com/page/with/funcaptcha',
  param1=..., ...)
GeeTest

GeeTest 퍼즐 캡차를 해결하는 방법. 토큰 집합을 JSON으로 반환.

hCaptcha

해당 방법을 사용하여 hCapcha 문제를 해결하십시오. 캡차를 우회할 토큰 반환.

result = solver.hcaptcha(sitekey='10000000-ffff-ffff-ffff-000000000001',
  url='https://www.site.com/page/', 
  param1=..., ...)
KeyCaptcha

KeyCaptcha를 해결할 수 있는 토큰 기반 방법.

capy

Capy 퍼즐 캡차를 우회할 수 있는 토큰 기반 방법.

result = solver.capy(sitekey='PUZZLE_Abc1dEFghIJKLM2no34P56q7rStu8v',
  url='https://mysite.com/',
  api_server='https://jp.api.capy.me/',
  param1=..., ...)
grid

Grid 방법은 원래 Old reCAPTCHA V2 방법이라고도 알려져 있습니다. 해당 방법은 이미지에 그리드를 적용할 수 있고, 특정 그리드 상자를 클릭해야 하는 모든 유형의 캡차를 우회하는 데 사용할 수 있습니다. 박스 수 반환.

result = solver.grid('path/to/captcha.jpg', param1=..., ...)
canvas

캔버스 방법은 이미지 개체 주위에 선을 그어야 할 때 사용될 수 있습니다. 점의 좌표 집합을 반환하여 다각형을 그립니다.

result = solver.canvas('path/to/captcha.jpg', param1=..., ...)
clickCaptcha

ClickCaptcha 방법은 캡처차이미지에 있는 점의 좌표를 반환합니다. 이미지의 특정 지점을 클릭해야 하는 경우 사용할 수 있습니다.

result = solver.coordinates('path/to/captcha.jpg', param1=..., ...)
rotateCaptcha

해당 방법은 객체를 회전하도록 요청하는 캡차를 해결할 때 사용할 수 있습니다. 대부분 FunCaptcha를 우회하는 데 사용됩니다. 회전 각도 반환.

result = solver.rotate('path/to/captcha.jpg', param1=..., ...)

다른 방법

기본 스크립트 작업 중에 사용되는 추가적인 유효한 방법들

send / getResult

이러한 방법들은 수동 캡차 제출 및 응답 폴링에 사용될 수 있습니다.

import time
. . . . . 

id = solver.send(file='path/to/captcha.jpg')
time.sleep(20)

code = solver.get_result(id)

balance

해당 수단을 사용하여 계정의 잔액을 확인하십시오.

balance = solver.balance()

report

해당 방법을 사용하여 캡차의 답이 정답 또는 잘못된 답인지 보고하십시오.

solver.report(id, True) # captcha solved correctly
solver.report(id, False) # captcha solved incorrectly

오류 처리

요청을 처리할 때 서비스에서 반환된 표준 오류의 가능한 변형

오류가 발생한 경우, 캡차 해결사에서 예외가 발생합니다. 이러한 경우 적절하게 처리하는 것이 중요합니다. 예외를 처리하려면 try/except 를 사용하는 것을 추천드립니다.

Try:
    result = solver.text('If tomorrow is Saturday, what day is today?')
Except ValidationException as e:
    # invalid parameters passed
  print(e)
Except NetworkException as e:
  # network error occurred
  print(e)
Except ApiException as e:
  # api respond with error
  print(e)
Except TimeoutException as e:
  # captcha is not solved so far
  print(e)

프록시

recaptcha, funcaptcha 및 geetest와 같은 수단에 추가적으로 프록시를 전달할 수 있습니다. 프록시는 캡차를 해결하기 위해 API로 전달됩니다.

proxy={
    'type': 'HTTPS',
    'uri': 'login:password@IP_address:PORT'
}

비동기 호출

asyncio를 사용하여 비동기 호출을 할 수도 있습니다. 예를 들면 이와 같습니다:

import asyncio
import concurrent.futures
from twocaptcha import TwoCaptcha

captcha_result = await captchaSolver(image)

async def captchaSolver(image):
    loop = asyncio.get_running_loop()
    with concurrent.future.ThreadPoolExecutor() as pool:
        result = await loop.run_in_executor(pool, lambda: TwoCaptcha(API_KEY).normal(image))
        return result

서비스 API와의 통합할 수 있는 기타 언어