캡쳐
reCAPTCHA원저작자 | |
---|---|
개발자 | 구글 |
초기 릴리즈 | 2007년 5월 27일, | 전(
유형 | 클래식 버전 : CAPTCHA 새 버전:행동 분석 |
웹 사이트 | www |
리캡차(RECAPTCHA)는 웹 호스트가 웹 사이트에 대한 사람과 자동 액세스를 구별할 수 있도록 하는 캡차 시스템입니다.원본 버전은 사용자에게 읽기 어려운 텍스트를 해독하거나 이미지를 일치시키도록 요구했습니다.버전 2는 또한 쿠키 및 캔버스 렌더링 분석 결과 [1]페이지가 자동으로 다운로드되는 것으로 보이는 경우 텍스트 또는 일치하는 이미지를 해독하도록 사용자에게 요청했습니다.버전 3 이후 reCAPTCHA는 사용자를 방해하지 않으며 사용자가 페이지를 로드하거나 [2]버튼을 클릭할 때 자동으로 실행됩니다.reCAPTCHA는 Google 소유입니다.
이 서비스의 최초 반복은 특히 컴퓨터로 스캔할 수 없을 정도로 읽기 어려운 책의 디지털화를 위해 설계된 대규모 협업 플랫폼이었습니다.검증 프롬프트, 하나의 알려진 단어 검증을 위한 컨트롤로 사용되고 두번째 불확실한 단어의 읽기 크라우드 소스에 스캔한 페이지에서 단어의 쌍.[3]리캡차는 원래 루이스 폰 안, 데이비드 아브라함, 마누엘 블룸, 마이클 크로포드, 벤 마우러, 콜린 McMillen, 그리고 에디슨은 탠 카네기 Me에서에 의해 개발되었다.Llon University의 피츠버그 메인 [4]캠퍼스2009년 [5]9월에 구글에 인수되었다.이 시스템은 뉴욕 타임즈의 아카이브를 디지털화하는 것을 도왔으며 구글 북스에 의해 비슷한 목적으로 [6]사용되었습니다.
시스템은 페이스북, TicketMaster, 트위터,4chan, CNN.com, StumbleUpon,[8]게시(2008년 6월 이후로)[9]그리고 미국 중앙 통신과 같은 정보국의 디지털 TV변환기 박스 쿠폰 프로그램 웹 사이트(미국 DTV전환의 일부로)사이트에 1억명이 넘는 캡차마다 day,[7]을 전시한 것으로 알려졌다.[10]
2014년 구글은 사용자 검증에 필요한 사용자 상호작용의 양을 줄이고 행동 분석에서 사용자가 봇일 가능성이 있는 것으로 의심되는 경우에만 인간 인식 과제(특정 프롬프트를 만족시키는 이미지 식별 등)를 제시하는 데 초점을 맞춰 서비스를 원래 개념에서 전환했다.
기원.
Distributed Proofreaders는 OCR(광학식 문자 인식) 프로그램으로 판독할 수 없는 스캔 텍스트를 해독하는 데 시간을 할애한 최초의 프로젝트였다.Project Gutenberg와 연계하여 퍼블릭 도메인 자료를 디지털화하고 reCAPTCHA와는 상당히 다른 방법을 사용합니다.
리캡차 프로그램은 과테말라의 컴퓨터 과학자 루이스 폰 [11]안에 의해 시작되었으며 맥아더 펠로우쉽의 지원을 받았다.초기 CAPTCHA 개발자인 그는 "그는 자신도 모르게 수백만 시간의 가장 귀중한 자원인 인간의 두뇌 [12]순환을 10초 단위로 낭비하는 시스템을 만들었다"고 깨달았습니다.
작동
ReCAPTCHA v1(인간 지원 OCR)
스캔한 텍스트는 두 개의 다른 OCR에 의해 분석됩니다.두 OCR 프로그램에 의해 다르게 해독되거나 영어 사전에 없는 단어는 "수상한 단어"로 표시되며 CAPTCHA로 변환됩니다.의심스러운 단어는 문맥을 벗어나 이미 알려진 제어어와 함께 표시될 수 있습니다.인간이 제어어를 올바르게 입력하면 의문어에 대한 응답이 아마도 유효한 것으로 받아들여진다.사용자가 제어어를 올바르게 입력했지만 OCR이 인식하지 못한 두 번째 단어를 잘못 입력하면 문서의 디지털 버전에 잘못된 단어가 포함될 수 있습니다.각 OCR 프로그램에 의해 수행된 식별에는 0.5점의 값이 부여되며, 사람에 의한 각 해석에는 만점이 부여된다.특정 ID가 2.5점에 도달하면 이 단어는 유효한 것으로 간주됩니다.인간 심판들에 의해 일관되게 하나의 정체성을 부여받은 단어들은 나중에 통제 [14]단어로 재활용된다.첫 번째 세 가지 추측이 서로 일치하지만 어느 OCR에도 일치하지 않으면 정답으로 간주되며 이 단어는 [15]제어어가 됩니다.올바른 철자를 선택하기 전에 6명의 사용자가 단어를 거부하면 해당 단어는 읽을 [15]수 없는 것으로 폐기됩니다.
원래 reCAPTCHA 메서드는 원본 [16]문서에서 5단어 구절 내와 같이 문제가 있는 단어를 사용하지 않고 문맥 외 수정으로 별도로 표시하도록 설계되었습니다.또, 제어 워드는, 악기 「파이프」[citation needed]보다 금속 툴과의 파일링의 논리적인 접속에 의해, 「/metal//fife/」의 요구가 「메탈 파일」로서 입력되는 등, 제2 워드의 콘텍스트를 오인하는 일이 있습니다.
2012년 ReCAPTCHA는 스캔한 단어 외에 [17]구글 스트리트 뷰 프로젝트에서 찍은 사진을 사용하기 시작했습니다.그것은 사용자에게 횡단보도, 가로등, 그리고 다른 물건의 이미지를 식별하도록 요구할 것이다.일부 온라인에서는 이 데이터가 구글의 자가운전 회사인 웨이모에 의해 사용되었는지 추측하고 있다.그러나 이는 [18]사실이 아닌 것으로 확인됐다.
구글은 한 [19]달에 100만 건 이상의 리캡차 쿼리를 하는 모든 웹사이트에서 리캡차 사용을 청구한다.
캡차 리캡차 없음(v2+)
2013년에 reCAPTCHA는 사용자가 사람인지 봇인지를 예측하기 위해 브라우저의 상호작용에 대한 행동 분석을 구현하기 시작했습니다.이듬해 구글은 "no CAPTCHA reCAPTCHA"를 특징으로 하는 새로운 reCAPTCHA API를 도입하기 시작했습니다.이 API에서는 위험성이 낮은 것으로 간주되는 사용자는 자신의 신원을 확인하기 위해 체크박스를 하나만 클릭하면 됩니다.시스템이 사용자의 위험에 대해 불확실한 경우에도 CAPTCHA가 표시될 수 있습니다. 또한 Google은 모바일 사용자가 보다 쉽게 접근할 수 있도록 설계된 새로운 유형의 CAPTCHA 챌린지를 도입했습니다. 여기서 사용자는 [1][20]그리드에서 특정 프롬프트와 일치하는 이미지를 선택해야 합니다.
구글은 2017년 백그라운드에서 검증이 이뤄지는 보이지 않는 새로운 리캡차(ReCAPTCHA)를 선보였으며,[21][22][23] 위험도가 낮다고 판단될 경우 전혀 이의를 제기하지 않는다.구글의 전 "클릭 사기 황제"인 Shuman Ghosemajumder에 따르면, 이 기능은 "매우 진보된 봇들이 여전히 돌아다닐 수 있는 새로운 종류의 도전을 만들어내지만, 합법적인 [23]인간에게는 훨씬 적은 마찰을 일으킨다"고 한다.
reCAPTCHA v1은 2018년 [24]3월 31일에 종료되고 종료되었습니다.
실행
리캡차 테스트는 리캡차 프로젝트의 중앙 사이트에서 표시됩니다.리캡차 프로젝트는 디코딩할 단어를 제공합니다.이는 요청이 전송된 후 서버가 reCAPTCHA에 콜백을 하는 JavaScript API를 통해 수행됩니다.reCAPTCHA 프로젝트는 다양한 프로그래밍 언어 및 애플리케이션을 위한 라이브러리를 제공하여 이 프로세스를 보다 쉽게 만듭니다.리캡차(reCAPTCHA)는 [25]웹 사이트에 무료로 제공되는 서비스이지만 리캡차 소프트웨어는 오픈 [26]소스가 아닙니다.
또한 reCAPTCHA는 ASP를 포함한 여러 웹 애플리케이션 플랫폼용 플러그인을 제공합니다.NET, Ruby, PHP를 사용하여 서비스 [27]구현을 용이하게 합니다.
보안.
CAPTCHA 시스템의 주요 목적은 스팸봇을 차단하면서 인간 사용자를 허용하는 것입니다.2009년 12월 14일, Jonathan Wilkins는 봇이 [29][30][31]18%의 해결률을 달성할 수 있도록 한 reCAPTCHA의 약점을 설명하는 논문을 발표했습니다.
2010년 8월 1일, Chad Houck는 DEF CON 18 해킹 회의에서 이미지에 추가된 왜곡을 되돌리는 방법을 상세하게 설명했습니다.이것에 의해,[32][33] 컴퓨터 프로그램은 유효한 응답을 10 % 판단할 수 있었습니다.ReCAPTCHA 시스템은 Houck이 그의 방법에 대해 말하기 전인 2010년 7월 21일에 수정되었습니다.Houck은 "간단한" CAPTCHA라고 설명한 방법을 수정하여 유효 응답 시간을 31.8%로 결정하였습니다.Houck은 또한 시스템 내 보안 방어에 대해서도 언급했습니다.예를 들어,[34] 32회 연속 무효 응답을 했을 경우, 고도의 시큐러티 록아웃을 실시합니다.
2012년 5월 26일 DC949의 Adam, C-P 및 Jeffball은 Layer One 해커 컨퍼런스에서 99.[35]1%의 정확도로 자동화된 솔루션을 실현하는 방법을 자세히 발표했습니다.그들의 전략은 인공지능의 하위 분야인 기계 학습의 기술을 사용하여 시각 장애인들이 이용할 수 있는 reCAPTCHA의 오디오 버전을 분석하는 것이었다.구글은 리캡차(reCAPTCHA)의 새로운 버전을 발표하기 불과 몇 시간 전에 출시했으며, 이 서비스의 오디오 버전과 비주얼 버전 모두에 큰 변화를 주었다.이번 릴리즈에서는 오디오 버전이 8초에서 30초로 늘어났으며, 인간과 봇 모두 이해하기 어렵습니다.이번 업데이트와 후속 업데이트에 따라 DC949 멤버들은 각각 60.95%와 59.4%의 정확도로 reCAPTCHA를 제친 Stiltwalker 두 버전을 추가로 출시했다.매번 연속 휴식 후 Google은 며칠 안에 reCAPTCHA를 업데이트했습니다.DC949에 따르면 이전에 해킹당한 기능으로 되돌리는 경우가 많았습니다.
2012년 6월 27일 Claudia Cruz, Fernando Uceda 및 Leobardo Reyes는 정확도가 82%[36]인 reCAPTCHA 이미지로 실행되는 시스템을 보여주는 논문을 발표했습니다.저자들은 자신들의 시스템이 최근 리캡차 이미지를 해결할 수 있는지 여부에 대해서는 언급하지 않았지만, 그들의 작업은 지능적인 OCR이며 이미지 데이터베이스의 모든 변경은 아니더라도 일부에 대해서는 견고하다고 주장한다.
2012년 8월 Bsides에서 열린 프레젠테이션에서LV 2012, DC949는 최신 버전을 "인간이 쉽게 해결할 수 없는 것"이라고 불렀으며,[35] 수동으로도 해결할 수 없었습니다.웹 접근성 조직 웹AIM은 2012년 5월에 "응답자[화면 리더 사용자]의 90% 이상이 CAPTCHA가 매우 [37]또는 다소 어렵다고 생각한다"고 보고했다.
비판
reCAPTCHA의 원래 반복은 번역 [38]노력을 지원하기 위한 무급 작업의 원천이라는 비판을 받았다.
구글은 AI [39]연구를 개선하기 위해 무료 노동자로서의 리캡차 사용자로부터 이익을 얻는다.
사생활
현재 시스템의 반복은 쿠키 추적과 구글 서비스 벤더 록인 촉진에 의존한다는 비판을 받고 있습니다.관리자는 웹사이트의 모든 페이지에 reCAPTCHA 추적 코드를 포함시켜 사용자의 행동과 "리스크"를 분석하도록 권장합니다.이 코드는 reCAPTC에서 나타나는 마찰 수준을 결정합니다.HA 프롬프트가 사용됩니다.구글은 개인 정보 보호 정책에 이러한 방식으로 수집된 사용자 데이터는 개인화된 광고에 사용되지 않는다고 명시했습니다.또한 이 시스템은 활성 Google 계정 로그인을 가진 사용자를 선호하며 익명화 프록시 및 [21]VPN 서비스를 사용하는 사용자에게 더 높은 위험을 나타내는 것으로 나타났습니다.
구글이 reCAPTCHA v3.0을 발표했을 때 구글이 비구글 [21]웹사이트에서 사용자를 추적할 수 있기 때문에 사생활에 대한 우려가 제기되었다.
Cloudflare는 2020년 4월 리캡차에서hCaptcha로 전환하면서 구글이 리캡차를 통해 회수하는 데이터를 타겟 광고에[40] 사용하고 Cloudflare 고객 중 상당 부분이 무료이며 운영 비용을 절감할 수 있다는 개인 정보 보호 문제를 언급했습니다.이에 대해 구글은 PC Magazine에 리캡차로부터의 데이터는 개인화된 광고 [19]목적으로 사용되지 않는다고 말했다.
접근성
구글의 헬프센터에서는 청각장애인 [41]커뮤니티에서는 reCAPTCHA가 지원되지 않기 때문에 사실상 서비스를 사용하는 모든 페이지에서 이러한 사용자를 차단할 수 있다고 합니다.단, reCAPTCHA에는 현재 모든 CAPTCHA [42]서비스 중 접근성 고려사항이 가장 긴 목록이 있습니다.
인터페이스
CAPTCHA 챌린지의 변형 중 하나에서는 이미지가 점증적으로 강조 표시되지 않고 클릭하면 페이드아웃되며 새로운 페이드인 이미지로 대체되어 Dick-a-mole과 유사합니다.
이미지가 희미해지고 [43]들어가는 데 오랜 시간이 걸렸다는 비판이 제기돼 왔다.
파생 프로젝트
reCAPTCHA는 또한 스팸 [44]발송자가 웹 페이지의 이메일 주소를 수집하지 못하도록 보호하는 Mailhide 프로젝트를 만들었습니다.기본적으로 전자 메일 주소는 크롤러가 전체 전자 메일 주소를 볼 수 없는 형식으로 변환되었습니다. 예를 들어 "[email protected]"은 "filename..."으로 변환됩니다.@syslog.com"을 클릭합니다.그런 다음 방문자는 "..."을 클릭하고 전체 이메일 주소를 얻기 위해 캡차(CAPTCHA)를 해결합니다.또한 팝업 코드를 편집하여 주소가 표시되지 않도록 할 수도 있습니다.메일히드는 리캡차 v1에 [45]의존해 2018년 단종됐다.
레퍼런스
- ^ a b Shet, Vinay (December 3, 2014). "Are you a robot? Introducing 'CAPTCHA the ReCAPTCHA PREDATORS". Archived from the original on September 3, 2020. Retrieved February 24, 2021.
- ^ "reCAPTCHA v3". Archived from the original on September 25, 2020. Retrieved September 8, 2020.
- ^ Ahn, Luis von, Massive-scale online collaboration, archived from the original on July 15, 2020, retrieved April 14, 2020
- ^ "reCAPTCHA: About Us". Archived from the original on June 11, 2010. Retrieved August 14, 2018.
- ^ "Teaching computers to read: Google acquires reCAPTCHA". Archived from the original on May 19, 2013. Retrieved September 16, 2009.
- ^ "Deciphering Old Texts, One Woozy, Curvy Word at a Time". The New York Times. March 28, 2011. Archived from the original on November 17, 2017. Retrieved November 20, 2017.
- ^ "reCAPTCHA FAQ". Archived from the original on July 5, 2010. Retrieved June 12, 2011.
- ^ Rubens, Paul (October 2, 2007). "Spam weapon helps preserve books". BBC. Archived from the original on May 18, 2013. Retrieved October 3, 2007.
- ^ "Fight Spam, Digitize Books". Craigslist Blog. June 2008. Archived from the original on July 6, 2010. Retrieved June 17, 2008.
- ^ "TV Converter Box Program". dtv2009.gov. Archived from the original on November 4, 2009.
- ^ ""Full Interview: Luis von Ahn on Duolingo", Spark, November 2011". Canadian Broadcasting Corporation. November 30, 2011. Archived from the original on June 3, 2012. Retrieved July 10, 2013.
- ^ Hutchinson, Alex (March 12, 2009). "Human Resources: The job you didn't even know you had". The Walrus. Archived from the original on December 3, 2015. Retrieved December 7, 2015.
- ^ "reCAPTCHA: Using Captchas To Digitize Books". TechCrunch. September 16, 2007.
- ^ Timmer, John (August 14, 2008). "CAPTCHAs work? for digitizing old, damaged texts, manuscripts". Ars Technica. Archived from the original on January 24, 2009. Retrieved December 9, 2008.
- ^ a b Luis; Maurer, Ben; McMillen, Colin; Abraham, David; Blum, Manuel (2008). "reCAPTCHA: Human-Based Character Recognition via Web Security Measures"". Science. 321 (5895): 1465–1468. Bibcode:2008Sci...321.1465V. CiteSeerX 10.1.1.141.6563. doi:10.1126/science.1160379. PMID 18703711. S2CID 18371056.
- ^ ""questionable validity of results if words are presented out of context", Google Groups, August 29, 2008". Archived from the original on April 30, 2011. Retrieved July 10, 2013.
- ^ Perez, Sarah (March 29, 2012). "Google Now Using ReCAPTCHA To Decode Street View Addresses". TechCrunch. Archived from the original on August 23, 2012. Retrieved July 10, 2013.
- ^ Vega, Edward (May 14, 2021). "Why captchas are getting harder". Vox. Retrieved April 15, 2022.
- ^ a b "Cloudflare Dumps Google's ReCAPTCHA Over Privacy Concerns, Costs". PCMAG. Archived from the original on July 19, 2020. Retrieved July 18, 2020.
- ^ Greenberg, Andy (December 3, 2014). "Google Can Now Tell You're Not a Robot with Just One Click". Wired. Archived from the original on October 2, 2015. Retrieved October 1, 2015.
- ^ a b c Schwab, Katharine (June 27, 2019). "Google's new reCAPTCHA has a dark side". Fast Company. Archived from the original on June 28, 2019. Retrieved April 8, 2020.
- ^ Amadeo, Ron (March 9, 2017). "Google's reCAPTCHA turns "invisible," will separate bots from people without challenges". Ars Technica. Archived from the original on August 6, 2020. Retrieved April 14, 2020.
- ^ a b "Google just made the internet a tiny bit less annoying". Popular Science. March 10, 2017. Archived from the original on February 5, 2021. Retrieved April 5, 2017.
- ^ "Google reCAPTCHA v1 API Shutting Down in March 2018". ProgrammableWeb. Archived from the original on June 20, 2020. Retrieved April 14, 2020.
- ^ "FAQ". reCAPTCHA.net. Archived from the original on July 16, 2012.
- ^ "reCAPTCHA: Stop Spam, Read Books". Archived from the original on June 19, 2020. Retrieved January 14, 2014.
- ^ "Developer's Guide – reCAPTCHA — Google Developers". Archived from the original on November 24, 2017. Retrieved January 14, 2014.
- ^ Greenberg, Andy (June 18, 2010). "Those Scrambled Word Tests For Stopping Spambots Are Tough For Humans Too". Forbes. Archived from the original on September 9, 2017. Retrieved September 10, 2017.
- ^ "Strong CAPTCHA Guidelines" (PDF). Archived (PDF) from the original on July 23, 2011. Retrieved January 31, 2011.
- ^ "Google's reCAPTCHA busted by new attack". The Register. Archived from the original on August 10, 2017. Retrieved August 10, 2017.
- ^ "Google's reCAPTCHA dented". Archived from the original on March 10, 2010. Retrieved January 31, 2011.
- ^ "Def Con 18 Speakers". defcon.org. Archived from the original on October 20, 2010. Retrieved November 17, 2010.
- ^ "Decoding reCAPTCHA Paper". Chad Houck. Archived from the original on August 19, 2010.
- ^ "Decoding reCAPTCHA Power Point". Chad Houck. Archived from the original on October 24, 2010.
- ^ a b "Project Stiltwalker". Archived from the original on July 2, 2012. Retrieved May 28, 2012.
- ^ Claudia Cruz-Perez; Oleg Starostenko; Fernando Uceda-Ponga; Vicente Alarcon-Aquino; Leobardo Reyes-Cabrera (June 30, 2012). "Breaking reCAPTCHAs with Unpredictable Collapse: Heuristic Character Segmentation and Recognition". In Carrasco-Ochoa, Jesús Ariel; Martínez-Trinidad, José Francisco; Olvera López, José Arturo; Boyer, Kim L (eds.). Pattern Recognition. Lecture Notes in Computer Science. Vol. 7329. México. pp. 155–165. doi:10.1007/978-3-642-31149-9_16. ISBN 978-3-642-31148-2. S2CID 29097170.
- ^ "Screen Reader User Survey #4 Results". Archived from the original on December 10, 2017. Retrieved April 19, 2013.
- ^ Harris, David L. (January 23, 2015). "Massachusetts woman's lawsuit accuses Google of using free labor to transcribe books, newspapers". Boston Business Journal. Archived from the original on April 28, 2015. Retrieved September 4, 2015.
- ^ "No CAPTCHA: yet another ruse devised by Google to extract free digital labor from you". Archived from the original on November 12, 2020. Retrieved December 3, 2020.
- ^ "Moving from reCAPTCHA to hCaptcha". The Cloudflare Blog. April 8, 2020. Archived from the original on August 12, 2020. Retrieved July 18, 2020.
- ^ "Archived copy". Archived from the original on August 6, 2020. Retrieved May 11, 2020.
{{cite web}}
: CS1 maint: 제목으로 아카이브된 복사(링크) - ^ "Archived copy". Archived from the original on November 26, 2020. Retrieved December 10, 2020.
{{cite web}}
: CS1 maint: 제목으로 아카이브된 복사(링크) - ^ "ReCaptcha extremly [sic] slow fading · Issue #268 · google/recaptcha". GitHub. Archived from the original on October 14, 2020. Retrieved October 14, 2020.
- ^ "Mailhide: Free Spam Protection". Archived from the original on January 2, 2012. Retrieved May 15, 2011.
- ^ "Mailhide: Service discontinued". Archived from the original on November 7, 2012. Retrieved March 3, 2019.
추가 정보
- Dzieza, Josh (February 1, 2019). "Why CAPTCHAs have gotten so difficult". The Verge.
- Schwab, Katharine (June 27, 2019). "Google's new reCAPTCHA has a dark side". Fast Company.
외부 링크