검색 엔진

Search engine
기반 이미지 검색 엔진에서 "달 일식"이라는 용어를 검색한 결과

검색 엔진은 웹 검색을 수행하도록 설계된 소프트웨어 시스템입니다.이들은 텍스트 웹 검색 쿼리에서 지정된 특정 정보를 체계적으로 월드 와이드 웹을 검색합니다.검색 결과는 일반적으로 검색 엔진 결과 페이지(SERP)라고 하는 일련의 결과에 표시됩니다. 정보에는 웹 페이지, 이미지, 비디오, 인포그래픽, 기사, 연구 논문 및 기타 유형의 파일에 대한 링크가 혼합되어 있을 수 있습니다.또한 일부 검색 엔진은 데이터베이스 또는 열린 디렉토리에서 사용할 수 있는 데이터를 마이닝합니다.검색 엔진은 사람 편집자만 관리하는 웹 디렉토리와 달리 웹 크롤러에서 알고리즘을 실행하여 실시간 정보를 유지합니다.웹 검색 엔진에서 인덱싱 및 검색할 수 없는 인터넷 기반 콘텐츠는 딥 웹 범주에 속합니다.

역사

타임라인(전체 목록)
연도 엔진 현황
1993 W3 카탈로그 활동적인
알리웹 활동적인
점프 스테이션 활발하지 않은
WWW 웜 활발하지 않은
1994 웹크롤러 활동적인
Go.com 비활성, 디즈니로 리디렉션
라이코스 활동적인
인포섹 비활성, 디즈니로 리디렉션
1995 야후! 검색 액티브, 처음에는 Yahoo! 검색 기능 디렉토리
다음. 활동적인
마젤란 활발하지 않은
흥분시키다 활동적인
사포 활동적인
메타크롤러 활동적인
알타비스타 2003년에 Yahoo!에 인수된 Inactive는 2013년부터 Yahoo!로 리다이렉트 됩니다.
1996 랭크덱스 비액티브, 2000년에 Baidu에 편입
도그파일 활동적인
핫봇 Inactive(Inktomi 검색 테크놀로지 사용)
Jeeves에게 묻다 액티브(브랜드 변경 ask.com)
1997 AOL NetFind 액티브(1999년 이후 AOL 검색 브랜드 변경)
북극광 활발하지 않은
얀덱스 활동적인
1998 구글 활동적인
Ixquick Startpage.com 로서 액티브
MSN 검색 Bing으로서 액티브
엠파스 비활성(NATE와 병합)
1999 모든 웹 비활성(URL이 Yahoo!로 리다이렉트됨)
지니카운츠 비활성, 브랜드 변경 Yellowee(justlocalbusiness.com로 리다이렉트)
네이버 활동적인
테오마 비활성(Ask.com에 추가)
2000 바이두 활동적인
엑설리드 활발하지 않은
기가블라스트 활동적인
2001 카투 활발하지 않은
2003 Info.com 활동적인
2004 A9.com 활발하지 않은
클러스터 비활성(DuckDuckGo로 리디렉션)
모지크 활동적인
소구 활동적인
2005 난 몰라요. 활발하지 않은
키즈 서치 활성, 구글 검색
2006 그저 그래요. 비활성, Sogou와 병합됨
쿠에로 활발하지 않은
Search.com 활동적인
차차 활발하지 않은
Ask.com 활동적인
라이브 검색 Bing으로 활성화, MSN 검색 브랜드 변경
2007 위키 활발하지 않은
스푸스 활발하지 않은
Wikia 검색 활발하지 않은
Blackle.com 활성, 구글 검색
2008 파워셋 비액티브(Bing으로 리다이렉트)
피콜라토 활발하지 않은
뷰지 활발하지 않은
부가미 활발하지 않은
LeapFish 활발하지 않은
포레스트레 비액티브(에코시아로 리다이렉트)
덕덕고 활동적인
2009 활성, 브랜드 변경 라이브 검색
예볼 활발하지 않은
스카우트(고비) 활동적인
네이트 활동적인
에코시아 활동적인
Startpage.com Ixquick의 액티브 자매 엔진
2010 블레코 비액티브, IBM에 판매
쿠일 활발하지 않은
얀덱스(영어) 활동적인
빠르지주 활동적인
2011 야시 액티브, P2P
2012 볼루니아 활발하지 않은
2013 Qwant 활동적인
2014 에제린 액티브, 쿠르드어 / Sorani
스위스카우 활동적인
색스 활동적인
2015 유즈 활발하지 않은
클리츠 활발하지 않은
2016 키들 활성, 구글 검색
2020 꽃잎 활동적인
2021 용감한 검색(베타) 활동적인

1990년대 이전

발표된 정보를 찾을 수 있는 시스템 과학적인 늘어나는 집중 지수 정보 위치의 끊임없이 증가하고 있는 어려움을 극복하기 위한 1945년입니다 베너바 부시가 대서양에 있는 기사는 월"우리가 생각하는 대로"[1]에서 연결을 연구 중 도서관을 상상했던 것처럼 제목을 썼다로 소개되었다.것은 아니다.현대의 [2]하이퍼링크와 다르지 않습니다.링크 분석은 결국 하이퍼 검색 및 페이지 [3][4]랭크와 같은 알고리즘을 통해 검색 엔진의 중요한 구성요소가 될 것입니다.

1990년대 검색엔진의 탄생

WHOIS 사용자 검색은 1982년으로 거슬러 올라가며 [6]Knowbot Information Service 다중 네트워크 사용자 검색은 1989년에 [5]처음 구현되었습니다.콘텐츠 파일, 즉 FTP 파일을 검색한 최초의 문서화된 검색 엔진은 Archie로 1990년 [7]9월 10일에 첫 선을 보였습니다.

1993년 9월 이전에, 월드 와이드 은 전적으로 수작업으로 색인화되었습니다.Tim Berners-Lee가 편집하고 CERN 서버에서 호스팅하는 웹 서버 목록이 있었습니다.1992년의 리스트의 스냅샷이 [8]1개 남았지만, 온라인에 접속하는 Web 서버가 증가하고 있기 때문에, 중앙 리스트는 더 이상 대응할 수 없게 되었습니다.NCSA 사이트에서는, 「What's New!」[9]라는 제목으로 새로운 서버가 발표되었습니다.

사용자가 아닌 인터넷에서 콘텐츠를 검색하는 데 사용된 첫 번째 도구는 Archie였습니다.[10]이름은 "v"[11]가 없는 "archive"를 나타냅니다.이것은 캐나다 퀘벡 주 몬트리올에 있는 맥길 대학컴퓨터 공학과 학생Alan Emage에 [11][12][13][14]의해 만들어졌습니다.프로그램은 공개 익명 FTP(File Transfer Protocol) 사이트에 있는 모든 파일의 디렉토리 목록을 다운로드하여 파일 이름의 검색 가능한 데이터베이스를 만들었습니다. 그러나 Archie Search Engine은 데이터의 양이 너무 제한적이어서 수동으로 쉽게 검색할 수 있기 때문에 이러한 사이트의 내용을 인덱싱하지 않았습니다.

1991년 미네소타 대학의 Mark McCahill에 의해 만들어진 Gopher의 부상은 개의 새로운 검색 프로그램인 Veronica와 Jughead로 이어졌다.Archie처럼 Gopher 인덱스 시스템에 저장된 파일 이름과 제목을 검색했습니다.Veronica(Very Easy Installist-Oriented Net-wide Index to Computerized Archives)는 전체 Gopher 목록에 있는 대부분의 Gopher 메뉴 제목을 키워드 검색했습니다.Jughead(Johnzy의 Universal Gopher Hierarchy Excluvation And Display)는 특정 Gopher 서버에서 메뉴 정보를 얻기 위한 도구입니다.검색엔진 '아치 서치 엔진'의 이름이 아치 만화책 시리즈를 지칭한 것은 아니지만, '베로니카'와 '저그헤드'는 이 시리즈의 등장인물들이어서 전작들을 지칭한다.

1993년 여름, 수많은 전문 카탈로그가 수작업으로 관리되었지만, 웹을 위한 검색 엔진은 존재하지 않았다.제네바 대학의 Oscar Nierstrasz는 이 페이지들을 주기적으로 반영하여 표준 형식으로 다시 쓰는 일련의 Perl 스크립트를 작성했습니다.이것은 1993년 [15]9월 2일에 출시된 웹의 첫 번째 원시 검색 엔진인 W3Catalog의 기초를 형성했다.

1993년 6월 당시 MIT에서 근무하던 매튜 그레이는 최초의 웹 로봇인 펄 기반의 월드 와이드방랑자를 제작하여 "완덱스"라는 인덱스를 생성하기 위해 사용했습니다.방랑자의 목적은 1995년 말까지 월드 와이드 웹의 크기를 측정하는 것이었다.웹의 두 번째 검색 엔진 알리웹은 1993년 11월에 등장했다.알리웹은 웹로봇을 사용하지 않고 웹 사이트 관리자로부터 특정 형식의 인덱스 파일의 각 사이트에 존재 여부를 통보받는 것에 의존했다.

JumpStation(1993년 12월[16] Jonathon Fletcher에 의해 개발됨)은 로봇을 사용하여 웹 페이지를 찾고 색인을 작성했으며 웹 을 쿼리 프로그램의 인터페이스로 사용했습니다.따라서 이 툴은 다음과 같은 웹 검색 엔진의 세 가지 필수 기능(크롤링, 인덱싱, 검색)을 결합한 최초의 WWW 리소스 디스커버리 툴이었습니다.실행 플랫폼에서 사용할 수 있는 리소스가 제한되어 있기 때문에 인덱싱 및 검색은 크롤러가 발견한 웹 페이지의 제목과 제목으로 제한되었습니다.

최초의 "모든 텍스트" 기반 검색 엔진 중 하나는 1994년에 나온 웹크롤러였다.전작과 달리 웹페이지에서 어떤 단어라도 검색할 수 있게 해 그 이후 모든 주요 검색엔진의 표준이 되었다.그것은 또한 대중에게 널리 알려진 검색 엔진이었다.또한 1994년에 Lycos(카네기 멜론 대학에서 시작)가 출범하여 주요 상업적 노력이 되었습니다.

웹에서 가장 먼저 인기 있는 검색 엔진은 야후였다. 검색.[17]1994년 1월 Jerry Yang과 David Filo에 의해 설립된 Yahoo!의 첫 번째 제품은 Yahoo!라고 불리는 웹 디렉토리였다. 디렉토리1995년에는 검색 기능이 추가되어 야후를 검색할 수 있게 되었습니다.디렉토리[18][19]이것은 사람들이 관심 있는 웹 페이지를 찾는 가장 인기 있는 방법 중 하나가 되었지만, 그것의 검색 기능은 웹 페이지의 전체 텍스트 복사본이 아닌 웹 디렉토리에서 작동했다.

얼마 지나지 않아, 많은 검색 엔진이 등장하여 인기를 얻기 위해 경쟁했다.여기에는 마젤란, 익사이트, 인포섹, 잉크토미, 북극광, 알타비스타가 포함되어 있다.정보 검색자는 키워드 기반 검색을 수행하는 대신 디렉토리를 탐색할 수도 있습니다.

1996년 Robin Li는 검색 엔진 결과 페이지[20][21][22] 랭킹을 위한 RankDex 사이트 스코어링 알고리즘을 개발하여 이 [23]기술에 대한 미국 특허를 취득했습니다.그것은 [24]2년 후인 [25]1998년에 구글이 제기한 매우 유사한 알고리즘 특허보다 앞서 색인화된 웹사이트의 품질을 측정하기 위해 하이퍼링크를 사용한 최초의 검색 엔진이었다.Larry Page는 PageRank에 [26]대한 미국 특허 중 일부에서 Li의 작업을 언급했다.Li는 이후 중국에서 Robin Li에 의해 설립되어 2000년에 출시된 Baidu 검색 엔진에 Rankdex 기술을 사용했다.

1996년에 Netscape는 단일 검색 엔진을 Netscape의 웹 브라우저에 특화된 검색 엔진으로 독점 계약하는 것을 고려하고 있었다.Netscape는 대신에 5개의 주요 검색 엔진과 거래를 맺을 정도로 많은 관심이 있었다. 즉, 연간 5백만 달러에 각 검색 엔진은 Netscape 검색 엔진 페이지에서 교대로 진행될 것이다.5개의 엔진은 야후, 마젤란, 라이코스, 인포섹, [27][28]익사이트였다.

구글은 1998년 goto.com이라는 이름의 작은 검색 엔진 회사로부터 검색어를 판매하는 아이디어를 채택했다.이러한 움직임은 검색 엔진 사업에 큰 영향을 끼쳤는데,[29] 검색 엔진은 인터넷에서 가장 수익성이 높은 사업 중 하나로 성장했다.

검색 엔진은 또한 1990년대 [30]후반에 발생한 인터넷 투자 광풍에서 가장 빛나는 스타로 알려져 있다.몇몇 기업들이 시장에 화려하게 진출하여 기업공개 때 기록적인 이익을 얻었습니다.일부는 공개 검색 엔진을 없애고 Northern Light와 같은 엔터프라이즈 전용 에디션을 마케팅하고 있습니다.많은 검색엔진 회사들이 2000년 3월에 정점을 찍은 투기로 인한 시장 붐인 닷컴 버블에 휘말렸다.

2000년대~현재: 포스트 닷컴 버블

2000년경 구글의 검색엔진[31]두각을 나타냈다.구글 창업자인 [4]세르게이 브린과 래리 페이지가 쓴 논문 '검색 엔진의 해부학'에서 설명되었듯이, 이 회사는 페이지랭크라고 불리는 알고리즘으로 많은 검색에서 더 나은 결과를 얻었다.반복 알고리즘은 양호한 페이지 또는 바람직한 페이지가 다른 웹 사이트보다 더 많이 링크된다는 전제 하에 다른 웹 사이트 및 링크 페이지의 수와 페이지 랭크를 기준으로 웹 페이지를 순위를 매깁니다.Larry Page의 PageRank 특허는 Robin Li의 초기 RankDex 특허를 [26][22]영향력으로 인용한다.구글은 또한 검색 엔진에 대한 미니멀리즘 인터페이스를 유지했다.이와는 대조적으로, 많은 경쟁사들은 웹 포털에 검색 엔진을 내장했다.사실 구글 검색엔진은 미스테리 시커와 같은 스푸핑엔진이 등장할 정도로 인기를 끌었다.

2000년까지 야후는 잉크토미의 검색 엔진을 기반으로 검색 서비스를 제공하고 있었다.Yahoo!는 2002년에 Inktomi를, 2003년에 Overture(AlltheWeb과 AltaVista를 소유)를 인수했다.야후는 2004년까지 구글의 검색엔진으로 전환했고, 그 후 합병된 기술을 기반으로 자체 검색엔진을 출시했다.

마이크로소프트는 1998년 가을에 잉크토미의 검색 결과를 사용하여 MSN 검색을 처음 시작했습니다.1999년 초, 이 사이트는 룩스마트의 목록을 잉크토미의 결과와 혼합하여 표시하기 시작했다.1999년 잠시 동안 MSN 검색은 AltaVista의 결과를 대신 사용했다.2004년, 마이크로소프트자체크롤러(msnbot)에 의해 구동되는 자체 검색 기술로 전환하기 시작했다.

마이크로소프트의 리브랜드 검색 엔진인 빙은 2009년 6월 1일에 출시되었습니다.2009년 7월 29일, Yahoo!와 Microsoft는 Yahoo!와의 계약을 맺었다. 검색은 Microsoft Bing 테크놀로지에 의해 강화됩니다.

2019년 현재 액티브 검색엔진 크롤러는 구글, 페탈, 소구, 바이두, , 기가블라스트, 모하익, 덕덕고, 얀덱스 이다.

접근

검색 엔진은 다음 프로세스를 거의 실시간으로 유지합니다.

  1. 웹 크롤링
  2. 색인화
  3. 검색 중[32]

웹 검색 엔진은 사이트 에 웹 크롤링을 통해 정보를 얻습니다."스파이더"는 표준 파일 이름 로봇을 확인합니다.txt, 수신처.로봇들.txt 파일에는 검색 스파이더에 대한 지침이 포함되어 있으며, 어떤 페이지를 기어다니고 어떤 페이지를 기어다니지 않도록 지시합니다.로봇을 확인한 후.txt를 찾든 찾지 않든 스파이더는 제목, 페이지 내용, 자바스크립트, 캐스케이드 스타일시트(CSS), 제목 또는 HTML 메타태그 내의 메타데이터와 같은 많은 요소에 따라 특정 정보를 다시 보냅니다.일정 페이지 수, 색인된 데이터 양 또는 웹사이트에서 보낸 시간이 지나면 거미는 기는 것을 멈추고 넘어간다."[N]o 웹 크롤러는 실제로 도달 가능한 웹 전체를 크롤링할 수 있습니다.무한 웹 사이트, 스파이더 트랩, 스팸 및 실제 웹의 기타 긴급 상황으로 인해 크롤러는 대신 크롤 정책을 적용하여 사이트의 크롤링으로 충분하다고 판단해야 할 시기를 결정합니다.일부 웹 사이트는 완전히 탐색되고 다른 웹 사이트는 일부만 탐색됩니다.[33]

색인화란 웹 페이지에 있는 단어 및 기타 정의 가능한 토큰을 해당 도메인 이름 및 HTML 기반 필드와 연관짓는 것을 의미합니다.연결은 웹 검색 쿼리에 사용할 수 있는 공용 데이터베이스에서 만들어집니다.사용자로부터의 쿼리는 단일 단어, 여러 단어 또는 문장이 될 수 있습니다.인덱스를 사용하면 쿼리와 관련된 정보를 [32]최대한 빨리 찾을 수 있습니다.인덱싱 캐싱 기술의 일부는 영업 비밀이지만 웹 크롤링은 모든 사이트를 체계적으로 방문하는 간단한 프로세스입니다.

스파이더에 의한 방문 사이에, 검색 엔진 작업 메모리에 격납되어 있는 페이지의 캐시 버전(그 페이지 렌더링에 필요한 컨텐츠의 일부 또는 전부)은, 문의자에게 신속히 송신된다.방문 기한이 지난 경우 검색 엔진은 대신프록시 역할을 수행할 수 있습니다.이 경우 페이지는 [32]색인화된 검색어와 다를 수 있습니다.캐시된 페이지에는 이전에 인덱싱된 워드의 버전이 표시되므로 캐시된 페이지의 버전은 실제 페이지가 손실되었을 때 웹 사이트에 유용할 수 있지만 이 문제는 linkrot의 가벼운 형태로도 간주됩니다.

표준 웹 크롤러의 고급 아키텍처

일반적으로 사용자가 검색 엔진에 쿼리를 입력할 때 몇 가지 [34]키워드입니다.인덱스는 키워드를 포함하는 사이트 이름을 이미 가지고 있으며 이러한 사이트 이름은 인덱스에서 즉시 가져옵니다.실제 처리 로드는 검색 결과 목록인 웹 페이지를 생성하는 것입니다.전체 목록의 모든 페이지는 [32]인덱스의 정보에 따라 가중치를 부여해야 합니다.그리고 상위 검색 결과 항목에는 일치하는 키워드의 컨텍스트를 나타내는 스니펫의 조회, 재구성 및 마크업이 필요합니다.이것은 각 검색 결과 웹 페이지에 필요한 처리의 일부일 뿐이며, 이후 페이지(상단 옆)에는 이러한 후처리가 더 필요합니다.

검색 엔진은 단순한 키워드 검색 외에도 자체 GUI 또는 명령어 기반 연산자와 검색 매개 변수를 제공하여 검색 결과를 세분화합니다.이들은 사용자가 필터링 가중치를 부여하여 작성하는 피드백 루프에 관여하는 사용자에게 필요한 제어 기능을 제공하며, 첫 번째 검색 결과의 첫 페이지에 따라 검색 결과를 세분화합니다.예를 들어 2007년부터 Google.com 검색 엔진에서는 초기 검색 결과 페이지의 맨 왼쪽 열에 있는 "검색 도구 표시"를 클릭한 후 원하는 날짜 [35]범위를 선택하여 날짜별로 필터링할 수 있게 되었습니다.페이지마다 수정 시간이 있기 때문에 날짜별로 가중치를 매길 도 있습니다.대부분의 검색 엔진은 부울 연산자 AND, OR 및 NOT 사용을 지원하여 최종 사용자가 검색 쿼리를 세분화할 수 있도록 지원합니다.부울 연산자는 사용자가 검색 용어를 세분화하고 확장할 수 있는 리터럴 검색용입니다.엔진은 입력된 단어 또는 구문을 정확히 찾습니다.일부 검색 엔진은 사용자가 [32]키워드 간의 거리를 정의할 수 있는 근접 검색이라는 고급 기능을 제공합니다.또, 개념 베이스의 검색도 있습니다.이 검색에서는, 검색한 단어 또는 구를 포함한 페이지의 통계 분석을 사용합니다.

검색 엔진의 유용성은 반환되는 결과 세트의 관련성에 따라 달라집니다.특정 단어 또는 구문을 포함하는 수백만 개의 웹 페이지가 있을 수 있지만, 일부 페이지는 다른 페이지보다 관련성이 높고, 인기가 높거나, 신뢰할 수 있습니다.대부분의 검색 엔진은 "최고의" 결과를 먼저 제공하기 위해 결과에 순위를 매기는 방법을 사용합니다.검색 엔진이 가장 적합한 페이지와 결과를 표시하는 순서를 결정하는 방법은 엔진에 [32]따라 크게 다릅니다.또한 인터넷 사용의 변화와 새로운 기술이 발전함에 따라 방법은 시간이 지남에 따라 변화합니다.진화된 검색 엔진에는 두 가지 주요 유형이 있습니다. 하나는 인간이 광범위하게 프로그래밍한 사전 정의되고 계층적으로 정렬된 키워드 시스템입니다.또 다른 하나는 검색된 텍스트를 분석하여 "반전 인덱스"를 생성하는 시스템입니다.이 첫 번째 양식은 대부분의 작업을 컴퓨터 자체에 훨씬 더 많이 의존합니다.

대부분의 웹 검색 엔진은 광고 수익으로 뒷받침되는 상업적인 벤처이기 때문에 광고주들은 유료 검색 결과에서 더 높은 순위를 매길있다.검색 결과에 대한 돈을 받지 않는 검색 엔진은 일반 검색 엔진 결과와 함께 검색 관련 광고를 내보냄으로써 돈을 번다.검색 엔진은 누군가가 이 [36]광고들 중 하나를 클릭할 때마다 돈을 번다.

로컬 검색

로컬 검색은 로컬 비즈니스의 노력을 최적화하는 프로세스입니다.이들은 모든 검색이 일관되도록 변경에 초점을 맞춥니다.많은 사람들이 검색 [37]결과에 따라 어디로 갈지, 무엇을 살지를 결정하기 때문에 이것은 중요하다.

시장 점유율

2022년 1월 현재 구글은 92.01%의 시장점유율로 세계에서 가장 많이 사용되는 검색엔진이며, 그 밖에 빙, 야후, 바이두, 얀덱스, 덕덕고 [38]등이 세계에서 가장 많이 사용되는 검색엔진이다.

러시아와 동아시아

러시아에서는 Yandex의 시장점유율이 61.9%로 구글의 28.3%[39]에 비해 높다.중국에서 바이두는 가장 인기 있는 검색엔진이다.[40]국내 자체 검색 포털인 네이버는 [41]국내 온라인 검색의 70%를 차지하고 있다.야후! 재팬과 야후! 대만은 일본과 대만에서 각각 [42]가장 인기 있는 인터넷 검색 수단이다.중국은 구글이 시장점유율 상위 3위 안에 들지 못하는 몇 안 되는 나라 중 하나이다.구글은 이전에 중국 최고의 검색 엔진이었지만 검열과 사이버 [43]공격에 대한 정부와의 의견 충돌로 철수했다.

유럽

세즈남이 강력한 [44]경쟁 상대인 체코를 제외하고 유럽연합(EU) 내 대부분의 국가 시장은 구글이 장악하고 있다.

검색 엔진 Qwant는 프랑스 파리기반을 두고 있으며, 이 곳에서 5천만 명의 월간 등록 사용자 대부분을 끌어모으고 있다.

검색 엔진 바이어스

검색엔진은 인기와 관련성의 어느 정도 조합에 근거해 Web 사이트의 순위를 매기도록 프로그램 되어 있지만, 실증적 연구에 의하면, Web 사이트가 제공하는[45][46] 정보와 [47]테크놀로지에 관한 기본적인 가정에 있어서의 다양한 정치적, 경제적, 사회적 편견을 나타내고 있습니다.이러한 편견은 경제 및 상업 프로세스(예: 검색 엔진을 사용하여 광고하는 기업은 유기농 검색 결과에서도 더 인기를 끌 수 있음) 및 정치적 프로세스(예: 현지 [48]법률을 준수하기 위한 검색 결과 제거)의 직접적인 결과일 수 있습니다.예를 들어, 구글은 홀로코스트 부정이 불법인 프랑스와 독일에서 특정 신나치주의 웹사이트를 공개하지 않을 것이다.

검색 엔진 알고리즘이 더 "인기 있는"[49] 결과를 위해 비정규적인 관점을 배제하도록 자주 설계되기 때문에 편견은 또한 사회적 과정의 결과일 수 있다.주요 검색엔진의 색인화 알고리즘은 미국 이외의 [46]나라 웹사이트가 아닌 미국 사이트를 대상으로 하는 쪽으로 기울어진다.

구글 폭격은 정치적, 사회적 또는 상업적 이유로 검색 결과를 조작하려는 시도의 한 예이다.

몇몇 학자들은 [50]검색엔진에 의해 촉발된 문화적 변화와 [51]아일랜드에서의 테러, 기후변화 부정,[52][53] 음모론같은 논쟁적인 주제들의 표현에 대해 연구해왔다.

맞춤 결과 및 필터 버블

Google이나 Bing과 같은 많은 검색 엔진은 사용자의 활동 이력에 따라 맞춤화된 결과를 제공합니다.이것은 필터 버블이라고 불리는 효과로 이어집니다.이 용어는 웹 사이트가 알고리즘을 사용하여 사용자에 대한 정보(위치, 과거 클릭 동작, 검색 기록 등)를 바탕으로 사용자가 보고 싶은 정보를 선택적으로 추측하는 현상을 나타냅니다.그 결과 웹사이트는 사용자의 과거 관점과 일치하는 정보만 보여주는 경향이 있다.이로 인해 사용자는 반대되는 정보 없이 지적 고립 상태에 놓입니다.대표적인 예는 구글의 개인화된 검색결과와 페이스북의 개인화된 뉴스 스트림이다.이 용어를 만든 Eli Pariser에 따르면 사용자는 상반된 관점에 덜 노출되고 정보 거품 속에서 지적으로 고립된다.패리저는 한 사용자가 구글에서 BP를 검색해 브리티시 페트롤리엄에 대한 투자 소식을 얻은 반면 다른 검색자는 딥워터 호라이즌 기름 유출에 대한 정보를 얻었으며 두 검색 결과 페이지가 "매우 다르다"[54][55][56]는 예를 들었다.패리셔에 [57]따르면 거품 효과는 시민 담론에 부정적인 영향을 미칠 수 있다.이 문제가 확인된 이후, DuckDuckGo와 같이 사용자를 추적하거나 "버블링"하지 않음으로써 이 문제를 회피하려는 경쟁 검색 엔진이 등장했습니다.다른 학자들은 그의 논문을 뒷받침하는 증거가 [58]설득력이 없다고 생각하여 그의 견해를 공유하지 않는다.

종교 검색 엔진

지난 10년 동안 아랍이슬람 세계에서 인터넷과 전자 매체의 세계적인 성장은 중동아시아 아대륙이슬람 추종자들이 안전한 검색을 할 수 있게 해주는 자체 검색 엔진인 필터링된 검색 포털을 시도하도록 장려했다.일반적인 안전 검색 필터보다, 이러한 이슬람 웹 포털은 "이슬람의 법"의 해석에 따라 웹사이트를 "할랄" 또는 "하람"으로 분류합니다.ImHalal은 2011년 9월에 온라인이 되었습니다.Halalgogling은 2013년 7월에 온라인에 도입되었습니다.이들은 Google Bing(및 기타)[59] 컬렉션haram 필터를 사용합니다.

이슬람 세계에서의 투자 부족과 느린 기술 속도가 이슬람 신봉자들을 주요 소비자로 하는 이슬람 검색 엔진의 성공을 방해하고 있지만 이슬람 라이프스타일 사이트인 Muxlim과 같은 프로젝트는 Rite Internet Ventures와 같은 투자자들로부터 수백만 달러를 받았고 또한 주춤했다.다른 종교 중심의 검색 엔진으로는 유대인 버전의 [60]구글인 주이글과 기독교인 SeekFind.org이 있다.Seek Find는 신앙을 [61]공격하거나 저하시키는 사이트를 필터링합니다.

검색 엔진 제출

웹 검색 엔진 제출은 웹 마스터가 직접 웹 사이트를 검색 엔진에 제출하는 과정입니다.검색 엔진 제출은 때때로 웹사이트를 홍보하는 방법으로 제시되지만, 주요 검색 엔진들은 결국 도움 없이 인터넷에서 대부분의 웹사이트를 찾을 수 있는 웹 크롤러를 사용하기 때문에 일반적으로 필요하지 않다.한 번에 하나의 웹 페이지를 제출하거나 사이트 맵을 사용하여 전체 사이트를 제출할 수 있지만 일반적으로 검색 엔진은 잘 설계된 웹 사이트를 탐색할 수 있기 때문에 웹 사이트의 홈페이지만 제출하면 됩니다.웹 사이트나 웹 페이지를 검색 엔진에 제출하는 데에는 두 가지 이유가 있습니다. 검색 엔진이 검색하기를 기다리지 않고 완전히 새로운 웹 사이트를 추가하는 것과 상당한 재설계를 거쳐 웹 사이트의 기록을 갱신하는 것입니다.

일부 검색 엔진 제출 소프트웨어는 여러 검색 엔진에 웹사이트를 제출할 뿐만 아니라 자신의 페이지에서 웹사이트에 링크를 추가합니다.외부 링크는 웹 사이트의 순위를 결정하는 가장 중요한 요소 중 하나이기 때문에 웹 사이트의 순위를 올리는 데 도움이 될 수 있습니다.그러나 구글의 John Muller는 이것이 "당신의 사이트에 엄청난 수의 부자연스러운 링크를 초래할 수 있다"고 언급하여 사이트 [62]랭킹에 부정적인 영향을 미칩니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Search Engine History.com". www.searchenginehistory.com. Retrieved 2020-07-02.
  2. ^ "Penn State WebAccess Secure Login". webaccess.psu.edu. Retrieved 2020-07-02.
  3. ^ Marchiori, Massimo (1997). "The Quest for Correct Information on the Web: Hyper Search Engines". Proceedings of the Sixth International World Wide Web Conference (WWW6). Retrieved 2021-01-10.
  4. ^ a b Brin, Sergey; Page, Larry (1998). "The Anatomy of a Large-Scale Hypertextual Web Search Engine" (PDF). Proceedings of the Seventh International World Wide Web Conference (WWW7). Retrieved 2021-01-10.
  5. ^ "RFC 812 - NICNAME/WHOIS". ietf.org.
  6. ^ "Knowbot programming: System support for mobile agents". cnri.reston.va.us.
  7. ^ Deutsch, Peter (September 11, 1990). "[next] An Internet archive server server (was about Lisp)". groups.google.com. Retrieved 2017-12-29.
  8. ^ "World-Wide Web Servers". W3.org. Retrieved 2012-05-14.
  9. ^ "What's New! February 1994". Home.mcom.com. Retrieved 2012-05-14.
  10. ^ 「인터넷 역사 - 검색 엔진」(검색 엔진 워치로부터), 네덜란드, Universiteit Leiden, 2001년 9월, Web: LeidenU-Archie.
  11. ^ a b pcmag. "Archie". pcmag.com. Retrieved 2020-09-20.
  12. ^ Alexandra Samuel. "Meet Alan Emtage, the Black Technologist Who Invented ARCHIE, the First Internet Search Engine". ITHAKA. Retrieved 2020-09-20.
  13. ^ loop news barbados. "Alan Emtage- a Barbadian you should know". loopnewsbarbados.com. Retrieved 2020-09-21.
  14. ^ Dino Grandoni, Alan Emtage. "Alan Emtage: The Man Who Invented The World's First Search Engine (But Didn't Patent It)". huffingtonpost.co.uk. Retrieved 2020-09-21.
  15. ^ Oscar Nierstrasz (2 September 1993). "Searchable Catalog of WWW Resources (experimental)".
  16. ^ "Archive of NCSA what's new in December 1993 page". 2001-06-20. Archived from the original on 2001-06-20. Retrieved 2012-05-14.
  17. ^ "What is first mover?". SearchCIO. TechTarget. September 2005. Retrieved 5 September 2019.
  18. ^ Oppitz, Marcus; Tomsu, Peter (2017). Inventing the Cloud Century: How Cloudiness Keeps Changing Our Life, Economy and Technology. Springer. p. 238. ISBN 9783319611617.
  19. ^ "Yahoo! Search". Yahoo!. 28 November 1996. Archived from the original on 28 November 1996. Retrieved 5 September 2019.
  20. ^ Greenberg, Andy, "The Man Who's Beating Google", Forbes지, 2009년 10월 5일
  21. ^ Yanhong Li, "질적 검색 엔진을 향하여", IEEE 인터넷 컴퓨팅, vol.2, No.4, 페이지 24-29, 1998년 7월/8월, doi:10.1109/4236.707687
  22. ^ a b "RankDex에 대하여", rankdex.com
  23. ^ USPTO, "하이퍼텍스트 문서 검색 시스템방법", 미국 특허 번호: 5920859, Inventor:Yanhong Li, 출원일:1997년 2월 5일 발행일: 1999년 7월 6일
  24. ^ "Baidu Vs Google: The Twins Of Search Compared". FourWeekMBA. 18 September 2018. Retrieved 16 June 2019.
  25. ^ Altucher, James (March 18, 2011). "10 Unusual Things About Google". Forbes. Retrieved 16 June 2019.
  26. ^ a b "Method for node ranking in a linked database". Google Patents. Archived from the original on 15 October 2015. Retrieved 19 October 2015.
  27. ^ "Yahoo! And Netscape Ink International Distribution Deal" (PDF). Archived from the original (PDF) on 2013-11-16. Retrieved 2009-08-12.
  28. ^ "Browser Deals Push Netscape Stock Up 7.8%". Los Angeles Times. 1 April 1996.
  29. ^ Pursel, Bart. Search Engines. Penn State Pressbooks. Retrieved February 20, 2018.
  30. ^ Gandal, Neil (2001). "The dynamics of competition in the internet search engine market". International Journal of Industrial Organization. 19 (7): 1103–1117. doi:10.1016/S0167-7187(01)00065-0.
  31. ^ "Our History in depth". W3.org. Retrieved 2012-10-31.
  32. ^ a b c d e f Jawadekar, Waman S (2011), "8. Knowledge Management: Tools and Technology", Knowledge Management: Text & Cases, New Delhi: Tata McGraw-Hill Education Private Ltd, p. 278, ISBN 978-0-07-07-0086-4, retrieved November 23, 2012
  33. ^ 다스굽타, 아니르반, 고쉬, 아르피타, 쿠마르, 라비, 올스턴, 크리스토퍼, 판디, 샌디, 톰킨스, 앤드류.웹의 검출 가능성.https://www.arpitaghosh.com/papers/discoverability.pdf
  34. ^ B. J. 얀센, A. 스핑크, T. 2000. 사라체비치.실제 생활, 실제 사용자 및 실제 요구: 웹상의 사용자 쿼리에 대한 연구 및 분석. 정보처리 관리. 36(2), 207-227.
  35. ^ Chitu, Alex (August 30, 2007). "Easy Way to Find Recent Web Pages". Google Operating System. Retrieved 22 February 2015.
  36. ^ "how search engine works?". GFO = 26 June 2018.
  37. ^ "What Is Local SEO & Why Local Search Is Important". Search Engine Journal. Retrieved 2020-04-26.
  38. ^ "Search Engine Market Share Worldwide". StatCounter GlobalStats. Retrieved March 1, 2022.
  39. ^ "Live Internet - Site Statistics". Live Internet. Retrieved 2014-06-04.
  40. ^ Arthur, Charles (2014-06-03). "The Chinese technology companies poised to dominate the world". The Guardian. Retrieved 2014-06-04.
  41. ^ "How Naver Hurts Companies' Productivity". The Wall Street Journal. 2014-05-21. Retrieved 2014-06-04.
  42. ^ "Age of Internet Empires". Oxford Internet Institute. Retrieved 15 August 2019.
  43. ^ Waddell, Kaveh (2016-01-19). "Why Google Quit China—and Why It's Heading Back". The Atlantic. Retrieved 2020-04-26.
  44. ^ 체코에서 구글과 경쟁하는 Seznam.졸다.
  45. ^ Segev, El(2010).구글과 디지털 격차: 온라인 지식의 편견, 옥스퍼드:챈도스 출판사
  46. ^ a b Vaughan, Liwen; Mike Thelwall (2004). "Search engine coverage bias: evidence and possible causes". Information Processing & Management. 40 (4): 693–707. CiteSeerX 10.1.1.65.5130. doi:10.1016/S0306-4573(03)00063-3. S2CID 18977861.
  47. ^ Jansen, B. J.와 Rieh, S. (2010) 정보 검색정보 검색의 17가지 이론적 구조.미국정보과학회지. 61 (8), 1517년-1534년.
  48. ^ Berkman Center for Internet & Society (2002), "중국에서의 구글 대체 검색 시스템: 문서와 스크린샷", 하버드 로스쿨.
  49. ^ Introna, Lucas; Helen Nissenbaum (2000). "Shaping the Web: Why the Politics of Search Engines Matters". The Information Society. 16 (3): 169–185. CiteSeerX 10.1.1.24.8051. doi:10.1080/01972240050133634. S2CID 2111039.
  50. ^ Hillis, Ken; Petit, Michael; Jarrett, Kylie (2012-10-12). Google and the Culture of Search. Routledge. ISBN 9781136933066.
  51. ^ Reilly, P. (2008-01-01). Spink, Prof Dr Amanda; Zimmer, Michael (eds.). 'Googling' Terrorists: Are Northern Irish Terrorists Visible on Internet Search Engines?. Information Science and Knowledge Management. Vol. 14. Springer Berlin Heidelberg. pp. 151–175. Bibcode:2008wsis.book..151R. doi:10.1007/978-3-540-75829-7_10. ISBN 978-3-540-75828-0. S2CID 84831583.
  52. ^ 다부치 히로코, "기후변화 부정의 구글 검색 최고 상승 방법", 뉴욕타임스 2017년 12월 29일.2018년 11월 14일 취득.
  53. ^ Ballatore, A (2015). "Google chemtrails: A methodology to analyze topic representation in search engines". First Monday. 20 (7). doi:10.5210/fm.v20i7.5597.
  54. ^ Parramore, Lynn (10 October 2010). "The Filter Bubble". The Atlantic. Retrieved 2011-04-20. Since Dec. 4, 2009, Google has been personalized for everyone. So when I had two friends this spring Google "BP," one of them got a set of links that was about investment opportunities in BP. The other one got information about the oil spill....
  55. ^ Weisberg, Jacob (10 June 2011). "Bubble Trouble: Is Web personalization turning us into solipsistic twits?". Slate. Retrieved 2011-08-15.
  56. ^ Gross, Doug (May 19, 2011). "What the Internet is hiding from you". CNN. Retrieved 2011-08-15. I had friends Google BP when the oil spill was happening. These are two women who were quite similar in a lot of ways. One got a lot of results about the environmental consequences of what was happening and the spill. The other one just got investment information and nothing about the spill at all.
  57. ^ Zhang, Yuan Cao; Séaghdha, Diarmuid Ó; Quercia, Daniele; Jambor, Tamas (February 2012). "Auralist: Introducing Serendipity into Music Recommendation" (PDF). ACM WSDM. doi:10.1145/2124295.2124300. S2CID 2956587.
  58. ^ O'Hara, K. (2014-07-01). "In Worship of an Echo". IEEE Internet Computing. 18 (4): 79–83. doi:10.1109/MIC.2014.71. ISSN 1089-7801. S2CID 37860225.
  59. ^ "New Islam-approved search engine for Muslims". News.msn.com. Archived from the original on 2013-07-12. Retrieved 2013-07-11.
  60. ^ "Jewogle - FAQ".
  61. ^ "Halalgoogling: Muslims Get Their Own "sin free" Google; Should Christians Have Christian Google? - Christian Blog". Christian Blog. 2013-07-25.
  62. ^ Schwartz, Barry (2012-10-29). "Google: Search Engine Submission Services Can Be Harmful". Search Engine Roundtable. Retrieved 2016-04-04.

추가 정보

외부 링크