Класификация на търсещите интернет (4 типа)

Класификацията на интернет търсачките може да се раздели на йерархични търсачки, директории, хибридни търсачки и мета търсачки.

Търсачките са софтуерна система, предназначена за намиране на информация в World Wide Web. Те използват ключови думи за търсене на документи, които се отнасят до тези думи и след това поставят резултата по реда на съответствието с търсената тема.

Интернет търсачките се стремят да извличат информация, която вашият потребител изисква; Това е възможно поради наличието на голяма база данни в интернет.

Те са се превърнали в инструмент за ежедневна употреба за намиране на информация. Благодарение на това сега е много лесно да се намери информация с търсачки като Google, AOL, Yahoo и Bing.

В интернет има хиляди различни търсачки; всеки има различни способности и характеристики.

Първата разработена търсачка е наречена Archie и е била използвана за търсене на FTP файлове; първата текстова търсачка се нарича Вероника.

Потребителите имат достъп до браузъра чрез браузър на компютър, смартфон, таблет или друго електронно оборудване.

Класификация на видовете интернет търсачки

1- Йерархични търсещи (Spider)

Този тип търсачки използват „паяк“ за търсене в интернет в интернет. Този паяк влиза в отделните уеб страници, изважда ключовите думи и след това добавя страниците в базата данни на интернет търсачките.

Предимствата на този тип търсачки са, че те съдържат голям брой страници и са лесни за използване. Поради тази причина е много обичайно за потребителя да създаде познатост с него и да го използва многократно.

От друга страна, недостатъците включват, че тъй като те извличат толкова много данни, е много възможно да има твърде много информация.

Повечето от популярните търсачки в интернет са йерархични, като Google, Bing, Yahoo, Baidu и Yandex.

Всички йерархични интернет браузъри използват бот (паяк) за търсене и индексиране на ново съдържание в базата данни за търсене.

Има четири основни стъпки, които следва всяка йерархична търсачка, преди да покаже уеб страница в резултатите от търсенето:

хлъзгам

Търсачките се плъзгат по интернет, за да открият наличните уеб страници. Това се прави чрез софтуер, наречен паяк; Честотата между свлачищата може да отнеме дни.

индексирани

Това е процесът на идентифициране на думите и изразите, които най-добре описват уеб страницата. Идентифицираните думи се наричат ​​ключови думи, а страницата се присвоява на идентифицираните думи.

Изчислете уместността

Търсачката сравнява търсения низ в веригата на изискванията с индексираните страници от базата данни.

Тъй като е по-вероятно повече от една страница да съдържа низ за търсене, търсачката започва да изчислява уместността на всяка от страниците в своя индекс с низ за търсене.

Има няколко алгоритма за изчисляване на уместността. Всеки от тези алгоритми има различни относителни тегла за общи фактори, като плътност на ключови думи или връзки.

Ето защо всяка от търсачките дава различни страници с резултати за една и съща верига за търсене.

От време на време търсачките променят алгоритмите си.

Вземете резултата

По принцип това е просто показване на резултатите в браузъра; безкрайните страници с резултати от търсенето, които са сортирани от най-важните до най-малко важните.

2 - Директории

Директориите са търсачки, които зависят от човешката дейност за техните обяви: в директорията е представена уеб страница и нейното включване трябва да бъде одобрено от редакционния екип.

Този процес се извършва, както следва:

1-Собственикът на уебсайта представя кратко описание на вашия сайт в директорията заедно с категорията, в която трябва да бъде изброена.

2-Представеният сайт се преглежда ръчно. След това може да се добави към съответната категория или да бъде отхвърлена за списъка. По-вероятно е сайт с добро съдържание да бъде добавен в сравнение с уеб страница с лошо съдържание.

3-Ключовите думи, въведени в полето за търсене, ще бъдат сдвоени с описанието на уеб страницата. Това означава, че промените, направени в съдържанието на сайта, не се вземат предвид, тъй като само описанието на същите въпроси.

Предимството е, че всяка страница се преглежда за нейната значимост и съдържание, преди да бъде включена. Много пъти по-малко резултати означава, че можете да намерите необходимите неща по-бързо.

Въпреки това, форматът и оформлението не са приятелски настроени към повечето хора и може да имат проблеми с по-малко често срещани търсения. Друг недостатък е, че има забавяне в създаването на сайта и включването му в указателя

Някои известни директории включват Open Dictionary Project, Интернет публичната библиотека и DMOZ, наскоро затворени.

3 - Хибридни търсачки

Тези търсачки използват и двете йерархични търсачки и директории, за да изброяват уеб страници в резултатите от търсенето.

Повечето търсачки на паяци, като Google, основно използват йерархични търсачки като основен механизъм и ръчен мониторинг като вторичен механизъм.

Понякога на потребителя се дава възможност да търси в мрежата или в директорията. В други възможности, потребителят може да получи и двете резултати, излекувани от хората, и йерархични резултати в едно и също търсене; когато това е така, обикновено човешките резултати са изброени първо.

Google и Yahoo са две от основните търсачки, които попадат в тази категория, въпреки че всеки от тях е повече търсачките, които мигрират към тази система.

4 - Двигатели за търсачки

Тези интернет търсачки са тези, които търсят в други търсачки по едно и също време и след това комбинират резултатите в един списък.

Предимството е, че се получават повече резултати, но тяхната релевантност и качество могат значително да пострадат.

Примери за мета търсачки включват Dogpile, Metacrawler и Clusty.