1. Введение
Протокол HTTP, використовуваний в Інтернет, хороший лише відносно навігації, яка розглядається тільки як засіб проглядання сторінок, але не їх пошуку. Те ж саме відноситься і до протоколу FTP, який навіть примітивніший, ніж HTTP.
Із-за швидкого зростання інформації, доступної в Мережі, навігаційні методи перегляду швидко досягають межі їх функціональних можливостей, не говорячи вже про межу їх ефективності.
Не указуючи конкретних цифр, можна сказати, що потрібну інформацію вже не представляється можливим отримати відразу, оскільки в Мережі зараз знаходяться мільярди документів і всі вони у розпорядженні користувачів Інтернет, до того ж сьогодні їх кількість зростає згідно експоненціальної залежності.
Кількість змін, яким ця інформація піддана, величезно і, найголовніше, вони відбулися за дуже короткий період часу. Основна проблема полягає в тому, що єдиної повної функціональної системи оновлення і занесення подібного об'єму інформації, одночасно доступного всім користувачам Інтернет у всьому світі, ніколи не було.
Для того, щоб структурувати інформацію, накопичену в мережі Інтернет, і забезпечити її користувачів зручними засобами пошуку необхідних їм даних, були створені пошукові системи.
2. Пошукові системы
Поисковые системи зазвичай складаються з трьох компонент:
- агент (павук або кроулер), який переміщається по Мережі і збирає інформацію;
- база даних, яка містить всю інформацію, що збирається павуками;
- поисковый механізм, який люди використовують як інтерфейс для взаємодії з базою даних.
2.1 Як працюють механізми поиска
Pages: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Tags:
інформація,
документ,
мережа,
посилання,
робот,
сервер,
сторінка
Схожі записи
- Спроба купити слона через інтернет або як працюють пошукові системи (14.04.2009)
... Тобто програма викачує весь проглянутий Інтернет.
На перший погляд все просто. Але це далеко не так. По-перше, веб павуком може управляти власник сайту. Досить зберегти в кореневу директорію сайту спеціальний файл robots.txt. У цьому файлі на спеціальній мові описані команди для веб павуків (що індексувати, як індексувати, що пропустити і т.д.).
Це необхідно, ...
- Огляд пошукової системи Рамблер (22.03.2009)
... Через декілька місяців, до осені 1996 року, був готовий остаточний варіант пошукача.
26 вересня був зареєстрований домен rambler.ru, а 8 жовтня "Стек" активізував систему.
Програміст Дмитро придумав проекту назву. Був відкрив англо-російський словник і погляд впав на Rambler. Дмитру сподобалося значення слова "блукач, мандрівник, бродяга": роботи пошукової машини дійсно ходять по ...
- Огляд пошукової системи Яндекс (06.04.2009)
... Відтепер морфологічний розбір перестав бути прив'язаний до словника - якщо якого-небудь слова в словнику немає, то знаходяться найбільш схожі на нього словарні слова і по ним будується модель словозміни. В цей час Інтернет в Росії тільки починався...
Літом 1996 року керівництво CompTek і розробники пошукової системи пришли до висновку, що розвиток самої ...
- Технологія пошуку MSN com (05.04.2009)
- Найбільші пошукові системи і каталоги (27.02.2009)
... Багаторівневий рубрикатор. Окремо згруповані новини дня від всіх найбільших агенств і американських видань. Yahoo є найбільш старим тематичним пошуковим каталогом.
Не будучи наймогутнішою і всесторонньою пошуковою машиною, він простий в роботі і добре підходить для щоденного пошуку. У нім використовується простій англійська мова і добре виконується неспецифічний пошук. У каталозі описано близько 500 тисяч сайтів. ...
This entry was posted
on Saturday, March 7th, 2009 at 09:15 and is filed under Загальне.
You can follow any responses to this entry through the feed.
Both comments and pings are currently closed.