Звичайно, цей спосіб набагато міні ефективний.
У варіанті з інвертованим індексом пошукові системи стикаються з проблемою величини файлів. Як правило, вони значно великі. Цю проблему зазвичай вирішують двома методами. Перший полягає в тому, що з файлів віддаляється все зайве, а залишається лише те, що дійсно потрібне для пошуку.
Другий метод полягає в тому, що для кожної позиції запам’ятовується не абсолютна адреса, а відносний тобто різниця адрес між поточною і попередньою позиціями.
Таким чином, два головні процеси, виконуваних пошуковою системою - це індексування сайтів, сторінок і пошук. Загалом, то процес індексування для пошукачів проблем не викликає. Проблемою є обробка мільйона запитів в добу. Це пов′язано з великими об’ємами інформації, яка піддається обробці великих комп’ютерних комплексів.
Головний чинник, що визначає кількість серверів, що беруть участь в пошуку, - пошукове навантаження. Це пояснює деякі дивності що виникають при пошуку інформації.
Індексування
Індексування сторінок …
Огляд алгоритмів принципи роботи пошукових пошукових сиситем →




