Реферат

«Поиск информации в Интернет. Web-индексы. Web-каталоги.»

  • 16 страниц
Содержание

Введение 3

1 Теория поиска информации 4

2 Обзор возможностей поисковых систем и каталогов 7

2.1 YAHOO 8

2.2 GOOGLE 9

2.3 ALTAVISTA 9

2.4 LYCOS 10

2.5 YANDEX RU 10

2.6 RAMBLER RU 11

2.7 APORT RU 11

3 Реконструкция документов и перевод на иностранный язык 13

Заключение 15

Библиографический список 16

Введение

Рано или поздно, каждый пользователь Всемирной паутины сталкивается с проблемой поиска информации. Будь то реферат, курсовая работа либо документация к новой стиральной машине, поиск этой информации может занять у вас от пяти минут до нескольких часов – все зависит от умения искать и находить нужные данные в Интернете. В этом случае нам на помощь приходят всевозможные поисковые машины, каталоги и базы знаний. Рассмотрим их по отдельности.

Интернет – абсолютно децентрализованная система. И если сначала анархия и свобода казались замечательным достижением, то сейчас хаотичность расположения информации зачастую порождает значительные трудности. Тут-то на помощь и приходят поисковые машины.

Справедливости ради надо заметить, что поиск во Всемирной сети был возможен и до появления на свет сегодняшних гигантов вроде ALTAVISTA или YAHOO!. Даже в те далекие годы, когда не существовало самой WWW, одним из основных сервисов Интернет был Gopher. Эта система кажется сейчас чрезвычайно неудобной с практической точки зрения (впрочем, на наш взгляд, ни одна из первых Интернет-служб не могла похвастаться ни простотой принципа работы, ни хотя бы интерфейсом).

Фрагмент работы

1 Теория поиска информации

Большинство современных молодых людей имеют мобильные телефоны, подавляющее большинство из них не знает, как работает сеть мобильной связи.

Поисковыми системами можно пользоваться так же, как мобильными телефонами – освоив нехитрые элементы управления ими, научившись нажимать нужные кнопочки. Для того чтобы уметь пользоваться поисковой машиной (или поисковой системой), не обязательно понимать, как она работает, и тем более знать ее внутреннее устройство.

Однако ситуация здесь примерно такая же, как с автомобилем: на нем можно ездить, умея лишь заправлять его, управлять им и зная правила дорожного движения. Но тот, кто хочет чувствовать себя за рулем уверенно и при необходимости самостоятельно устранять мелкие неисправности, должен знать устройство автомобиля, названия и принципы функционирования хотя бы важнейших узлов. Поэтому далее мы будем говорить об устройстве поисковых машин и основных терминах, которые приступающий к поиску информации в интернет пользователь должен знать так же хорошо, как автомобилист термины «карбюратор» и «зажигание».

Как работают поисковые машины Поисковая машина (для краткости ее часто называют просто поисковик) представляет собой комплект программ, в основе которого лежат следующие пять:

1 Spider («паук») – программа, которая загружает в поисковую машину Web-страницы. Работает аналогично браузеру, установленному на компьютере пользователя, но ничего не отображает ни на каком экране. Если вы хотите иметь представление о том, что именно загружает в поисковую систему «паук», откройте какую-нибудь Web-страницу и выберите в меню Вид браузера пункт Просмотр HTML (или «исходного») кода.

2 Crawler («червяк», или «путешествующий паук») – программа, способная найти на Web-странице все ссылки на другие страницы. Ее задача определить, куда дальше должен ползти «паук», руководствуясь ссылками или заранее заданным списком адресов.

3 Indexer (индексатор) – программа, которая «разбирает» страницу на составные части и анализирует их. Вычленяются и анализируютсязаголовки Web-страниц, заголовки документов, ссылки, текст документов, отдельно – текст, выделенный полужирным шрифтом, курсивом и т. д.

4 Database (база данных) – хранилище всех данных, которые поисковая система загружает и анализирует. Требует огромных ресурсов как для хранения, так и для последующей обработки.

5 Search Engine Results Engine (система выдачи результатов поиска) решает, какие страницы удовлетворяют запросу пользователя и в какой степени. Именно с этой частью поисковой системы «общается» пользователь.

Первые две программы, работающие «в связке», часто называют поисковый робот (а иногда – НТТР-робот).

Как видите, поисковая машина, получив запрос на поиск, не отправляется в длительное путешествие по «Всемирной паутине, как полагают некоторые пользователи, а анализирует лишь ту информацию, которую собрала ранее. С одной стороны, это позволяет резко повысить скорость обработки запроса на поиск. С другой, ограничивает область поиска внутренними ресурсами поисковой системы, которые, во-первых, ограниченны (ни одна поисковая машина не в состоянии загрузить в свою базу данных информацию со всех узлов Сети), во-вторых, уже в какой-то степени устарели. Ситуация в интернет изменяется очень быстро. Если «паук» с целью обновления информации об уже проиндексированных однажды Web-страницах «заползает» на них раз в два месяца, пользователь рискует получить в результатах запроса ссылку на уже несуществующую Web-страницу.

Процесс загрузки из Сети информации и предварительного анализа ее поисковой машиной называется индексация, а сама база данных поисковой машины, в которой хранится собранная информация, – индекс.

Глубина индексации может быть разной. Полные тексты документов, размещенных на странице, в базу данных копируют не все поисковые роботы – некоторые ограничиваются лишь заголовками. Когда пользователь формирует запрос на поиск, поисковая машина просматривает свою базу данных и выдает перечень Web-страниц, содержащих слова, введенные пользователем в поле ввода (их часто называют ключевые слова). Таких страниц может быть очень много. Задача поисковой машины – отобрать те из них, которые в наибольшей степени отвечают запросу пользователя (т.е. релевантны ему) и указать ссылки на них в числе первых.

Заключение

По моему мнению, проблема поиска информации стоит достаточно остро, несмотря на множество поисковых машин и каталогов наводнивших Интернет. Именно поиск информации является основной задачей сервиса.

Если заглянуть в будущее российских поисковых систем, становится очевидно, что новичкам выйти на этот рынок будет довольно сложно, значительно сложнее, чем на рынок счетчиков. Иллюстрацией этому уже сейчас служат такие проекты, как Lupa.r* и Punto, которые, хотя и стартовали, со своими обязанностями справляются пока крайне слабо. Лидерство описанных в статье поисковых машин определяется сложными технологиями, полнотой базы, большим парком компьютеров и сформировавшимися привычками пользователей. В то же время они страдают одним большим недостатком – «замусоренностью» своих баз данных, и для решения этой проблемы, возможно, в один прекрасный день придется проиндексировать русскую часть Интернета практически заново.

Список литературы

1 Всемирная паутина Интернет.– h**t://sesia5.r*/blok/8/83_10.htm

2 Левчук Ю.П., Охинченко Е.П., Сотников А.Д., Фоменко Т.А. Информатика.– h**t://dvo.sut.r*/libr/ite/i280levc/index.htm

3 Поиск в Сети: обзор возможностей поисковых систем и каталогов.– h**t://w*w.geocities.com/patan4ik/comp_artical_5.htm

4 Поиск информации в Интернет.– h**t://dev.ingate.r*/develop-targets/information-popular/

5 Поиск информации в Интернет.– h**t://w*w.extranom.r*/

6 Поиск информации в Интернете.– h**t://mirsovetov.r*/a/hi-tech/network/search-information.html

7 Поиск информации в интернете.– h**t://w*w.homebusiness.r*/ideas/506.htm

Нужна похожая работа?
Закажите авторскую работу по вашему заданию.
  • Цены ниже рыночных
  • Удобный личный кабинет
  • Необходимый уровень антиплагиата
  • Прямое общение с исполнителем вашей работы
  • Бесплатные доработки и консультации
  • Минимальные сроки выполнения

Мы уже помогли 24535 студентам

Средний балл наших работ

  • 4.89 из 5
Узнайте стоимость
написания вашей работы
Популярные услуги
Дипломная на заказ

Дипломная работа

от 8000 руб.

срок: от 6 дней

Курсовая на заказ

Курсовая работа

от 1500 руб.

срок: от 3 дней

Отчет по практике на заказ

Отчет по практике

от 1500 руб.

срок: от 2 дней

Контрольная работа на заказ

Контрольная работа

от 100 руб.

срок: от 1 дня

Реферат на заказ

Реферат

от 700 руб.

срок: от 1 дня

682 автора

помогают студентам

23 задания

за последние сутки

10 минут

среднее время отклика