Поиск информации в Интернет (стр. 1 из 6)

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

1 ОБЩИЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ ПОИСКА ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

1.1 Поиск информации в Интернет: стратегия и методика

1.2 Поиск с помощью каталогов

1.2.1 Принцип работы, преимущества и недостатки каталогов

1.2.2 Электронные каталоги глобального масштаба

1.2.3 Российские каталоги ресурсов Интернет

1.3 Поиск с помощью поисковых машин

1.3.1 Принцип работы, преимущества и недостатки поисковых машин

1.3.2 Глобальные поисковые машины

1.3.3 Российские поисковые машины

2 ПОИСК ИНФОРМАЦИИ. АНАЛИТИЧЕСКИЙ ОБЗОР НАЙДЕННЫХ ДОКУМЕНТОВЗАКЛЮЧЕНИЕСПИСОК ИСПОЛЬЗОВАННЫХ ИНТЕРЕНТ-РЕСУРСОВ

ВВЕДЕНИЕ

Интернет— глобальная компьютерная сеть, охватывающая весь мир. Она составлена из разнообразных компьютерных сетей, объединенных стандартными соглашениями о способах обмена информацией и единой системой адресации. Интернет образует ядро, обеспечивающее связь различных информационных сетей, принадлежащих различным учреждениям во всем мире.

Для того, чтобы различные компьютеры в Интернете могли сообщаться друг с другом, используются протоколы, т.е. правила или условия коммуникации. Язык Интернета называется TCP/IP, что означает протокол Управления передачей/Интернет-протокол. Любой компьютер для того, чтобы общаться в Интернете, должен уметь "говорить" на языке TCP/IP. Этот стандарт является "открытым", что означает, что он не является фирменным продуктом какой-либо одной компании. Основная операционная система называется UNIX, но стандарт Интернета приспособлен для использования на всех наиболее распространенных системах, таких как UNIX, PC и Macintosh.

Интернет состоит из взаимосвязанных сетей, эксплуатируемых университетами, государственными учреждениями, военными, корпорациями и другими организациями. Эти сети связаны друг с другом различными видами оборудования такими, как маршрутизаторы, мосты и коммутаторы. Маршрутизаторы решают, в каком направлении отослать сетевые данные, предварительно посылая пакеты по нужному адресу и затем "маршрутизируя" данные в направлении соответствующего компьютера, где эти пакеты собираются вновь. Мосты предназначены для соединения двух каких-либо сегментов кабельной проводки внутри сети; коммутаторы – это приспособления для замыкания и размыкания цепей.

Одной из наиболее популярных служб, возникших на базе сети Интернет, стала «Вceмирнaя пaутинa» WWW (Wоrld Widе Wеb). Tипичнaя «Wеb-страница» представляет собой полный экран текстовой и графической информации, связанной с некоторым конкретным предметом или вопросом. Ключевые слова и (или) изображения на такой странице выделены. Если пользователь выбирает один из таких выделенных элементов, то на экране воспроизводится новая страница, посвященная выбранному слову или изображению. Пользователь может, следуя таким ссылкам, продолжить вывод на экран новых страниц. Программа, которая осуществляет поиск, выборку и воспроизведение Web-страниц, называется браузером, а компьютеры, хранящие информацию, – Web-серверами.

Концепцию «паутины» разработал в 1990 Т.Бернерс-Ли в Европейском центре ядерных исследований ЦЕРН в Женеве (Швейцария). Он хотел создать систему, которая помогала бы ученым сотрудничать, применяя упрощенные способы создания и использования мультимедиа-информации. Систему связей (ссылок) между документами называют гипертекстом. Для создания системы гипермедиа «паутина» сочетает гипертекст с мультимедиа (текст, изображения, звук и видео). Совместное пользование информацией, содержащейся в «паутине», стало возможным благодаря применению для создания Web-стpaниц oбщeгo языкa, пoлучившeгo нaзвaниe гипepтeкcтoвoгo языкaoписaния дoкумeнтoв НТML, общего протокола для обмена информацией, названного гипертекстовым транспортным протоколом HTTP, и стандартного формата адресов (унифицированного указателя ресурсов) URL. Важным достоинством URL является то, что он может работать с любым протоколом, а не только с HTTP; отсюда следует, что «Всемирная паутина» спроектирована так, чтобы ее можно было использовать со всеми существующими и будущими сетевыми службами.

«Паутина» приобрела в ЦЕРНе исключительно высокую популярность и вскоре появилась в других научно-исследовательских центрах, включая национальный центр США по применениям суперкомпьютерных вычислений NCSA. В 1993 группа сотрудников NCSA, возглавляемая М.Эндрессеном, начала разработку улучшенного Web-браузера, получившего название «Мозаик». «Мозаик» мог работать на большинстве типов рабочих станций и персональных компьютеров. Бесплатный доступ к этой программе просмотра сделал «паутину» исключительно популярной, и число обращений к сети начало расти с феноменальной скоростью. За несколько месяцев количество используемых экземпляров «Мозаик» превысило миллион, а трафик WWW вырос в 10 тыс. раз. Эндрессен и его группа ушли из NCSA, чтобы работать над коммерческой версией «Мозаик». Затем появились и другие коммерческие браузеры, способствовавшие быстрому росту и развитию «Всемирной паутины».

Спектр пользователей WWW довольно широк. Ее мультимедиа-возможности удобны для астрономов, заинтересованных в совместных наблюдениях за кометами, для математиков привлекательны воспроизводимые на экране геометрические фигуры, а для биологов – доступ к обширным базам данных по белкам. Благодаря тем же средствам стали возможными «виртуальные туры», посвященные осмотру коллекций произведений искусств в разных музеях. Такие государственные организации, как НАСА, Смитсоновский институт и Библиотека Конгресса используют WWW для публикации текстовой информации и изображений. Корпорации размещают в узлах WWW рекламу, информацию о продаже аппаратных или программных продуктов и принимают заказы. Для индивидуальных пользователей, располагающих собственными компьютерными идентификаторами, наиболее увлекательным представляется создание своих «базовых Web-страниц», открывающих новые возможности для самовыражения и совместного пользования информацией.

Цели выполнения курсовой работы:

1. ознакомиться с всемирной компьютерной сетью Интернет и используемыми в ней технологиями;

2. освоить приемы эффективного поиска необходимой информации в сетевых ресурсах;

3. получить практический опыт поиска информации по заданной теме;

4. освоить основы языка HTML и методы создания Web- документов;

5. получить практический опыт создания Web- страниц на основе найденных в сети документов;

6. получить более глубокую теоретическую и практическую подготовку по специальности на основе самостоятельного изучения и обобщения научной, учебной литературы и нормативных документов, а также формирования умений и навыков по работе в сети.

Задачами курсовой работы являются:

- рассмотрение общих принципов построения и функционирования Всемирной компьютерной сети Интернет;

- рассмотрение общих принципов организации поиска информации в сети Интернет;

- поиск информации по заданной теме в сети Интернет;

- аналитический обзор найденных документов;

- создание Web- страницы на основе найденных в сети документов.

1ОБЩИЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ ПОИСКА ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

1.1 Поиск информации в Интернет: стратегия и методика

Поиск информации является одной из наиболее распространенных и одновременно наиболее сложных задач, с которыми приходится сталкиваться в Сети любому пользователю. Причина сложностей, возникающих при информационном поиске в Интернет, определяется двумя главными факторами. Во-первых, число источников в Сети чрезвычайно велико. Во-вторых, массив информации в Сети не только колоссален по объему, но еще и крайне динамичен. За те полминуты, что мы потратим на чтение первых строк этого раздела, в виртуальной вселенной появится порядка сотни новых или измененных документов, десятки будут перемещены на новые адреса, а единицы - навсегда прекратят свое существование.

Необходимость и важность проблемы информационного поиска привела к образованию в самом Интернет целой отрасли, задача которой заключается именно в оказании помощи пользователю в его навигации в киберпространстве. Составляют эту отрасль специальные поисковые службы или сервисы. Условно их можно разделить на кaтaлoги (dirесtоriеs) и пoиcкoвыe мaшины (sеаrсh еnginеs).

Эти разновидности внешне очень похожи, поскольку каждый каталог, как правило, обладает собственной поисковой машиной, а каждая поисковая машина - собственным каталогом. Однако принципы их работы базируются на абсолютно разных подходах и технологиях. Каждый из этих инструментов имеет определенные преимущества, а основная разница между ними заключается в участии/неучастии человека. Поисковые машины запускают в Web программных «пауков» (spiders), которые путешествуют со страницы на страницу и на каждой индексируют ее полный текст. Каталоги же формируются людьми-редакторами, которые прочитывают страницы, отсеивают неподходящие и классифицируют узлы по темам. При этом каждая разновидность поисковых сервисов применяется для решения определенного типа задач. Правильным выбором инструмента во многом определяется стратегия поисковой деятельности и, в конечном итоге, результат разысканий.

Приступая к информационному поиску в Интернет, следует всегда помнить несколько основных моментов. Прежде всего, никакие средства навигации - каталоги или поисковые машины - не охватывают всего текущего информационного массива Интернет. По некоторым оценкам, даже такие признанные лидеры сетевого поиска как Google, отражают не более трети совокупного содержания Сети. Причина этого - постоянный колоссальный прирост объемов информации в Интернет, который, несмотря на все усилия навигационных служб, содержит огромное число белых пятен.

Помимо быстрого роста и изменения местоположения документов, большинство поисковых систем имеют внутренние ограничения на отражение материалов одного сайта и на объем индексируемой части страницы. Программы-роботы зачастую не идут в глубь сервера дальше определенной директории, что также сокращает число отраженных материалов.