Министерство образования Российской Федерации
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«САНКТ - ПЕТЕРБУРГСКИЙ ГОСУДАСТВЕННЫЙ УНИВЕРСИТЕТ ЭКОНОМИКИ И ФИНАНСОВ»
КАФЕДРА информатики
Реферат по дисциплине: Информатика
на тему:
Средства поиска информации в Internet
Выполнила: Годованюк Татьяна Сергеевна,
студентка 210 группы ОЭФ
Приняла: Осипова Елена Александровна
Санкт-Петербург
2010 г.
1. ТЕХНОЛОГИЯ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТ. 4
1.2. Что такое поисковые индексы и каталоги. 5
2. ПОПУЛЯРНЫЕ ПОИСКОВЫЕ СЛУЖБЫ.. 7
2.2. Роботы индексов или поисковые машины. 7
2.4. Системы поиска в конференциях Usenet. 9
3. ПРИЕМЫ ЭФФЕКТИВНОГО ПОИСКА. 11
3.1. Практические аспекты использования поисковых сервисов Интернет. 12
3.2. Составление ссылки из имени организации. 13
3.3. Нахождение информации с применением серверов глобального поиска. 13
3.4. Нахождение информационных ресурсов в каталогах. 14
3.5. Сопоставление поисковых серверов и каталогов. 14
Сегодня каждый день множество людей неожиданно открывает для себя существование глобальных компьютерных сетей, объединяющих компьютеры во всем мире в едином информационном пространстве, имя которому - Интернет. Интернет многогранен и нельзя четко определить, что это такое. С технической точки зрения, Интернет - объединение транснациональных компьютерных сетей, работающих по самым разнообразным протоколам, связывающих всевозможные типы компьютеров, физически передающих данные по телефонным проводам и оптоволокну, через спутники и радиомодемы. Сегодня практически любой человек, обладающий доступом к компьютеру с простейшим модемом, может использовать в своей деятельности огромные информационные ресурсы, предоставляемые Интернет.
Итак, Интернет - сеть сетей, всемирная компьютерная сеть. Интернет можно рассматривать с многих позиций, вот две крайние из них. Наиболее узкое рассмотрение - объединение сетей, связанных между собой так, что в любой момент каждый компьютер в Интернет "видит" каждый другой (то есть может передать ему пакет данных и получить ответ за доли секунды). Наиболее широкое - киберпространство, рождающее киберкультуру со своим образом мысли, своим языком, своей этикой.
Интернет замечателен тем, что сеть и ее сервисы стали широко распространены в жизни общества, что они оказались достаточно хороши, чтобы река информации потекла руслом Интернет. Интернет не решил проблему хранения и упорядочения информации, но решил проблему ее передачи - дал возможность получить любую информацию где угодно, когда угодно.
Эта замечательная способность передачи информации привела к грандиозным темпам роста Интернет. Вследствие децентрализованности, нельзя точно сказать, каковы его размеры сегодня, но по оценкам "Network Wizards", количество компьютеров, полноценно подключенных в Интернет, последние два года ежегодно удваивается, составляя 6,6 миллионов компьютеров в июле 1995 года. По другим оценкам, количество компьютеров, имеющих доступ к каким-либо сервисам Интернет, весной 1995 года составляло до 30 миллионов. Это значит, что если скорость роста Интернет останется на том же уровне, то в течение ближайших лет Интернет и его сервисы станут столь же общеупотребительными, как телефон и телевидение сегодня. Очень многие компании понимают это, и, стремясь первыми прийти на этот рынок (а Интернет представляет собой, помимо всего прочего, еще и огромный рынок миллионов потенциальных клиентов), вкладывают деньги в развитие сети и сервисов, ей предоставляемых. Если в 1994 году в компании, работающие с Интернет, было вложено 42 миллиона долларов США, то уже за первый квартал 1995 года эта цифра составляла 47 миллионов (New York Times, 26 June 1995, p. D5). А деньги, как известно, делают деньги, и это является еще одним фактором, ускоряющим развитие сети. Коммерциализация Интернет - это, возможно, самый важный аспект его развития сегодня. Долгое время, до весны 1995 года, основные каналы связи и административные структуры Интернет финансировались Национальным научным фондом США, но теперь финансирование прекращено и развитие сети происходит на коммерческой основе.
Чтобы жить в городе, нужно уметь пользоваться транспортом. Для каждой поездки выбирают свой вид транспорта. За город ездят на электричках, в аэропорт можно поехать на маршрутном такси, до метро можно доехать на троллейбусе. Интернет в этом плане очень похож на город. Чтобы успешно работать с ним, нужно знать правила поведения в сети и уметь ориентироваться в множестве доступных Вам информационных сервисов. Увы, ввиду децентрализованности и молодости Интернет, не существует единой его карты или путеводителя по всем его сервисам. Эффективность работы в сети определяется знанием существующих сервисов, умением обращаться с конкретными сервисами и способностью выбрать правильный способ решения конкретной задачи. Этим определяется не только то, как скоро можно найти нужную информацию, но и то, можно ли ее найти вообще.
Сегодня Интернет объединяет множество разных сетей, миллионы компьютеров, около 300 миллионов пользователей (данные от Robert Orenstein) всех континентов и, по разным оценкам, число таких пользователей увеличивается на 15-80% ежегодно. Можно выделить два основных направления в использовании Интернет в бизнесе. Это оперативный доступ к поистине необозримым кладезям информации по любой тематике (на сотнях тысяч информационных серверов), поиск и интерактивное общение с партнерами, практически в любой специализации и географическом расположении. Как сориентироваться в столь масштабном информационном пространстве? Для этого существуют специализированные поисковые сервера. Их можно разделить на тематические каталоги, роботы индексов (поисковые машины), системы мета-поиска. Также, для поиска необходимой информации в Интернет весьма полезны системы поиска в конференциях Usenet и службы поиска людей.
Стандартная технология поиска информации, реализованная, например, в протоколе Gopher, основывается на "деревьях". Примером реализации этой технологии могут служить также индексные файлы систем управления базами данных - "бинарные деревья". В тех случаях, когда поиск осуществляется автоматически на основе строгого алгоритма выбора дальнейшего пути поиска, технология, основанная на "деревьях" обеспечивает наилучшие результаты. Но в тех случаях, когда выбор осуществляет человек, не совсем ясно представляющий что он ищет, такой способ поиска часто будет приводить в тупики т.е. к информации не полной или вообще в данный момент не нужной. В таких случаях поиск приходится начинать сначала.
Основная идея, реализованная в технологии WWW(World Wide Web), состоит в том, чтобы каждый объект поиска имел ссылки на ассоциативно связанные с ним объекты. Причем в сети Internet такие ссылки может определять любой пользователь сети. В этом случае поиск не может закончиться тупиком и нужная информация может быть найдена при движении по разным путям. Такая система поиска больше напоминает паутину, чем дерево и именно эта ассоциация лежит в основе названия технологии WWW - "всемирная паутина".
Технология WWW была разработана в Европейском центре ядерных исследований (CERN) и основывается на архитектуре клиент/сервер. Программа броузер выполняет роль клиента, с ее помощью можно соединиться с программой-сервером (Web- страницей), находящейся в любом месте сети Internet. При нахождении необходимой информации, она передается программе-клиенту. При отсутствии нужной информации программе-клиенту передаются ссылки на другие серверы и так до тех пор, пока искомые сведения не будут найдены.
Web содержит миллионы документов, однако прямой доступ возможен лишь к тем немногим источникам, на которые есть ссылки на открытой в данный момент странице. При этом подавляющее число документов Web остается вне поля зрения. Чтобы исправить подобную ситуацию, предусмотрительные программисты разработали целый ряд служб, в которые заложен тот или иной метод поиска документов, не имеющий прямых ссылок.
Общим подходом для всех служб является поиск по заданным пользователем ключевым словам. Наличие заданных ключевых слов проверяется в теле документа, его заголовке или ссылках. В ходе поиска формируется Web-страница результатов, содержащая адреса URL, названия и краткие описания найденных источников. Общая последовательность работы со всеми службами одинакова.
1. Откройте начальную страницу службы.
2. Введите ключевые слова для поиска и нажмите . Программа возвращает Web-страницу с первой группой найденных источников, удовлетворяющих условиям поиска.
3. Обнаружив в списке нужный источник, щелкните на ссылке. Броузер откроет соответствующую Web-страницу.
По способу поиска и организации результатов все программы поиска можно разбить на две группы. Системы индексирования (search index) проводят поиск по заданным пользователем ключевым словам. Составители каталогов (search directory) организуют Web-страницы в систему иерархически связанных разделов. Способов поиска в такой системе много, включая перемещение по ссылкам от разделов высшего к разделам низших уровней. И те, и другие выводят результаты, используя базу данных, которую составляют, периодически совершая рейды по сети.